今天,中国已经成为数据量大、数据类型最为丰富的国家之一。国家数据局发布信息显示:我国数据产量已占全球数据总量的10.5%。更有研究机构预测,到2025年,中国数据总量或占全球近30%。作为新型生产要素,如何让数据在“大”的同时,实现数据精、数据准、管得住、看得见、用得好,释放数据要素价值潜能,成为助推新质生产力发展的必答题。GIS与大数据技术的融合,构建完整的大数据GIS存储、大数据GIS分析计算、大数据GIS可视化等技术体系,为挖掘大数据价值带来解题之策。
在2024中国地理信息产业大会“全空间智能GIS技术创新与数字化应用”分论坛中,中地数码副总裁陈波做了题为《全空间智能GIS平台筑基地理信息新质生产力》的演讲报告,带来MapGIS 10.7的创新升级。报告介绍了MapGIS 10.7持续推动地理大数据接入、存储、处理、分析和可视化的技术发展,升级地理大数据技术体系,打造云原生大数据存储引擎、革新大数据治理体系、全方位大数据分析计算、多引擎大数据可视化、“一站式”大数据运维监控等能力,持续提升和挖掘时空大数据价值,进一步实现地理世界深度洞察。
一、地理大数据技术体系升级
MapGIS 10.7基于Hadoop、Spark、Flink等分布式计算框架,将地理数据存储管理、地理数据计算与地理数据可视化等技术深度融合大数据框架,形成了全新的MapGIS地理大数据技术体系,实现地理大数据的高效存储、分析与可视化表达,全面提升MapGIS的地理大数据能力。
MapGIS 10.7地理大数据技术体系主要包含四个层次:
(1)地理大数据分布式存储
MapGIS针对来源异构、体量庞大、类型多样的地理大数据,提供基于分布式数据库存储引擎,实现地理大数据的统一接入、存储和管理。
(2)地理大数据分布式分析
MapGIS提供地理大数据的分布式分析能力。提供完善的数据治理体系,以保证数据的质量。在数据治理的基础上,MapGIS提供深度融合Spark/Hadoop/Flink等分布式计算框架,构建五大类分布式分析算子,通过分布式地理处理引擎提供地理大数据分布式服务能力,从而帮助用户从空间、时间、属性多个维度认知大数据,同时提供更加强劲的分析性能,挖掘更多有价值的信息。
(3)地理大数据可视化渲染
MapGIS集成Leaflet、MapBoxGL、Cesium、Unreal Engine、MapV、EchartGL和D3等多种地图框架和大数据可视化引擎,提供了地理大数据的多样式表达,支持炫酷、动态和直观的可视化展示效果。同时,MapGIS也提供地理大数据分级渲染技术,这是一种客户端渲染技术,基于大数据实时分级计算,采用渐进式传输机制,通过可视域分级调度策略和异步绘制,实现大规模海量数据的高性能客户端表达。
(4)地理大数据产品
MapGIS将大数据的技术成果分别沉淀在MapGIS DataStore(分布式存储引擎产品)、MapGIS数据治理产品、MapGIS IGServer-X(大数据GIS分析产品)、MapGIS Client for JavaScript(云GIS网络客户端开发平台)、MapGIS Cloud Manager(云运维管理平台)等产品中。为各类用户提供海量数据存储管理、大数据治理、地理大数据分析、地理大数据的可视化展示、大数据运维监控等大数据相关功能。
二、云原生大数据存储引擎
MapGIS DataStore产品是一款分布式数据存储引擎产品,为了进一步提升产品的部署易用性,进一步适应虚拟化部署场景,MapGIS 10.7将云原生GIS技术和大数据GIS技术深度融合,推出了MapGIS DataStore(大数据存储引擎产品)微服务版。MapGIS DataStore微服务版将原单体大数据业务应用拆分为多个可独立部署的微服务应用,可将这些微服务部署到容器中,通过k8s实现容器的自动化编排,从而实现大数据存储资源的动态调度、灵活部署和弹性伸缩,真正实现上线快速部署、下线快速销毁以及状态迅速恢复等功能,为用户提供简单、高效且稳固的大数据存储环境。
为进一步满足用户对数据资源多级管理及资源隔离的需求,MapGIS DataStore全新支持了多租户管理功能,提供数据源隔离和数据库隔离两种多租户管理模式。在数据源隔离模式下,租户间使用独立的存储环境,一个租户组构成一个数据中心,租户组按需创建自己特有的数据源及数据库,各个租户组之间完全隔离,此模式适用于多个数据管理中心场景;在数据库隔离模式下,多租户组共有一套存储环境(数据源),所有租户构成一个数据中心,租户组可基于该数据源创建自有数据库,数据库间完全隔离,此模式适用一个数据管理中心场景。
在存储集群接入方面,MapGIS DataStore产品新增支持HBase、MySQL、达梦、神通等数据库集群的注册与数据目录展示,支持接入更多的数据库集群。同时,为满足Windows部署需求,MapGIS DataStore新增支持for Winodws版本,产品完成了全平台适配。
三、革新大数据治理体系
数据治理不仅有助于提升数据质量、建立数据标准,还能实现数据资产的统一管理,从而支撑企业的数智化战略。良好的数据治理系统可以帮助企业解决数据孤岛、数据质量低下等问题,进而提高业务处理效率,为数据分析提供准确的数据支持。
MapGIS 10.7研制了全新的数据治理产品,该产品覆盖时空大数据全生命周期管理,旨在通过制定一系列的规范、流程和技术手段来管理空间数据和业务数据,确保其可靠性、安全性、完整性、准确性和及时性。产品融合数据标准、数据汇聚、数据开发、数据质量、数据安全、数据资产、服务中心等功能模块融为一体。打通数据壁垒,解决数据孤岛问题,助力数据标准落地,提升数据质量,实现数据资产融合。
四、全方位大数据分析计算
大数据分析计算方面,MapGIS IGServer-X大数据GIS分析服务器产品提供更多的大数据分析算子,新增了贝叶斯训练、贝叶斯预测、时序预测、管网漏损预测、网格剖分等算子,目前提供了覆盖到矢量大数据、影像大数据、实时大数据、文本大数据以及空间机器学习共五个维度300+的分布式算子,全方位满足多场景、多业务的复杂任务处理需求。
如在管网健康评价场景中,通过管网基础数据(如管龄、管材、管径……)和管网检漏维修的业务历史数据(破损位置、破损类型、破损原因……),采用AI贝叶斯分类算法构建管网失效分析模型,对管网当前的失效概率进行评估预测,为管网改造、管网巡检以及管网检漏等业务计划的制定提供数据辅助支撑和依据。
在管网漏损监测定位场景中,通过管网空间拓扑关系和管网监测点实时数据,采用机器学习相关算法构建管网漏点定位模型,对管网当前的漏点进行评估预测定位,为管网巡检以及管网检漏等业务计划的制定提供数据辅助支撑和依据。
五、多引擎大数据可视化
在大数据可视化方向,针对地理大数据空间性、时间性、多维性、海量性、复杂性等特点,MapGIS推出了云GIS客户端开发平台——MapGIS Client for JavaScript产品,该产品既提供传统的大数据GIS查询统计服务,支持属性查询、关键字查询、空间查询及多样化的专题统计表达,同时集成Leaflet、MapBoxGL、Cesium、Unreal Engine等开源地图引擎,以及MapV、EchartGL、D3等大数据可视化引擎,支持多样化的可视化表达,如热力图、散点图、聚类图、密度图、蜂窝图、渐进线、网格图、时空立方体等多种可视化表达方式,为用户提供可静可动的可视化展示效果。
大数据可视化表达效果
六、“一站式”大数据运维监控
在大数据运维监控方向,MapGIS Cloud Manager云运维管理平台产品再升级,该产品与虚拟化、容器化平台无缝融合,实现多种资源的一键部署、统一管理和运维监控,提供分布式存储、分布式分析等大数据应用。
基于k8s平台,MapGIS Cloud Manage可实现大数据GIS分析服务器站点(MapGIS IGServer-X)、分布式数据存储站点(MapGIS DataStore)、各种存储站点(MongoDB、MinIO、Citus、Postgres-XL、Nebula、HDFS、Elasticsearch等)、定制大数据Docker应用站点等各类大数据GIS相关站点快速部署、统一管理和运维监控,提供快速建站、重新部署、删除重建、规格调整、站点销毁(删除)、修改镜像、命令行操作、资源监控、详情查看、日志管理等操作。
MapGIS Cloud Manager提供多维度资源监控及指标采集,能够全方位监控所有资源,如基于MapGIS Cloud Manager创建的所有大数据GIS相关站点,通过注册方式接入的URL地址、任意主机、MongoDB、PostgreSQL数据库等注册资源,以及站点微服务实例等。
MapGIS Cloud Manager在提供CPU占用、内存占用、磁盘、网络等通用监控指标外,还可根据监控对象不同提供不同的指标,如提供节点状态、CPU、内存、磁盘、网络等大数据站点资源;提供数据库总数、集合信息、数据库对象、数据库索引、文件状态、磁盘IO、内存使用量、网络IO、最大连接数等数据库应用指标;提供URL的状态码、超时时间等URL监控指标;以及平均响应时间、平均请求速率、成功请求总数、失败请求总数等服务实例性能指标。
MapGIS Cloud Manager支持智能告警,提供节点状态、CPU、内存、磁盘、网卡等10多种告警规则。当触发这些规则后,将通过邮件发送告警通知,告警通知中记录数据库所有异常操作,帮助运维人员查找问题,解决告警。
数据被誉为新时代的“石油”,在政府治理、科学研究以及企业经营等各领域,大数据正“润物细无声”地发挥着重要的作用。向数据要素要新质生产力是国家的战略选择,更是社会经济发展的必然趋势。MapGIS 10.7不断创新大数据GIS技术,帮助用户分析挖掘大数据的价值,以释放数据要素乘数效应,真正将数据转化为强大的新质生产力。
文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com