引言:备受期待的监控易火星版进入发布倒计时。今天,为大家介绍新版本的其中一个亮点:IT基础设施分布式运维。
随着人工智能、5G、物联网、AI、云计算等各种新技术不断出现,互联网设备接入数量快速增加。根据IDC《2021年网络市场跟踪报告》显示,2021年全球网络市场规模相比去年增长10.1%,达到了542.4亿美元。中国网络市场规模为102.4亿美元(约合660亿元人民币),与去年相比增长12.1%,其中交换机、路由器和WLAN市场分别增长17.5%、-2.6%和47.2%。
网络规模的持续扩张使IT运维市场迎来不少发展机遇,各种IT运维解决方案纷纷出炉。然而,目前推出的多是面向中小网络的单机版运维解决方案,相对于万台以上量级的一体化运维,以及规模小、分点多、终端分布散的上万台设备的跨区域网络运维,这些方案并不一定适用。虽然国内已经发布了很多IT运维解决方案,却存在良莠不齐的情况。
海量设备运维面临的挑战
每个行业技术水平和产品能力的提升,都需要大量研发人员和充足经费的持续投入。只有投入足够的时间打磨产品,并参与项目落地实践等,才能确保经得住市场考验。ITOM领域的运维厂商,大多都在紧跟各行业运维需求变化升级产品、完善方案。但运维厂商不同研发能力和研发投入的不同,必然导致梯队的产生。
北京美信时代科技有限公司是ITOM领域亮眼的一道风景线。美信时代创立于2007年,多次获得业内战略投资,十五年来默守耕耘IT智能运维及数据可观测性领域,研发团队占公司人数的50%以上,在北京、南京和太原设有研发基地,并在上海、深圳、武汉、成都、郑州等十多个城市设有技术服务中心,服务过的客户包括国家某办室、中石化、上海电力、江苏交控等数千家大中型企事业单位。
作为ITOM专业厂商,美信时代推出的基于多TS架构的分布式运维解决方案,不同于业内通用的单机版运维模式,也不同于第三方运维服务商提供的个性化、定制化集成运维,架构非常灵活,能快速适应各种复杂拓扑结构的网络。它克服了通用运维方案的数据交互缓慢、边缘数据采集延迟、老旧设备无法适配等问题,为大规模海量设备的运维管理提供最佳的高性能解决方案。
国内以往的大规模分布式运维实践相对较少。最早在2013年,阿里在过万台的跨集群扩展的5K项目中面临过巨大的运维挑战,最终通过快速部署、自动化运维、监控报警、Log分析和精细化计量等,实现了大规模海量设备分布式运维的转型。
面对成千上万台、甚至数十万规模的运维对象,运维团队需要有更强大的整体把控能力,包括对机房、网络、流量、硬件、服务器、中间件、应用等进行实时运行状态监控,实现不同维度不同类型资源的数据分析等,做到对网络架构、网络节点、网络链路、网络设备、服务器及性能指标等宏观和微观体系的了如指掌。面对海量运维对象和监测指标,单靠人力远远无法做到,必然需要借助自动化、智能化的运维管理工具和平台。
大型行业用户一体化集中运维需求
目前,IT运维(ITOM)厂商大都只能基于单机版产品对中小型IT网络或机房进行运维,无法解决大型行业用户对分布式IT网络的监管和运维需求。而大规模海量设备监控和运维,正是监控易一体化运维系统的突出特点,美信时代可以给出完美解决方案。
监控易由诸多独立模块组成,包括设备管理、网络管理、业务管理、视频管理、CMDB、ITSM、运维管理、机房管理、移动运维、云运维、3D可视化等,支持各系统间的数据关联共享,从全局视角把控系统运行态势。
监控易覆盖IT基础设施、机房动环和智能物联网三大领域,可对各种网络设备、安全设备、服务器、应用软件、存储、虚拟化、云原生等进行分布式、一体化管理,实现百万台以上设备性能指标快速采集和实时监控。
适应各种网络的分布式运维架构
拥有大规模网络的用户单位,通常机房及办公点分布在全国各地。比如,有十几个分散各地的机房,或者几十个办公网络,或者几万台监控对象。这些行业用户网络复杂、规模庞大,存在运维难点和痛点,想要高效进行一体化监控和运维,最佳方案是通过分布式架构来实现。
与行业里普遍提供的面向中小型网络的单机版运维软件不同,监控易可以为国内TOP3000等大规模复杂网络环境企业提供跨区域、跨网络、跨安全域的IT基础设施分布式运维管理。监控易底层数据库、监测器、中间件、消息队列、WebServer、拓扑发现、报表管理、北向接口等核心功能组件均为自主研发,能够监测10万+数据量级的网络环境,满足各种分布式的部署需求。
分布式数据采集模式
监控易系统为BS架构,底层采用分布式架构设计,各地数据中心或机房可部署监控终端(TS),监控终端自带高性能数据库,设备监控指标的采集在监控终端完成。监控终端的状态数据和告警数据上传到集中管理控制台(CCU),该模式所消耗网络资源为最小,几百设备监控只占用十几K带宽。CCU和TS共同组成监控易独特的分布式协同计算架构,在保证带宽最小占用、高性能数据采集和一体化监控的情况下,支持对采集数据的综合数据分析和协同计算。
所有监控对象和指标通过CCU进行统一展示。CCU可在浏览器直接访问,有统一的登录入口,每个登录用户有自己的Portal展示界面。视图、图表展示和告警都是分布式采集数据,集中展现和管理。
分布式架构也可分散监控负载。控制监测云中的TS监测服务器根据数量和计算能力动态承担各自的监测任务。当数量和计算能力发生变化时,通过自动调节机制去重新调整各自的监测任务量。
监控易分布式数据采集架构
通常情况下,监控易一个Task Server分布式数据采集器可以实现对近万台服务器(或者网络设备)的监测。任务管理器所管理下的监测服务器组成监测云,完成对大规模设备的海量监控。该监测云具备动态监测负载均衡、多机容灾备份、监测服务器热插拔等众多功能。
监控易自研的BigRiver实时高效率时序数据库,主要实现对海量监测数据的实时存储和报表数据的生成,基于高效缓存机制、页式存储的数据结构,实现监控数据的高效处理和存储。BigRiver的优势是访问速度快,缓存命中率极高,高压缩算法使得数据库文件只有传统数据库的1/20。
分布式运维方案特性
监控易的分布式架构支持多场景部署模式。三层部署架构既保证了跨地区、跨网络的统一管理,也支持部署架构的横向、垂直拓展,有助于行业用户进行更为精细化的数据采集以及业务的扩张。工业4.0时代,传统的网络构型已经不能满足日益增加的细分应用场景,网络呈现多种部署模式将会是常态,具备多TS分布式架构的监控易一体化运维管理平台,可以更灵活地适应各种组网模式。
比如,某电力项目全网监控需要穿越保密程度很高、相互隔离的网闸,这个技术难度系数较大,一般的运维方案很难解决,但监控易可以提供应对的策略。该电力网络比较复杂,分为1区、2区、3区、4区,每个区段的加密级别都不一样;1区不能访问2区,有访问限制。在保证符合用户安全管理要求的前提下,跨网闸隔离网络不管是1、2区还是3、4区,监控易通过一个平台,就可将所有网络资源统一监控并展示出来。
ITOM领域通用运维方案单点监控最高到3000台设备就会运行缓慢、性能下降,监控易一台服务器能轻松监控上万台设备并保持长期稳定运行;通用运维软件仅能实现分钟级轮询,监控易可以实现秒级轮询;通用运维软件存储历史数据过多会影响性能,监控易可存储海量数据却不受影响。
无论是复杂的网络还是分布各地的零散终端,无论是公有网络还是私有网络,只要有一个向外的接口,通过监控易一体化运维管理平台,就能将网络内所有资源运行状况全部纳入监管。
基于多TS的分布式架构,是监控易有别于ITOM领域其他运维厂商极其明显的一个特点。通过内部网络中的某一个可联网设备,监控易就能实现异地网络的所有连接和性能数据采集,将分布在各地的网络资源全部监控起来。通过监控易的分布式架构,还可以将用户分布在全国各地的百万级IP地址进行管理。
相比传统运维模式,监控易分布式架构更为灵活,能适应各种网络拓扑结构。对于大型网络和复杂环境,部分运维厂商也提供了分布式部署,但多是以每个分布网点或局域网单独部署一套产品的方式来解决集中监控需求。如果监控对象数量众多、分布网点较多的话,一开始运维系统总体性能影响并不明显,但运行一段时间后,同时部署多套运维产品导致的网络卡顿和延迟、性能缓慢等问题终会显露。这种分布式部署模式,与监控易只需部署一套平台、集中式、一体化数据采集和运维,完全不同。
除此之外,监控易分布式架构平台还具备其他优良特性:良好的拓展性、监测数据先写入缓存再入库减小写入压力、64位寻址提升数据读取效率、低代码开发环境使开发人员能够以更大的自由度进行定制。
分布式运维,推荐监控易
现在,监控易几乎成为了分布式、大规模、海量设备运维的代名词,典型案例如上海电力、江苏交控、国家某室办、某大型重工企业、某大型制造业全国25个园区的基础设施集中监控等。而纵观国内ITOM领域,大多数运维厂商技术能力还达不到对复杂网络的集中运维,无法提供有效的解决方案。
勇于突破和创新,是美信时代公司的技术基因,其技术研发能力一直走在行业前沿。虽然各家运维厂商都会推出不同行业、不同场景的解决方案,但由于功能模块和技术前沿能力各不相同,市场侧重点必然有所不同。当单机版解决方案在运维中面临性能问题、效率问题时,可以试试监控易分布式部署架构,它将实现运维效率质的飞跃。
结语
工业4.0时代的推进,必然使得各行业网络规模体量越来越大。美信监控易多TS架构分布式运维,为大规模海量设备监控和运维提供了可以借鉴的经验和实践。只有解决了海量设备数据库实时存储和计算、快速适配大量不同型号和协议的设备、跨区域跨网络跨安全域等一系列运维难点,才能真正意义上实现大规模网络的分布式运维,跨越大企业运维管理鸿沟。
关于监控易:
监控易是美信时代自研的分布式、一体化数据采集与洞察管理平台,采用多TS架构,集中统一实现IT、动环、智能物联网等智能设备和软硬件系统的自动采集、监测、巡检、告警及展现,提供设备管理、网络管理、业务管理、视频管理、CMDB、ITSM、运维管理、机房管理、移动运维、云运维、3D可视化等核心功能,支持各系统间的数据关联共享,从全局视角把控系统运行态势。监控易具备全国产、高性能、一体化、多层级的特点,聚焦IT&OT领域,处于信创产业链中“卡脖子”的战略环节。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com