云智慧智能业务运维平台亮相国家“十三五”科

 公司新闻     |      2021-10-28 08:34

  10 月 21 日 -10 月 27 日,以 创新驱动发展 迈向科技强国 为主题的国家 十三五 科技创新成就展在北京展览馆盛大开幕。这场由科技部、国家发展改革委、财政部、军委装备发展部、军委科技委、北京市人民政府共同主办的展览,精选一批重大标志性科技成果和国之重器,从度全方位展示了我国深入实施创新驱动的发展战略与科技实力。

  云智慧作为国内领先的全栈智能运维解决方案服务商,其智能业务运维平台结合 清华数为 工业物联网数据库管理系统 IoTDB 在高新技术展区展出,为广大参展的科技创新同行者和参观的科技爱好者分享智能运维创新成果。

  随着被监控系统体量的快速增长,运维监控系统所采集的时序数据规模陡增,运维对数据平台的要求已不再是简单的 存数 、 取数 ,而是一系列复杂的 大数据 场景挑战。根据实际业务积累和行业经验,云智慧将运维场景对数据库的 苛刻 需求总结为:

  1. 数据体量大:同一时间所监控的指标对象往往超过百万,云智慧智能运维产品所面临的实时指标数据挑战在峰值时甚至达到千万级。

  2. 数据乱序到达:对于运维场景,数据在传输过程中会产生短时间内乱序,如果通过外部手段进行二次排序则对系统性能损耗极大。这就要求存储引擎可以内生解决该问题。

  3. 数据缺失:真实场景中,由于网络、资源等原因,往往存在数据短时间内缺失的情况,此时根据上层业务的使用要求,往往需要存储引擎对数据进行补全 ( 如插值 / 等值填充等 ) 。

  4. 数据峰谷潮:运维监控场景本身就要应对数据的不稳定性,在真实场景中,限于网络、流量控制、资源控制等策略,数据达到往往呈现峰谷效应,即业务忙时运维数据无法准时到达,业务闲时运维数据批量到达,这就要求存储引擎具备潮汐处理的能力。

  5. 数据粒度不齐整:限于计算机时钟等采集条件的限制,运维数据的时间统计往往会出现偏差,如一个分钟级测点,23:00:00:0000 的后继点可能是 23:00:01:0012; 这种不齐整现象会对同环比计算带来极大挑战,因此要求存储引擎能够具备齐整化能力。

  6. 数据单点爆炸问题:真实运维场景中,往往存在非常多 极端场景 ,如单一时间戳下产生数以万计的监测数据,在排查问题的同时,也需要存储引擎对该现象能够鲁棒处理,以保证系统正常运行。

  基于以上真实业务的巨大挑战,为了进一步优化云智慧智能运维平台计算性能,提升海量数据的处理效率,降低数据的存储成本和资源消耗,云智慧从真实需求出发,与清华大学发起的开源高效时序数据库 Apache IoTDB 深度融合,并积极为开源社区贡献智慧,目前云智慧团队提交的 Apache IoTDB 开源社区代码贡献量已经超过万行。

  依赖于以上架构方案,云智慧打造了以数据为基础,以场景为向导,以算法为支撑的面向 IT 运维监控、运维服务管理、IT 运维可视化的一体化综合运维管理平台。数据与算法的结合,为典型的 AIOps 场景赋能,如指标检测与分析、日志分析及链路追踪、告警智能降噪、根因分析与推荐、容量规划以及故障自愈等。目前,云智慧智能业务运维平台已经为金融、政府、运营商、能源、交通、制造等全行业客户,提供了数字化运维体系建设及全生命周期运维管理解决方案。未来云智慧还将联合 Apache IoTDB 开源团队,将智能运维领域遇到的通用时序数据功能在 Apache IoTDB 进行完善和优化,使其新特性更好地支撑智能业务运维平台,为企业数字化转型和提升 IT 运营效率持续赋能。