智能运维是围绕着指标、日志、追踪和告警四大数据和其转化的 AI 使能,我们认为运维场景的数据加智能技术就是智能运维 AIOps。举个例子,利用时序数据的处理方法可以对指标数据做异常检测或预测。日志是典型的半结构化数据,智能运维意味着对日志采用智能的处理方法抽象出对运维有意义的信息。通过模式识别、数据挖掘等手段对数据进行处理,可以满足多种场景多种业务需求。
云智慧的智能运维平台架构如图,平台可以处理 IT 和 OT 设备产生的数据。数据上报后,经过 Kafka 消息队列写入智能运维算法平台。元数据存储在 MySQL 中,时序数据存储到 IoTDB 和云智慧自研的 DODB 内。上层应用包含指标管理、指标问题发现、异常检测和单指标预测和分析及日志分析、事件分析等引擎,云智慧也提供了基于 Tensorflow 的智能分析引擎。