对AIOps智能化运维的基础理解
AIOps 自从 Gartner 于2016年提出至今已有一段时间,虽然在顶级互联网及电信企业,已有较多落地,但至今仍无基于生产实践的理论体系及实施指南。AIOps,即 Artificial Intelligence for IT Operations,智能运维,将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。从
AIOps 自从 Gartner 于2016年提出至今已有一段时间,虽然在顶级互联网及电信企业,已有较多落地,但至今仍无基于生产实践的理论体系及实施指南。AIOps,即 Artificial Intelligence for IT Operations,智能运维,将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。
从整个IT运维的发展,我们可以看到早期更多的是通过运维人员人工来完成,在人工阶段主要又做了两个方面的重要工作。
- 其一是基于ITIL的运维流程的规范化,标准化和流程化
- 其二是对于日常可重复的运维操作的脚本化和自动化执行
以上两个动作只能够划入到运维的第一个阶段,因为在很早以前基本就已经实现。在这个阶段完成后我们进入到自动化运维阶段。
对于自动化运维阶段,我的核心理解是:
自动化运维是基于预先定义好的规则,通过实时的资源和应用性能采集后进行计算,当满足某种规则的时候自动触发相应的可重复执行的运维脚本。
也就是说自动化运维解决了基于规则的运维流程自动化问题。但是里面还有一个重点没有解决,就是规则本身仍然需要人工自动定义进去。如果已有的规则无法覆盖新出现的运维问题,那我们还得不断的扩展和完善人工定义规则,并进行手工的规则定义和配置。
也正是这个原因,出现智能化运维就有必要的,对于智能化运维可以理解为:
智能化运维是在自动化运维基础上,具备了基于人工智能和深度学习等算法,实现规则的自动生成,已有规则的自适应调整的自动化运维。
也就是说智能化运维必须具备规则自生成,自适应调整能力,否则都不能叫做智能化运维,而最多算做自动化运维。而要做到这点,即涉及到AI人工智能里面的机器学习,深度学习方面的内容,如聚类算法,神经网络,预测模型等。
图片来自网络
AIOps 是运维的发展必然,是自动化运维的下一个发展阶段。
Gartner 相关报告预测 AIOps 的全球部署率将从2017年的10%增加到2020年的50%。其应用行业,除了互联网以外,还包括高性能计算、电信、金融、电力网络、物联网、 医疗网络和设备、航空航天、军用设备及网络等领域。
更多推荐
所有评论(0)