首页 > 知识库 > 正文

技术专题:智能化运维
2016-02-20 19:34:22   来源: 孙淑娟 51CTO.com    评论:0 点击:

智能化运维是用机器来代替运维人员,在最少人工干预下,结合运用脚本与第三方工具,保证业务7*24小时高效稳定运行,这也是运维工作的终极目标。智能化运维要做到事前预警、事中恢复和事后存档,实际上有大量的工作要完成。智能化运维不仅可以将运维人员从繁琐的工作中解放出来,而且还大大提升了运维工作的效率,是2016年运维发展的主要方向。

 

一、曲显平

\

曲显平,百度智能运维监控负责人,在运维监控、大数据处理与分析方向有着丰富的经验。

点评内容:

2015年是中国互联网智能化运维发展的元年,BAT等相继提出这一思路,在这一领域进行了一些卓有成效的尝试。随着互联网产品的蓬勃发展,和PAAS、APM、智能异常检测、大数据分析、机器学习等技术的兴起和逐渐成熟,运维技术也开启了一个新的篇章,不难看出,这些技术都是希望解放人的大脑和双手,而智能化便是大势所趋,众望所归的结果。

智能化运维,顾名思义,与平台化运维和自动化运维有着明显的不同。平台化运维注重的是入口的统一,运维服务或能力的复用,减少重复劳动,规范化操作;自动化运维注重的是大规模、批量化操作,一个程序一次性部署在成千上万的服务器上,或者针对某些特定场景,能够进行简单的逻辑执行,把繁杂的运维工作组织为一个有机的过程,一次性执行。而智能化运维,是更大跨度的向前一步,这个标志应该是运维工作从依靠人工决策,逐步转为依靠机器决策。举几个例子,故障的发现,以前多靠人工经验来设定监控阈值,而机器可以通过历史监控数据规律的学习,自动生成更加准确的阈值或通过异常模式识别去主动判断异常的发生。这不仅能够大量简化人的工作,而且比人更精准;故障的定位,以前多靠人翻阅大量的监控数据、服务器日志,甚至联络各相关团队工程师,分析线上所有变更事件等才能定位一个问题,而机器可以根据系统中的网络、机房、程序上下游调用关系等,综合所有监控数据和采集日志,来综合分析和定位,这比人的效率更高且更全面;扩缩容、止损和预案操作等也是类似,还有很多其它的例子。智能化运维是希望终有一天,机器决策能够大幅超越人工决策,那也就是运维人性解放的时刻。

2016年将是智能化运维全面铺开,得到大力发展的一年。APM、智能异常检测等技术将更加普及,逐渐取代运维工程师手工配置监控和实施策略。而智能化的故障定位技术也将覆盖更广泛,数据中心、网络、程序、业务等各个层面的故障定位能力将得到全面提升,极大解放oncall工程师的大脑和双手。而在故障恢复决策方面,智能化的监控系统将能够和PAAS或预案管理等系统结合起来,由监控系统给出判断决策,通知PAAS或预案执行系统来进行相应的降级或者止损操作。在不久的将来,相信运维工程师的双手会得到极大解放,逐渐告别繁复的基础运维工作,让他们在发展DevOps的道路上走得更加深入,每个人都成为领域专家。

相关热词搜索:智能化运维 运维 自动化运维

上一篇:如何在一分钟内对Linux服务器进行最佳性能诊断
下一篇:移动游戏技术优化的解决方案简述

分享到: 收藏