首页 > 知识库 > 正文

我从【优维计划】访谈中看到的运维现状
2016-02-20 19:33:36   来源: 老王 互联网运维杂谈    评论:0 点击:

自优维计划发起之后,已经差不多用了三周的时间接触了其中的部分企业。当前接触的企业中有银行、有运营商,还有制造业,更大部分是互联网企业,通过和他们的交流也获取到一些有价值的信息,主要是看到了一些运维现状,拿出来和大家分享一下。

\

自优维计划发起之后,已经差不多用了三周的时间接触了其中的部分企业。当前接触的企业中有银行、有运营商,还有制造业,更大部分是互联网企业,通过和他们的交流也获取到一些有价值的信息,主要是看到了一些运维现状,拿出来和大家分享一下。

1.业务互联网化,让运维更受重视

无论是传统行业还是互联网企业,业务的互联网化是一种趋势,是一种推动力。

在传统企业中,大家都在考虑一些业务形态的互联网化。此时互联网+是一种外力,对IT的敏捷性要求也更高了,使得企业对运维的重视程度越来越高,无论从底层的基础架构维护,还是到上层的应用运维。全面的构建IT系统的敏捷运维能力,是每个IT企业需要着重解决的。有个企业的互联网化业务,以前的模式业务部门提需求给技术部门实现,彼此割裂,响应速度很慢,后来他们就基于产品线成立了研发、测试、运维的垂直功能线,确保用户需求的快速响应和后续产品功能的快速迭代。

\

从【优维计划】放开报名的第一天,就有24家企业报名,说明大家对运维还是相当重视的。

2.运维组织设置存在问题

典型的几个问题,第一种、运维团队还放在研发团队内部,导致职责不清晰;第二种、运维团队能力定位过低,只负责了OS之下的运维;第三种、运维团队和开发团队之间的分离很严重。

第一种与第二种情况在互联网公司很普遍,运维的角色变成附属,常见的运维定位就是做服务器交付和发布部署等等,没法深度挖掘运维的价值,核心原因是研发或者运维团队都对运维的作用和价值认识不足,运维能做什么?该做什么?没有想清楚;第三种情况在银行和运营商就比较普遍存在,当然这个地方有现实的原因,比如说他们的系统是外部研发团队交付的,很难建立起真正的运维标准;运维能力依赖第三方;基于ITIL打造的运维体系,偏向流程;安全稳定是核心目标等等。

结合这段时间的企业访谈实际,提出了运维四力模型,外力的推动最终需要运维有更强的IT控制力和驱动力。

\

3.规模化x86的运维是个挑战

在银行及运营商,x86化也是一种趋势,这里面有政策因素,也有技术因素,也有成本因素。对于它们来说,基于x86的规模化运维能力快速积累是个挑战。

这个挑战来自于两个方面,第一个方面是技术层面的,可以说以前他们的运维能力都是基于高可用硬件设备构筑的,未来是要基于规模化x86集群去构建运维能力。这块最好的运维经验是在互联网公司中,而当前商业产品是没法满足的,他们自身也不是互联网化公司,更是缺少运维的实践理解。

另外一方面是组织架构上的挑战。如果要顺应x86的运维体系,此时运维的组织结构也需要进行调整,特别是面向应用运维的重要性需要提升,同时需要储备一定的运维研发能力,以便适应运管的需要。

可以说当前互联网公司的运维平台和运维规范,大部分都是基于自己的运维规范,有些是研发配合下才能完成的,有点最佳实践的感觉。

4.运维平台体系化能力尚存不足

很多公司的运维基本上是批量脚本阶段,比如说发布,监控采用的是zabbix,运维的平台能力还是基于开源来实现的。

很多企业都把运维看成一个不重要的职能角色,要不就是成本中心,要不就是维稳部门,或者就是一个打杂/救火的。基于这些定位,造成了运维的自研能力严重不足,运维只能被动基于一些开源产品打造运维的自动化和运维监控能力。

运维平台建设没有体系化,更多是碎片化的理解和工作开展。

5.DevOps很受关注,但很遥远

DevOps是文化、理念、意识、平台等综合全面体系,很多企业关心(这是好事),但我觉得遥远。

我觉得现在在国内谈DevOps还为时尚早。在很多公司,O的能力还没有真正的构建起来。DevOps需要Dev、Test、Ops这三个角色在整个产品交付周期中紧密融合,而非割裂。看到的大部分情况是研发只考虑功能实现,运维只考虑一些事务性工作,彼此合作参照还远远不够。我一般在和大家交流运维之前会提出要求,希望研发能够参加,也让他们全面了解运维,方便未来运维工作的开展。

6.互联网运维急需最佳实践指导

每个企业都在按照自己的方式摸索,业界需要总结出通用的最佳实践。

从整个行业来说,这块的成本非常高昂,就拿CMDB来说,每个互联网企业都在重复建设。有些传统企业基于以前的ITIL的CMDB理解,把一切当做配置来管理的话,往往让CMDB走偏了。比如说有一家传统企业,桌面PC从哪儿搬到哪儿都需要管理,这明显让CMDB干了资产管理的活。

最佳实践部分应该从多个角度描述如何做好运维,从规范、从流程、从意识、从文化、从思维、从平台等等,当然最佳实践一定要有利于企业导入。

\

好了,今天就分享这么多了。

关于老王(原名王津银) : 07年进入腾讯公司接触运维,经历服务器从百到万的运维历程,先后在YY和UC参与不同业务形态的运维,期间带过前端运维、数据存储运维、YY语音、游戏运维、运维研发等多种运维团队,对运维有着全面的理解。极力倡导互联网价值运维理念,即面向用户的价值是由自动化平台交付传递,同时由数据化来提炼和衡量。

【编辑推荐】

  1. 运维安全需要注意的几个方面
  2. 互联网企业需要一种能力叫运维
  3. 运维自动化重点解读之监控系统(三):架构
  4. 【专题】如何应对运维工作的几大挑战?
  5. 简单介绍自动化运维工具clip
【责任编辑:火凤凰 TEL:(010)68476606】

相关热词搜索:访谈 运维 现状

上一篇:简单介绍自动化运维工具clip(1)
下一篇:关于Git和Github,你可能不知道的十件事(1)

分享到: 收藏