欢迎您光临本站,如有问题请及时联系我们。

IT运维农耕时代——手工运维

  一些IT信息化建设程度还不算高的企业,正在以他们的核心业务为中心构建IT信息化的支撑和管理系统。例如,我刚毕业时就维护过电信行业的97系统,首次将业务受理、管线信息管理、业务开通等电信行业的核心业务和信息实现统一的信息管理。

  当时的系统架构及基础设施架构异常简单,数十台服务器及一些基础软件如中间件、数据库等,就是企业信息化的全部家当。同时,IT运维体系以及业务对IT系统依赖程度等因素,决定了这个时候运维人员对于IT工具和平台的需求暂时相对较低。

  在IT系统手工运维阶段,企业IT规模较小和技术栈的单一,使企业的运维水平往往决定于团队中核心运维人员的经验,几个技术大牛往往是运维团队的核心。所以,这种以人为核心运维机制下,使运维人员往往都形成自己的维护脚本库,将一些日常工作中常用到的解决方案和操作方式以脚本的存储下来,成为各自的运维“葵花宝典”。

  (那些年,我们用过的宝典)

  存在的问题

  总体而言,手工阶段体现了人类农耕时代的特点——以人为主劳动,效率相对较低。因此,在这个阶段当企业IT系统发展到一定规模后,就会引发很多问题,例如:

  1、运维资源不足的困境

  企业IT系统规模、复杂度和运维团队的人力资源之间并不对等的增长,两者之间的差距往往越拉越大。此外,企业IT环境中还逐步引入如云、开源软件等新技术。这些新技术引入更加剧了运维资源不足的困境。

  2、运维知识体系转移较慢

  例如,大量运维的经验和知识分散在各自的“葵花宝典”中,不利于团队中运维知识的有效传播。

  即使增加人力资源,新运维人员加入需要大量的时间熟悉环境,并需要在实际环境和团队成员传、帮、带过程中积累经验,上手过程往往非常长;同时,运维团队中关键人员的离开,也会引起不同程度IT运维质量波动。

  3、运维标准化程度低

  不同的人根据其经验做同一个操作可能带来不同的效果,甚至引起大规模的故障。我曾经就碰到过一个“给数据库增加数据空间”这样的常规操作导致系统瘫痪半天的事件,究其原因正是运维人员想当然,没有按规范的操作执行造成。

  4、企业对IT系统依赖过高

  企业对IT系统的依赖与日俱增,IT系统一旦出现故障对企业业务产生巨大影响,单靠人力的运维模式已经远不能满足这种要求。

  因此,在手工运维阶段后期,许多运维团队也自发性地编写一些简单的工具以便利于自己的运维工作。同时,更多企业为解决这些迫切的问题,开始着手引入各式的专业运维工具,解决存在的各种各样问题,逐步走向自动化运维。

  E8运维是国内最早成立的IT运维技术社区,致力于为运维相关领域的工程师打造一个良好的学习交流平台。深度剖析国内运维业内动态,分享DevOps、自动化运维、智能运维等优秀实践,帮助运维人员提升技能和规划职业发展路线。


来源:本文由E8运维原创撰写,欢迎分享本文,转载请保留出处和链接!