欢迎您光临本站,如有问题请及时联系我们。

专家观察 | 肖力:“OpenStack政企专享云运维实践”

  由工业和信息化部指导,中国信息通信研究院主办,业界知名组织云计算开源产业联盟(OSCAR)承办的2017全球云计算开源大会于4月19日-20日在北京国家会议中心顺利召开。本文为本届大会嘉宾分享的大会演讲速记内容,敬请浏览。

  嘉宾介绍:肖力

  公司职务:北京中联润通信息技术有限公司运维总监

  大会演讲速记

  以前都是我当主持人,别人讲,今天换个个,我发现明宇主持水平非常高。我给大家带来的是OpenStack企业专享云运维实践。

  第一,介绍一下我们对政企专享云建设过程。我们公司成立于2009年,我们自己定位是一个云计算、大数据解决方案公司,目前我们通过ISO20000、20007,国家等保三级认证,可信云认证,SP认证。

  我们的客户有国家发改委、中国海关、中国海监局、中国联通,中国红十字会等等。

  我们包括云计算、大数据资源管理平台,分布式数据库,安全态势感知和数据交换等服务,还提供一些专业服务,运维外包,SDN托管,还包括一些行业解决方案,宏观经济决策,军民融合,电子税务,政务公开办公,制造和医疗。

  我们做过很多国家级的大型项目,还有一些上市公司,在这些项目中,一些核心需求是什么,我们自己总结十二个字,六个方面,自主、开放、成本、性能、定制、迁移,怎么满足这些核心需求呢?我们有两个字秘诀“开源”,通过使用开源解决方案,我们可以满足自主、开放、成本方面的需求,通过自主研发能力,运维能力,可以很好地满足性能、定制、迁移方面的需求。

  我们有两个案例,第一个是国家级大数据中心建设,底层云和上层大数据都是使用我们的解决方案,我们首先会做业务需求分析,确定建设思路,这是以点带面的思路。包括建设方式,我们是统筹的数据资源,这个项目建设成果可以促进国家经济发展,大数据中心,有效支撑了国家大数据分析应用,有利于显著提高国家经济部门管理性能和决策水平。

  这是一个医药行业某上市公司的案例,这是非常典型的OpenStack案例。

  这个案例目标是制造核心云,从传统模式自建SDC,迁移到OpenStack私有云,同时支持多层复杂的内部云,包括医院业务系统医疗和办公系统等,设计架构采用混合架构,新建以OpenStack为核心的企业私有云,提供用于SDP等特殊配置物理集合,标准配置虚拟机,使用点对点专线连接到用户现场,办公现场。

  建设成果以用户需求为导向,以稳定性、安全性、灵活性为设计目标,建设私有云平台,满足行业监管机构对业务系统的特殊安全要求,包括医疗档案数据隔离,数据库等等。

  用户收益,通过部署私有云实现客户IP资源标准化,通过服务目录交互服务,企业不再承担固定资产投入,以灵活的方式选择IP投入,这是典型的OpenStack云的建设案例。

  云的运维非常重要,我们云的运维如何组织的呢?运维方面我们主要有两个挑战。

  第一,我们经常有多个OpenStack项目同时实施,而且许多又是国家级大型OpenStack项目,经常一个周期是大半年时间,甚至有的超过一年时间,而且这些项目经常做完以后转为我们去服务,我们目前有几十个OpenStack项目提供服务,这是我们运维方面碰到的两个挑战。

  解决方案:我们有三板斧,第一,我们有一套运维工具,我们有持续不断的共享和培训。我们非常重要的是项目导向的团队建设,先看一下我们运维工具,我们有一套自动化的运维系统,我们建设是用微服务的理念建设出来的,完全自己开发出来的,我们的开发团队帮助我们做一个平台,所有运维都为了完善这个平台。一切的脚本都是原子的,我们可以快速对脚本进行重新组合,比如原来机遇OpenStackM版写了一个脚本,现在N版出来了很多脚本是公用的,我们也可以很快的把脚本写出来。

  另外我们要为几十个OpenStack项目服务,我们整个服务用公端驱动的,所有客户需求都是用公端体现的。我们还有日志系统,我们把云主机、物理机日志收集起来。现在我们还在做一件事情,做一些智能的预警,建立一个智能系统,通过日志分析,在故障没有发生之前做预测。以及我们还有一个项目管理系统。

  这是我们的工单系统,我们日常就是靠工单系统运转,最早我们使用的一套开源工单系统,这套系统功能比较全一点,但是东西也比较笨重一点,后来我们开发了一套完全满足我们一套轻量级的工单系统,非常不错,界面是简陋一点。

  这是我们的运维系统,基本上我们把它叫平台集成器,我们的研发帮我们做一个平台,底层有一个集成器。基本上我们目前运维就是高公端系统和自动化运维系统作为两个支撑点支撑的,在内部也运行比较顺畅。

  我们有一个计划,我们使用了很多开源软件,我们也希望回馈一些东西,我们预计今年下半年或者明年年初,我们的公端系统和运维工具系统准备拿出来开源,和大家共享。因为我们觉得这些系统跟OpenStack结合的时候,我们还是有一些经验和心得的,希望能够分享出来。

  另外运维我们还有一个非常大的特色,就是引入一些项目管理工具,比如我们拿到OpenStack项目会首先分成几个任务包,任务包可以再细分到天、人,每个人每天做什么,一些特别重要的项目,我们甚至会分解到小时,我们每天都有一个list,每天大家汇报信息,完成什么样,每天持续检查跟踪,这样可以保证我们对一个运维项目,对一个OpenStack项目,谱仪保质保量,而且在可控范围内能够把它做完。

  这是我们运维团队的演进,最早的时候我们运维团队分为四组,一个是知识组,知识组分为两块,一个是24小时值班,一直看监控屏幕,还有一个是客服接电话的终端处理,还有一个组是现场组,这个组主要做一些物理服务器上架,还有操作系统安装,还有一个组叫网络安全组,做一些网络安全设备上架配置,还有网络服务的需求。

  还有是系统组,系统组主要做操作系统以上,比如OpenStack部署,Ceph部署,客户系统的需求,可以做一些变更。这个划分可以满足我们业务需要,但是有一个问题,如果有项目来的时候,现场组工作量非常忙,但是项目结束以后,有一段时间可能没项目,这段时间他又相对比较清闲一点,工作量不饱和,而且还有一个问题,现场组这些人永远接触的都是硬件,网络组接触的都是网络的一些东西,然后我们做了团队的变革。

  目前我们有三个组,一个是支持组,基本上还是做以前支持组的事情。还有是实施组,我们把现场组、网络组、系统组部署的活分到一个组里面,这样对于实施组来说有很好的学习机会,既可以做硬件部署,也可以做系统部署,也可以做OpenStack部署,也可以做终端处理。还有架构组,架构组主要做一些方案设计,方案实施,有时候需要见一些客户,对他来说也是很好的锻炼。

  项目怎么实施呢?我们目前采用的是虚拟项目的机制,一般是架构组出一个人,实施组根据项目大小,人数不一样,有时候三到五人有时候更多,这个项目就一直归架构组处理。整个项目周期由一个人负责,这样的好处是项目他比较熟悉,客户一直接触他,有些问题也比较好处理,以及数据流量他都很清晰,能够保证项目不管是实施,以及实施后的项目服务,都可以保证。


来源:本文由E8运维原创撰写,欢迎分享本文,转载请保留出处和链接!