中国领先的IT技术网站
|
|

魅族古日旗:拒绝做背锅侠,看魅族运维救火员打造自动化运维平台之路

业务的快速发展使魅族运维人的工作常常处于水深火热中,救火,填坑,背锅成了常态。且看他们如何重新塑造运维的价值。

作者:谢海平来源:CIOAge|2017-12-03 12:37

开发者大赛路演 | 12月16日,技术创新,北京不见不散


【CIOAge.com原创稿件】2017年12月01-02日,由51CTO主办的WOTD 2017全球软件开发技术峰会在深圳中洲万豪酒店召开。秉承专注技术、服务技术人员的理念,自2012年以来,WOT品牌大会成功举办了十四届,积累了大量的技术专家资源,获得了广大IT从业者和技术爱好者的一致认可,成为了业界重要的技术分享交流平台以及人脉拓展平台。

本次会议分为10个技术主题,分别是:编程语言与框架,大数据系统架构设计、微服务与容器技术、前端开发实战、物联网(IOT)技术、软件性能优化、深度学习与智能应用开发、创新运维探索、技术架构遇到业务架构、CTO训练营。51CTO作为本次大会的主办方,将全程图文直播报道与后期视频展示这场盛宴。

魅族科技运维架构师古日旗在B会场创新运维探索进行了主题为《魅族持续集成及云端交付之路》的精彩演讲,他重点分享了魅族运维团队在互联网应用搭建持续集成与持续交付流水线的实战经验 。记者也在第一时间采访了他,请他谈谈打造自动化运维体系的经验。

CIOAge记者:魅族这两年发展比较快,但是这给运维的工作带来一些新的挑战?

古日旗:的确如此。业务的快速发展使我们的工作常常处于水深火热中,救火,填坑,背锅成了常态。后来我就开始思考运维存在的价值究竟是什么,以及如何衡量运维价值。于是我和团队其他成员就专注于如何提高IT运维体系的效率,使运维工作变得更可控。基于此,我们开始打造自动化运维平台,希望能够主动发现业务中的潜在风险,并做到及时解决。

但是,在打造高效率运维平台的过程中,我们遇到了很多挑战,有架构方面的、硬件方面。早期的业务由于可用性不高,监控体系也不完善,经常会出现监控误报的情况。另外,由于业务流程和自动化没有很好的结合起来,也没有制订比较贯穿的流程导致工作不透明。除此之外,系统也没有建立容量体系,因此我们很难评估业务的资源使用情况。

CIOAge记者:在打造自动化运维系统中,是如何规划的?

古日旗:魅族的自动化运维平台是按照标准化、自动化、智能化等三个阶段进行逐步升级。标准化包括硬件标准化、操作系统的标准化、监控标准化等。用自动化平台去落地标准化和流程,达到效率的提升。在自动化系统方面,魅族运维团队已经建设了工单系统、日志系统、发布系统、应用管理系统、自研运维通道、自动巡检系统,帮助运维人员解决了交付和变更等问题。

CIOAge记者:您能简单跟大家分享一下在打造自动化运维时,因为涉及到一些开发、硬件方面的问题,在这个过程中,您遇到过哪些印象深刻的难题,又是怎么克服的?

古日旗:最初监控系统做的不好,覆盖率很低。后期为了解决这个问题,我们建立了监控平台。我们把监控归纳成基础监控、应用监控、自定义监控、业务监控,与此同时,为了更好地实时监控资源利用率,建立了完善的容量评估体系,使运维人员能够实时掌握业务资源利用率,以及对更好地对成本进行管控。

CIOAge记者:自动化运维平台上线后,运维人员的工作发生了哪些变化?

古日旗:比较明显的是很多业务的发布不再需要运维参加了。最初因为业务比较简单,发布都是运维人员手工发布,但是随着业务的快速增长,“人肉“发布的模式已经很难支撑业务迭代的需求,因此就搭建了发布平台。为了使发布更灵活,我们把审核权限分配给各业务负责人,待负责人审核后,系统就能进行自动发布了,这个过程不再需要运维人员参加。目前,自动发布的成功率保持在98%以上,目前成功率还在持续上升,有超过90%的业务发布完全不需要运维人员进行操作。

CIOAge记者:自动化运维系统能够给企业带来很多价值,那么下一步魅族的运维系统的升级要如何规划呢?

古日旗:下一步规划是打造智能化运维系统。智能运维是根据收集的数据, 进行监督或者无监督的学习,从而达到预测和分析的目的。例如,关于故障发现、定位、处理等工作,可以通过系统自动采集服务器基础监控信息、网络设备基础监控信息、应用监控信息、业务监控信息、服务调用链的详细数据,通过这些,基于机器学习,对故障发现、定位、处理提供强有力的支持,甚至可以做到预测故障。

当然,随着人工智能的发展、算法的不断优化升级,我们希望能够借助智能化运维系统发挥更大的运维价值,从而帮助魅族进一步减少人力投入、降低成本、提高产品的迭代速度,为企业创造更大价值。

【专家介绍】

 魅族科技运维架构师古日旗,曾工作于金山和奇虎360,参与过快盘、天擎等项目,2015年加入魅族,现任职魅族科技运维架构师,负责运维自动化平台建设。

【CIOAge原创稿件,合作站点转载请注明原文作者和出处为CIOAge.com】

【编辑推荐】

  1. 20张图读懂智能驾驶的产业链与格局
  2. 食品工业中的人工智能:赋予农民决策权
  3. 火爆的机器学习和人工智能,为何在金融业四处碰壁?
  4. 小心你的智能硬件存在巨大漏洞
  5. 张一鸣:探讨人工智能边界就是探讨人类文明边界
【责任编辑:谢海平 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

主流ARM嵌入式系统设计技术与实例精解

本书重点介绍了主流ARM应用系统的开发与实践。全书基于目前较为通用、流行的ARM处理器,介绍了其原理、硬件结构、硬件电路设计与开发和软件...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊
× 51CTO学院双十二活动