顺丰科技陈天宇:“双11”、“618”背后的运维转型之路

原创
CIOAge 系统运维
近年各大电商的崛起,正以强劲之势改变着中国,同时也影响着我们的生活。它不仅丰富了消费者线上体验,即更便利、实惠,也正改变着快递行业的运营法则。如今,整个快递行业竞争加剧、物流成本不断上涨,市场日益复杂。

【51CTO.com原创稿件】2017年12月01日-02日,由51CTO主办的WOTD全球软件开发技术峰会将在深圳中州万豪酒店隆重举行。本次峰会以软件开发为主题,数十位专家级嘉宾将带来多场精彩的技术内容分享。届时,陈天宇先生将在创新运维探索专场与来宾分享"全栈资源下的自动化运维灵魂"主题演讲,为大家详细阐述的内容主要包括:***、服务器资源KPI时代;第二、操作系统母体效应;第三、全栈资源的建立:ESX+KVM+docker+Physical+Cloud;第四、ansible自动化运维的核心灵魂。届时,51CTO诚邀您莅临大会,与我们共享技术带来的喜悦。

 

[[209490]]

近年各大电商的崛起,正以强劲之势改变着中国,同时也影响着我们的生活。它不仅丰富了消费者线上体验,即更便利、实惠,也正改变着快递行业的运营法则。如今,整个快递行业竞争加剧、物流成本不断上涨,市场日益复杂。智慧物流、冷链业务……各大快递企业正积极探索业务拓展和转型升级的新路径,以催生新生态、新模式。作为快递市场的领军企业之一,顺丰速运同样如此。

然而事物的发展皆有两面性。面对复杂的竞争环境、不断增加的成本以及规模的不断扩大,和不断扩展的IT应用,保持可持续竞争的唯一优势是超越于竞争者的创新能力。企业业务创新则依赖于信息系统的支撑和保障,而成功的IT运维管理则是其中重要的组成部分。如何保障IT服务灵活便捷、安全稳定地运行就成了IT运维工作的重中之重,同时也给IT运维带来了***的压力。

转型迫在眉睫

采访中,陈天宇告诉记者,顺丰速运经营模式是直营模式,采用面向C端业务并自建配送,从B端扩展业务到C端,这种跨越式的转变给IT运维带来了新的要求。因为,以前的系统只针对B端一些大的商家和用户,如今放开到个人,包括微信下单、呼叫中心、网页界面在内的这些新衍生的下单途径横跨不同网络终端,就导致IT系统架构愈加复杂庞大,业务流程越来越繁琐,传统的运维管理越来越力不从心。

陈天宇强调,一方面,因为IT部门人员过少,导致运维压力大,若操作失误,就会造成无法挽回的灾难;另一方面,大而全的系统,对运维人员技术能力要求也越来越高,日常工作量繁重 。

总而言之,运维的复杂程度和灵活性需求正日益提升。在运维人员有限的情况下,要保证IT运行环境高效、灵活、便捷,以支撑企业的核心业务,就亟需一个全局性、高效健壮、标准规范的自动化运维机制,来应对日益复杂的IT异构环境。据了解,从2014年开始,陈天宇与团队通过建立IT运维的自动化监控和管理平台,到2016年,顺丰集团基本实现全流程自动化。

打造自动化运维平台

谈及自动化运维建设,陈天宇详细解析自动化运维工具—Ansible的运行原理。他表示,Ansible是基于Python开发的自动化运维工具, 融合了众多老牌运维工具(puppet、cfengine、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能,能满足企业IT系统的自动化运维管理。在安全性这一问题,相对于同样基于Python开发的SaltStack,Ansible的安全性更突出,自身运维简单,使用语法可读性更强,虽然Ansible在响应速度方面不如SaltStack,但在大部分应用场景下Ansible的响应速度能满足需求。

从业务规模小的原始手工时代,即ITIL管理概念下的脚本时代,到业务量增加,原有情况难以为继的改革自动化工具时代,运维技术迎来飞速发展。如今随着大数据、人工智能的兴起,运维技术正迈入新的篇章。

自动化监控再升级

面对复杂的业务监控,运维人员想找出指标和时间之间的关联关系,进行因果关系推导,并最终定位故障,早期通常是凭借人的经验进行。而随着业务和监控系统的发展,运维人员可以凭借机器快速发现问题,并解决问题。然而,伴随着顺丰科技服务器数量的不断增多,早期运维监控平台的不足就显示出来了。“当CPU使用率达到80%系统会自动报警,内容使用80%它也会自动报警。机器报警往往是一条一条的,它并没有结合其他条件再考虑是否报警。“陈天宇说。

因此,下一步,顺丰科技运维团队要做的就是将人的思维写到监控平台当中,让它的报警预测更精准、更智能。陈天宇表示,“我们会把很多日志提取出来,无论是动态的、还是静态的,然后结合IT访问量、CPU、内存以及数据库或者其他的应用,再将人考虑故障问题的逻辑加进去,从业务层面或者系统层面的角度去看,除了这个指标报错之外,当前的结点有没有问题,再结合到这个组件有没有问题。”

采访***,陈天宇表示,智能化运维已是目前运维发展的主要方向,未来,智能化运维将会更加普遍地应用到现实中。在技术和商业激荡的今天,改变无时不在,IT运维服务管理必将是一个长期性的话题,运维管理业内从业者更需要进行不断地研究和学习,成为春江水暖的先知者。

[[209491]]

顺丰科技-系统技术管理部负责人陈天宇,他于2007年参加工作,先后任职于中国电信、平安科技、顺丰科技,专注运维领域10年,从公务员到运维工程师,再到高级小步兵,一路坚守用技术解决问题的理念。目前任职于顺丰科技,负责操作系统相关的技术管理工作:同时也负责Linux&unix&ESX&KVM&Docker运维管理,并提供稳固、高性能的操作系统平台。

使用双十一特别优惠码[2017WOTD1111],和我一起去WOTD全球软件开发技术峰会。8优惠基础,再减512详情点击wot.51cto.com

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

 

责任编辑:吴金泽 来源: 51CTO
相关推荐

2017-12-15 09:20:20

IT运维顺丰

2016-11-14 11:08:06

戴尔服务器

2018-07-11 06:06:20

物流仓储运维数据库

2015-05-08 15:54:55

华为

2018-12-05 08:30:27

IT运维逻辑

2023-02-23 10:59:20

亚马逊云科技顺丰供应链物流

2017-06-05 08:46:47

信息安全个人信息信息泄露

2018-01-25 10:56:17

双态运维IT运维新华三

2015-02-26 09:29:08

天玑科技IT架构国产化

2018-06-21 08:20:24

京东数据库架构运维秘诀

2023-08-29 07:31:18

科技运维数字化

2020-06-24 16:42:20

2017-12-13 17:25:28

阿里云网络企业级

2018-10-15 14:26:23

运维IT技术架构

2014-05-28 14:45:00

运维移动数据

2009-09-22 12:34:54

运维管理主动

2013-03-21 11:12:05

51CTO技术栈公众号