党受辉,腾讯互动娱乐技术运营部 蓝鲸产品中心总监。
腾讯 T4 工程师,曾就职于东软集团,为能源行业定制企业信息化体系,加入腾讯后负责运维团队管理。2012 年负责互动娱乐事业群基础 PaaS(蓝鲸)的设计、建设和运营。结合微服务、云、大数据等理念及前沿技术,构建独立部署的 PaaS 体系,并通过 SaaS 化产品,助力行业内应用运维团队的转型升级,推动 devops 生态及智能化运营。
党受辉:在腾讯的互动娱乐事业群(IEG),我们采用 PaaS 技术来架构运维体系,其中的 iPaaS 层可以兼容已有的重复性功能模块,并且在升级过程中可以采用长期双轨运行的方式平滑替换升级,相比于传统的“烟囱群”式系统的“推倒升级”,避免大量的风险及浪费。
党受辉:从技术角度看,一个业务的全生命周期可以分为 CI-CD-CO 三段,CI 指的是持续集成,从研发团队提交代码作为起点,经过便以构建扫描测试等环节,以版本仓库为终点;CD 指的是持续部署,以版本仓库为起点,经过各模块自动化部署,到业务上线提供服务为终点;CO 指的是持续运营,从业务上线服务为起点,到业务下线终止服务为终点,期间包含各种运营事件。
传统运维的定位主要在 CD 段,但由于微服务、虚拟化、容器化等技术的冲击之下,运维对 CD 段的把控在减弱,甚至有些公司直接按照 SRE 等理念从开发侧覆盖了运维团队的部分职能,从而使运维团队萎缩到了管理资产和成本的角色,丧失了精细化运营能力。
腾讯 IEG 的运维团队借助 PaaS 技术,将运维团队转型为“运维开发”团队,首先完成了自身 CD 段的自动化工具构建,而后通过 iPaaS 集成大数据能力,服务于 CO 段的业务及非技术人员,最后仿照运营 aPaaS 的持续集成流水线,为业务开发团队打造了 CI 段的全套工具产品,完成了对业务及业务团队全生命周期的运营支持。
党受辉:CI 指的是持续集成,从研发团队提交代码作为起点,经过便以构建扫描测试等环节,以版本仓库为终点;CD 指的是持续部署,以版本仓库为起点,经过各模块自动化部署,到业务上线提供服务为终点;CO 指的是持续运营,从业务上线服务为起点,到业务下线终止服务为终点,期间包含各种运营事件。
党受辉:我们将运维开发视为与测试开发、营销开发等并列的一种岗位,主要职能是做工具类的运营系统,例如持续集成、日志分析、资源管理、版本发布、环境变更、监控处理、灾备切换、日常巡检、电子工单、运营分析、运营管控、经营管理等。互联网公司面临着很大的竞争压力,需要从各个层面提升经营效率,降低成本。而落地工具文化,是途径之一。我们依托 PaaS 技术,将传统应用运维团队转型为运维开发团队,来承担这一重要职能。运维开发团队以 Python 为主语言构建 PaaS 之上的 SaaS 应用,而在从运维开发向 AIOps 的体系化过渡过程中,也可以以较低的成本完成转型。
党受辉:如果要“体系化”的落地智能运维,需要首先构建完善的机械自动化体系以及完整的数据分析体系,最后辅以符合运维技术栈的分析挖掘平台来实现。否则只能是作为案例或试点存在,无法“体系化”推进。
党受辉:社区版本升级和个性化功能定制的确是很多企业的矛盾,我们在容器管理平台中采用 k8s 与 mesos 双引擎并行的方式来解决这个问题。
党受辉:腾讯 IEG 虽然有一万多名员工,五百多款业务,但由于不同业务间的体量差异很大,有几万节点的大型游戏,也有数百节点的中小型游戏,因此其理论方法和实践经验适合于不同规模和类型的企业。
党受辉:适合于a 希望在企业中落地自动化、数据化、智能化的运维团队;b 希望从传统运维转型为运维开发的团队;c 希望从资源资产管理转向业务管理的运维团队;d 希望从传统 SLA 保障转型为对业务提供“技术运营”支持的运维团队。
关注 11.18-19 CNUTCon 深度培训,党受辉老师将分享传统运维团队向自动化、运维开发、智能运维及 IT 运营领域转型所必经的管理架构及技术平台架构变革之路。
一线大咖,零距离交流,助力你解决技术痛点,研讨避坑指南。倒计时 8 折优惠,1 秒扫码,get 运维工程师必备技能图谱(电子版),并获取深度培训优惠入场券。戳 阅读原文,即刻报名!