2019 年 11 月,华润云正式上线。从这时起算,华润集团要求所有板块要在 3 年之内完成上云工作,也就是说,2022 年底就是最后期限。
充满挑战性的任务背后,承载的是华润集团全面深化数字化转型的决心。华润集团智能与数字化部在十三五期间提出“智慧华润”建设愿景,制定了“云优先,智生长”技术战略,构建转型的技术基础和关键实施路径。
本文将从华润云的视角,深入了解大型传统集团型企业对于上云的思考和实践,以及是如何探索数字化转型之路。
采访嘉宾:
肖海山 华润数科技术委员会主任、华润云总经理
冯铮 华润数科华润云事业部 SRE 服务部技术总监
2015 年开始,伴随着华润集团统一数据中心的建设,华润集团开始布局云的建设。2019 年底华润云已完成基本的 IaaS、PaaS、及部分 SaaS 产品研发及建设,在 2019 年 11 月份宣布华润云正式上线,并开始为全集团 25 个行业提供云计算及相关服务。
在华润集团开展上云工作的同时,华润云也坚持自主研发和持续迭代,到 2022 年 7 月,云计算(IaaS/PaaS)相关产品每半年发布一个迭代版本,逐步丰富出了覆盖私有云、混合云、边缘云、公有云、信创云场景的产品系列。
肖海山表示,华润集团的数字化道路走得比较早,在 2013 年就已经有大面积的信息化尝试。比如华润万家涉猎电商、O2O,门店运营业务数字化。只是当时大家仅认为这是降本增效的一种办法,鲜少人提“数字化”这个词,但放到今天的语境来看,这都属于数字化场景实践。
华润集团大多数行业都面向民生,伴随移动互联网的发展,这些年集团内也有大量 C 端业务做了数字化场景探索。因此华润早就意识到数字化转型是需要解决什么关键问题:井喷式增长的业务数字化需求和有限的 IT 能力之间的矛盾。
具体而言,这里的 IT 能力主要体现在两方面:一是组织能力,是否有专业的人以及人才的数量是否足够;二是这些人是否有足够强的武器去打赢这场仗。
“武器”指的是 IT 用的平台、工具或者能力,华润云认为最核心的答案是云平台,将企业数字化转型所需的各种能力定位成不同的 PaaS 平台能力。
在华润云出现之前,华润集团内有不少子单位已经用上了云,并且不少业务跑在公有云上。但在集团看来,无论是作为央企的责任驱动或是从数据安全挑战的角度考虑,由集团层面牵头统一建设云是势在必得的,而且这件事迫在眉睫。“再不统建云,下面好多单位就要自己建了。”
为了打造自己的云,华润集团依托华润数科成立了相应的华润云事业部。当时团队把市场上国内外所有主流厂商的云“都摸了遍”。
一番调研过后,团队发现,由于这些厂商做云的初衷是解决自身的业务需求,因此其架构设计理念还是围绕互联网的场景出发,或者就是纯粹为了卖服务器。很多中小企业做的是互联网业务、游戏业务,那么采用主流的云就会觉得很合适,很方便。”肖海山说道。
但对于传统企业,情况则大不相同——“传统企业对云的诉求跟公有云提供的服务还是有很大差异。”
肖海山表示,互联网应用日常就有可能出现有百万人或千万个人的访问量,因此其公有云服务的性能要求是“高弹性、高并发”。然而,传统企业很少面对高并发的压力,一个系统有 1000 人同时并发访问已经称得上是“很有压力”。
从华润集团自身来说,尽管信息化建设在央国企阵营算是走在前列,但大多数系统还是传统架构,还有些系统访问量虽然很低,甚至低至几个人,但数字化的场景是主要是 2B 类型(工厂、库存、物流等等)其后台运算逻辑的复杂性不小,对后台运算的压力比互联网应用要大很多倍,且更重视架构的“稳定性、安全性、高性能”。
另一个关键问题是:当时多数私有云厂商提供的是最基本的 IaaS 服务,但是 IaaS 能力对于传统企业来讲,能够创造的价值非常有限,因为离业务太远。离业务越近的 IT 能力才是业务侧所需要的,那就是 PaaS 层。
肖海山指出,虽然互联网厂商也提供不少 PaaS 层的能力,但基本是依据互联网的场景设计,这意味着如果传统企业直接拿互联网厂商的公有云架构来用,最终可能会发现“IaaS 能力不是自己想要的、PaaS 层也没有相应的 IT 组织能力用。”
华润要做的云平台,是要让自己所有的互联网应用和传统应用都能在上面跑起来——以传统企业的线下场景为主,辅以互联网场景。其技术架构设计,不仅要能支持主流与前沿技术架构,还要兼容大量传统应用。
对于大量企业应用,业务需求有明确的业务确认方,因此华润数科的研发团队并不照搬互联网模式“敏捷开发”模式。
“必须是先想明白,想明白了,业务确认了再来做,这样才能做出好东西来,这一点是跟很多互联网企业有很大的差异。”据肖海山介绍,华润云的整个架构设计是进行了充分的研讨过后才定下来。而华润云下面所有产品的架构设计都需要经过他亲自把关——判断产品适用于哪些行业、哪类企业、多大规模和处于什么发展阶段的企业等,而这些判断背后的依据是其过去十余年的咨询经验以及在华润工作十多年的经历。
除了不照搬敏捷开发模式,华润云也不推崇大量采用分布式、微服务等前沿技术架构。微服务架构体系在前几年就已经非常流行,尤其备受各大互联网公司青睐,微服务允许研发人员以松耦合的模式来开发应用,尽管其具备灵活部署、可扩展、技术异构等优点,但同时也大幅增加了所需的服务器等资源成本,也显著增加了后期运维的复杂性和成本。对大多数企业应用而言,大量应用微服务、分布式技术最后往往得不偿失。
事实上,团队内部对于微服务的采用与否、如何用产生过不少思想碰撞。肖海山一开始便对微服务持谨慎态度,“微服务的理念很先进,它并没有错,但很多企业应用要全部走到微服务这一步,还需要很多年,投入很多成本。”
但由于华润云研发团队在组建初期从互联网行业吸纳了很多人才,因此也有不少人是倾向用微服务模式。等真正用过之后,大家才逐渐发现,微服务架构反倒会让产品研发效率变慢,并且需要非常多的服务器资源才能部署出一套系统。
以华润云门户为例,在产品设计之初就采用微服务架构,投入大量的人和资源,最终做出来却发现业务侧的可配置性存在较大的问题。
“大家一开始容易把大量的时间和精力花在微服务的设计上,而对业务侧的可配置性欠缺考虑,不够重视。因为大家原来在互联网公司都是专注做某款面向 C 端客户的产品,而不是卖软件,采用敏捷开发模式,产品体验有不合适就改,快速响应变化,不断迭代。”但是要卖软件,这要求他们做出来的东西具有高度可配置性,面向不同企业可以做动态调整,提高项目开发效率。
到 2021 年,肖海山意识到这样下去行不通,每做一个项目都需要投入大量的人做研发,成本太高。他决定大面积改造华润云产品——把微服务颗粒变粗,把“写死”的代码变成可配置化。
“这是个很痛苦的过程。”除了云门户,肖海山表示,像监控中心、ITSM(IT 服务管理)等好几个产品项目最终都被强制改过来,还是微服务架构,但颗粒变粗了、可配置性也变强了,客户部署起来也简单很多。
“微服务的方向可以走,但是不要走太急,微服务的做法可以有,但是不要拆得非常细,我们还是要选择一个平衡,就微服务颗粒度要科学、要合适,这样才能保障在有限的人、有限的资源的情况下,让产品做得更好。”
聚焦大中型企业数字化转型各方面痛点,华润云采用了一套独特的云架构,从底层 IDC 共享到整个 IaaS、多云管理平台,再到各种能力中台。这套能力中台能让企业快速实现数字化转型,让企业仅用很少的 IT 人员就能完成数字化转型,只需极少人员即可运维。
总的来说,从华润云的观察和实践来看,传统集团型企业对云计算的诉求,IaaS 是占比最小的,但也是“最特别”的。传统集团型企业要求的不是提供多厉害的弹性服务,更关心的是所提供的服务性能有多好、稳定性有多高、运维有多简单。
华润集团采取“云优先、智生长”的数字化转型策略。
“云优先”是指华润集团借助云计算这样一个高效和安全的平台,作为华润集团未来信息化建设、数字化转型、智能化发展的基础,帮助华润集团更好地落地各种转型,同时赋能华润数十万家上下游企业和行业伙伴。
“智生长”是从业务价值的角度出发,拥抱新一代信息技术,探索符合行业特性、华润特性的数字化转型道路,鼓励探索新模式、孵化新业态、培育新产业,塑造新的核心竞争能力。
显而易见,在该策略下,云是数字化转型历程的前置条件。其主张新业务尽可能云上部署,已有业务逐步云化部署,进而结合自身的产品优势,逐步实现数字化、智能化转型升级。
过去两年多,随着华润云平台不断迭代,目前华润云的 PaaS 及 SaaS 产品序列在华润内部已经覆盖了 26 个业务单元。
尽管是华润集团统建,但这朵华润云,在刚面世之时还是会引来不少质疑声。从在内部被质疑到被信任的这个过程,肖海山认为大致经历了三个阶段。
第一个阶段是观望,这时华润集团内的各个板块、各业务单元均在观望,大家都等着看集团“敢不敢上”、“上得怎么样”。
因此,首当其冲的必须是华润集团总部的财务、人力资源等多个核心系统,“因为你敢把财务搬上去,敢把人力资源搬上去,就说明这个平台是足够稳定,因为如果财务、人力资源系统搬上去华润云后出了问题,那无疑会波及华润集团两千多家子公司和 37 万人。”
“开始搬集团的系统的时候,产品团队的人着急,其他平行部门也不放心,就觉得‘万一这个不稳定,出了问题责任在我身上怎么办?’”
肖海山回忆到,“我劝说没关系,第一,出了问题责任都是我的。”
“第二,你先搬一些系统来‘测试’,你先上去看看。‘测试’没问题再搬‘生产’。第三,反正我兜底了,出了问题任何责任都是我的,他们就放心了,那就搬。”
当集团敢于把总部系统搬到华润云后,其他一些业务单元也开始“将信将疑”地上华润云了,这时开始集团上云进入第二阶段。
肖海山回忆道,当时某个千亿级单位的财务系统上云之后,整体性能提升至少 5 倍。上云后程序运行跑得快多了,这种变化让业务侧很是感触。
据悉,在华润万家的财务系统上云之后,华润万家财务特地给华润云发了封感谢信。
对于华润集团内的许多一线业务单位来说,系统运行“效率低、性能差”是老大难问题,而有着架构师背景的肖海山也意识到这跟架构性能问题有很大的关系。
因此,在思考“如何在不给成本带来很大的变化的情况下,能让企业有上云的动力”之时,他想到的突破点是“性能”,“上云之后,我要让大家明显看到性能带来的巨大变化。”系统性能可以说是华润云架构自设计之初就被重点考虑的因素。
另一方面,架构的安全可靠也是核心要素。肖海山表示,以往数据中心传统资源池,每年至少会发生一次重大安全事故。而华润云上线之后,至今出现重大安全事故的次数为零,其架构在设计之时就奔着“不允许任何一个单台物理设备的故障影响业务”的目标而来。
进入第三个阶段,华润集团旗下多个业务单元对华润云产生信任,纷纷主动找上门,希望能尽快搬到云上。
肖海山强调,华润云给各业务单位带来的明显变化是可以用财务指标来衡量的。以华润万家财务系统为例,其上云之前每年在 IBM 小型机折旧加维保的成本大概在 100 万至 200 万,而从 IBM 小型机换到云上后,其一年只需花费 20 万便已足矣。
从上云的出发点和路径来看,华润集团旗下企业上云可以大致分为以下三类:
第一类是响应集团战略,将系统搬至云上。很多系统的架构无法进行大的调整,就直接迁移上云,并做架构高可用的优化调整,同时也去掉了小型机。
第二类是为了降本增效,希望通过上云能省一些资源,整体容器化,应用代码和架构不做任何改造,也可以大幅度提升资源利用率。
把应用做微服务架构改造,再单独容器化。
“目前第一类占比居多,第二类和第三类加起来的比例不到一半。”肖海山坦言,过去华润在信息化过程中购买了许多套装软件,这类软件难以改造,要将其都解耦重构需要一定的时间。
那么,在 IT 资源有限的情况下,基于华润云的 PaaS 能力,如何让数字化转型可以更高效地推进?肖海山举了个华润建筑重构 ERP 的例子,其中发挥核心作用的是华润云 PaaS 能力平台:“数字化平台”。
为优化建筑行业管理效率,已经使用 5 年的 ERP 已经成为企业数字化转型的障碍。华润建筑需要逐步解耦其 ERP 系统核心模块,以开发出更符合其业务需求的建筑行业核心平台。
“基于华润对传统企业业务的场景的理解,我们把很多常见的、共性的东西,全部包装成了标准组件。”肖海山进一步介绍道,数字化开发平台具有完备的技术组件、通用组件、开发工具能力,让企业可以在不增加 IT 人员的情况下,进行数字化转型,通过小步快跑的模式,低成本高效率完成大量数字化转型应用的建设。
最终,华润建筑 ERP 改造任务仅花费一年半时间以及投入 12 个人便完成。华润集团内现有超过 5 家单位基于数字化开发平台进行 ERP 系统的解耦重构或新增的大量数字化应用建设。
在华润集团实现整体上云的过程中,SRE 运维团队起着关键作用。目前,该团队主要面向华润集团内外部提供一体化运维服务(如整体运维、整体上云、国产数据库迁移等)和运维体系咨询规划及建设。
据华润数科华润云事业部 SRE 服务部技术总监冯铮介绍,目前 SRE 运维团队规模约 100 多人,技术栈覆盖操作系统、数据库、容器、中间件、大数据、集成,以及重载商业套装应用系统 Oracle EBS 和 SAP。SRE 紧紧围绕着华润云的愿景与目标,提供华润云‘整体上云 + 一体化运维服务’的一站式解决方案。”
上云迁移是一项复杂而严谨的系统性工作,在进行上云迁移过程中,必须要有一套完整周密的方法来指导、支撑上云迁移过程。冯铮表示,针对某项上云服务,华润云 SRE 团队基本上先对其系统架构进行梳理和评估,比如现有的架构有哪些缺陷和问题,如何让架构变得更科学,通过哪个上云方案能够达到什么样的效果等等。
据了解,SRE 运维团队所提供的上云服务主要涵盖 6 大步骤:
系统现状梳理和评估:采用“调研模板 + 现场 / 远程访谈”的方式,对企业系统现状进行收集、梳理和评估;
上云技术路线规划:遵循“可落地、可优化、可迭代”的原则建设技术体系,规划适合企业的上云技术路线;
试点上云规划:选择和规划合适的上云试点,对后期上云技术路线规划、云平台特性验证提供参考;
整体上云规划:基于上云迁移策略要求,制定系统迁移计划和方案、风险应对方案等,并建立团队提供及时响应和服务保障支持;
试点 / 整体上云实施:提供详细的需求调研和方案设计,通过评审、测试等机制,确保上云实施的执行结果与计划的一致性。
信创迁移服务:基于华润云自研全国唯一的信创一键切换平台,能够快速将原来大量存在的国外数据库迁移到国产数据库,确保数据库结构、数据、程序的全自动处理。
同时,团队经过长期迁云实践,总结出一套通用上云迁移管理流程“四阶八步”,为集团及各业务单元在实施云迁移工作时提供方法指引和参考:
四阶:迁移准备、迁移实施、系统测试、割接上线。
八步:1. 迁移准备;2. 云资源申请;3. 数据库部署;4. 应用部署;5. 功能验证;6. 集成测试;7. 数据同步;8. 业务割接。
“上云不仅是物理位置的变化,更重要的是一次架构梳理、优化提升的过程,其目的在于提升 IT 管理水平和管理效率。”冯铮强调道。
上云,一方面是为了资源层面的成本下降,其更多的价值体现在企业的信息化、数字化、智能化建设的全面铺开。
如今,华润云已在华润集团全面应用,华润集团下属 25 个行业全面使用华润云,华润集团系统上云比例超过 99%,上云应用系统共计 800 多个;数字化方面,华润云提供完整的数字化解决方案,已在快消品、燃气、水泥、医药、电力、地产等 8 个行业应用,涉及 100+ 个 PC 数字应用,40+ 个移动应用。
华润云上线后,华润集团整体的资源交付效率提升 432 倍、基础设施成本降低 30%、项目建设效率提升 70%、项目建设成本降低 45%。
“企业数字化转型要回答几个问题,第一,为什么转?第二,往哪里转?第三,怎么转?”肖海山总结说,从企业侧的角度,数字化转型可以分为三大类型:
企业战略转型。基于自身行业化的特点,再结合数字化的技术,衍生出一种平台级或者生态盟主级别的新业务模式。而战略转型也分为主动战略性和被动转型,主动转型的企业很罕见,一万家企业可能只有一家企业发现主动战略转型的机会。被动转型则比较常见,来自异业竞争、互联网跨界等等威胁,行业龙头企业需要积极应对,躲不掉就要直接面对。
企业生态转型。数字中国下的企业,必须匹配数字生态,离 C 端越近的企业被迫响应社会的变化,C 端上游也被迫跟着变化。这时候企业进行生态转型的选择主要有二:大企业主动打造生态,基于企业的行业领导地位,让行业的上下游以我为中心,巩固企业的生态地位,共同抵御异业竞争的行业冲击;中小企业加入行业生态,融入互联网的数字化链条。加强自身的企业核心竞争力,在生态中保持存在的地位和价值。
管理、运营和用户体验的转型。让传统的信息化从办公室走出来,让信息科技服务能覆盖到企业的方方面面,让原来想管但管不了的场景有科技支持,让信息科技服务所有必要的业务场景,进一步降本增效、提升体验、节能减排等等。
进入数字经济时代,数据被视为生产要素,针对有些企业一做数字化转型就先建个大数据中台的现象,肖海山认为这是典型的“没有从业务的角度来看 IT 的作用”的体现。
“很多时候企业没想明白,只简单把数字化转型的事当做 IT 的事,IT 只是工具。数字化转型永远是业务的事。”在肖海山眼里,企业做数字化转型必须先把业务场景想明白,比如在什么场景下需要数据、需要什么数据、需要用数据创造什么价值等等,否则建设的大数据中台只会沦为摆设。
“把业务想明白了,这时 IT 配合去落地就行。用最快的速度、最低的成本帮业务做出来数字化转型的效果,这就是 IT 应该带来的价值。”这也是华润云的使命所在,从业务价值的角度出发,以云为基础平台和技术,把有限的 IT 资源放到创造价值最大的领域,推动华润集团“上云用数赋智”,为华润集团及旗下业务单元的数字化转型提速。
InfoQ 旗下《行知数字中国》视频栏目将于 9 月底推出关于华润雪花啤酒的数字化转型实践内容,欢迎感兴趣的读者届时关注。
《中国卓越技术团队访谈录》(2022 年第三季)精选了阿里达摩院数据库、得物、华润云、民生保险、众安保险、字节跳动 AppInfra 等技术团队在技术落地、团队建设方面的实践经验及心得体会。
《中国卓越技术团队访谈录》是 InfoQ 打造的重磅内容产品,以各个国内优秀企业的 IT 技术团队为线索策划系列采访,希望向外界传递杰出技术团队的做事方法 / 技术实践,让开发者了解他们的知识积累、技术演进、产品锤炼与团队文化等,并从中获得有价值的见解。
访谈录现开放长期报名通道,如果你身处传统企业经历了数字化转型变革,或者正在互联网公司进行创新技术的研发,并希望 InfoQ 可以关注和采访你所在的技术团队,可以添加微信:caifangfang_wechat,请注明来意及公司名称。
英伟达回应“对中国断供部分高端 GPU”;月薪 3.6 万工程师日均写 7 行代码被开;12 年黑进 40 多家金融机构老板赚百万获刑 |Q 资讯
在阿里达摩院搞了四年数据库,我来聊聊实际情况 | 卓越技术团队访谈录
点个在看少个 bug 👇