2013年,程序员Matt Stine提出“CloudNative”概念,后来他又将这项技术的特点归纳为模块化、可观察、可部署、可测试、可替换、可处理6项,这就是大名鼎鼎的云原生。
十年过去,云原生的价值在科技界可谓无人不知,谁都能说上来容器化、微服务、敏捷交付等优点。但真正如何做云原生,尤其是消费终端类企业如何全面践行云原生,在今天依旧是问题多于答案。
云原生之路,不能仅在技术层面争论,而应该向实践要回答。
2023年6月6日,中国信通院和工信部联合举办的云原生产业发展论坛在北京召开。期间,华为云、中国信通院云计算和大数据研究所共同发布了《面向消费终端的企业云原生实践白皮书》。《白皮书》详尽展示了华为终端云的云原生改造过程与成果。与其疑惑企业究竟如何推动云原生发展,不如去真实的经验中探寻一番。
我们可以沿着华为终端云与华为云的云云协同脚步,寻访移动时代的云原生路径。
华为终端云,走向云深处
目前,大型企业普遍走到了深度用云阶段。随着业务的发展,企业对于敏捷开发、资源成本管理、云上运维安全等能力的需求会更加迫切。但贸然走向云原生,又担心会陷入技术路径不清晰、门槛过高、业务发展不可控等问题,进而产生进退维谷的两难。
华为终端云在发展过程中发现,企业走向业务全云化,拥抱云原生,是一个不可逆的数字化发展趋势。华为终端云的业务范畴,已经覆盖了全球170+个国家与地区,而伴随着业务体系的扩展,以及数字化能力的不断累计,华为终端云逐渐发现了一系列痛点。比如说,业务上线、交付、测试的流程过于复杂,导致新业务的交付能力与持续性不足,研发效率变低。再比如,传统软件开发流程中有大量依靠人工的审核、管理工作,这些环节增强了业务的不确定性,同时降低了IT流程间的衔接能力。除此之外,庞大的业务体系会导致数字化基础设施出现大量重复建设与资源浪费,长期来看也会拖慢研发与业务进展。这些问题的存在,阻碍了华为终端业务的发展。
在意识到基础设施与持续交付两方面的产业痛点后,华为终端云决定基于华为云,进行全面的云原生改造,将业务全部搬迁到华为云上,并且构建面向移动开发的平台化工程。
(华为终端有限公司基础云平台开发部部长余斌)
从2017年开始启动的华为终端云云原生平台工程工作,到目前已经实现了终端云服务的所有业务上云,云上主机数量达到20万个,云上存储数据已超过3000PB。
在移动互联网时代,有大量企业都有着复杂而庞大的移动业务,并且需要全球化进行业务布局,对于这些企业来说,云原生平台构建需求非常迫切。华为终端云的成功实践,就像是一头大象率先过桥,那么其他动物也当然可以。
总结终端云的云原生之路,其经验可以归纳为一纵一横两个方面。
All in 华为云
纵向发展的三个阶段
很多企业在推动云原生时,最大的困扰在于知道最终想要实现的云原生目标,但却不知道如何梳理出路径,规划出节奏。
《白皮书》中完整展现了华为终端云如何实现All in华为云,拥抱云原生。从方法上来看,终端云搬迁上云经过了四步方略:评估、方案、数据搬迁、业务上云。
而从发展节奏上看,整个终端云云原生工程平台,历经六年左右的发展时间,最终构建出以效率提升、成本优化、开箱即用、最优体验为发展目标的平台,整个过程走向可以分为三个阶段。
从2017年到2019年,是终端云推进上云的第一个阶段。这个阶段以基础设施上云为主,还比较少涉及业务改造方面的内容。基于华为云业界领先的云底座,终端云实现了数十万台云主机、EB级对象存储、TB级CDN搬迁上云,搭建了全球50ms时延覆盖圈。
基础筑牢之后,2019年开始的第二阶段中,终端云开启了高阶服务上云,将数据库和基础软件大量替换成了华为云提供的服务,搭建了数万亿级的数据库,容器化POD数超过10万,实现了纯在线业务CPU利用率超过40%,这在企业上云领域是非常高的标准。这一阶段,终端云的上云重点由基础设施提升到了软件与服务,为更深度拥抱云原生做好了准备。
第三阶段,终端云将在云原生探索中凝聚一系列能力,进行平台化整合和经验沉淀,并且将这些能力反哺到华为云体系中,进行SaaS化整合,从而让更多企业用到领先的移动技术。比如说,终端云的支付、搜索、浏览器、地图等能力都在这一阶段完成了开放,这也就是我们经常讨论的华为云与华为终端云的“云云协同”。
从基础设施上云,到走向云云协同,华为终端云的云原生是层层推进,逐步深化的,整个纵向路径非常清晰,节奏有条不紊。
在企业走向云原生时,对阶段性目标与实施节奏的把握是至关重要的,终端云的实践,恰好可以作为参考。
沉淀体系化能力
横向筑造三大平台
如果说,阶段性推进是走向云原生的纵向方案;那么沉淀能力,打造平台化工程,则是云原生发展的横向关键。
在云原生进程中,企业需要获取各种各样的能力,并且留存大量开发经验。如果这些宝贵财富用过即弃,那么云原生就会变成同时放水与灌水的水池,浪费大量资源。只有不断进行技术资源的沉淀,并且变成可复用、可标准化的平台,云原生才能焕发出最大价值。
在这个方面,华为终端云也做出了表率。多年的云原生实践,让华为云终端云实现了三大软件工程能力的平台化。这些能力平台不仅可以持续帮助终端云优化开发成本,降低开发难度,带给开发者与终端用户更优体验。还可能通过“云云协同”对外赋能,实现技术能力的社会集约化发展。具体来看,三个软件工程能力平台分别是:
1.云原生DevOps平台:敏捷开发是云原生的基础,DevOps平台就提供了全自动、一站式、开箱即用的软件工作平台,它沉淀了终端云的优秀开发实践,并按照云原生SaaS平台的方式对外提供服务。通过DevOps端到端工具链,企业可以便捷接入和使用,全面提升软件开发效率,云原生DevOps平台以服务使用者为视角,可全面提升企业应用的开发,运维,运营效率;以软件交付件为核心,实现“业务代码+BaC=软件包,软件包+IaC=可运行环境”。其中,BaC指构建即代码,IaC指基础设施即代码,软件包则应该包括端侧应用,云侧服务以及数据和AI算法等,并且将流程Built-in到软件生产过程,即在BaC和IaC执行过程中可针对流程中需要进行的质量控制项进行控制。
具体而言,云原生DevOps具有四个方面的能力特性构建:
Dev:构建项目管理服务和祥云Studio,提供个人级、项目级一站式开发平台,通过软件信息树实现全流程可信。
Runtime:提供大容量、弹性、安全、高可靠的服务运行环境,推动业务按需快速集成。
Ops:围绕部署的全生命周期管理,通过IaC3.0提升部署效率,服务环境可快速创建、归档和恢复。构建ENS服务提供自动化开通网络能力,提供ServiceInsight汇聚自有服务的所有监控信息。
构建祥云Console,提供一站式的服务自助申请,祥云平台上的服务上架到祥云Console,对外提供一致的接入和使用体验。
2.云原生DataOps平台:数据分析能力是现代化软件流程管理的关键,也是效率的来源。DataOps平台是一种面向流程的自动化方法,由分析和数据团队使用,旨在提高数据分析的质量并缩短数据分析的周期。云原生DataOps平台,可以实现数据的高效共享和数据作业的持续快速交付。基于华为云统一元数据、存算分离、多活容灾架构等技术,改造后的数据基础设施,主机数量比IDC减少超过20%,任务减少超过50%,数据共享效率提升80%(原来是集群间数据拷贝,现在是直接访问OBS),人力维护成本降低50%,3年整体TCO降低20%左右。同时在大数据开发流水线的构建过程中,云原生DataOps创新性的引入了Daac(接入即代码)的概念,实现数据接入自动化。这些技术创新点,极大提高使用数据的效率并降低使用数据的门槛。祥云平台构建的DataOps,可以实现30万+的日均调度,百万级并发调度,秒级调度时延。把数据的共享效率整体提升了80%以上,实现了万人以上的大规模协同作业。
3.云原生MLOps平台:目前阶段,企业愈发重视AI任务的开发与部署。云原生MLOps平台通过与其他云原生工具结合,实现了简化端到端的AI开发,让业务、数据、算法和运维更加紧密协作,推动模型的快速迭代。终端云MLOps流程,涵盖了计划、数据准备、模型开发、模型训练、模型验证 、模型打包、模型部署、模型推理、模型监控等多个方面,从而构建了一站式祥云MLOps平台,提升AI研发与应用效率。
三大软件平台,可以说凝结了华为终端云多年云原生实践的海量技术成果。这些成果的平台化,不仅将继续推动终端云数字化能力持续发展,还将成为云云协同的抓手,降低各行业的云原生实践门槛。
我们提到云原生,通常都在讨论单点技术。但单一技术在云原生进程中是不足的。华为终端云的云原生实践,坚持以整体性、工程化的思维,系统构建能力平台。就像Matt Stine所说,模块化、可替换、可部署,是云原生的核心技术特性。终端云的技术沉淀与平台化打通思路,也值得更多企业在云原生之路上参考。
献给移动时代的云原生路径
华为终端云的云原生改造经验,价值显然不仅局限于终端云的体系内。一方面,其技术成果将通过华为云进行对外开放,成为更多企业可获取、可复用的云原生资源;另一方面,其技术路径本身就可以借鉴,让更多企业可以更快、更好地基于华为云拥抱云原生。从一个很简单的逻辑看,终端云这样体量巨大、业务复杂的体系,都可以通过华为云走向云原生,其他企业自然也可以。华为有一个信条,叫做“自己的降落伞自己先跳”。终端云基于华为云进行的云原生改造,很大程度上又一次展现了这一点。
如今,华为终端云通过深度数字化转型,支撑业务年复合增长率超过30%,依托华为云云原生2.0,终端云以应用为中心构建全面升级的云服务体系,应对了数字化转型中的核心挑战。
其带来的价值不仅华为终端云内部感受良多,即使对于开发者与终端用户来说也是一样。过去华为终端云的新业务上线需要人工审核、人工验证,而通过云原生改造,大量服务的上线分发已经实现了全流程自动化,终端用户享受到了更迅捷、便利的新应用获取体验。
面向未来,华为云与华为终端云还会持续推进云云协同,将更多终端云的能力,通过公有云服务与SaaS化对外开放。华为云的用户可以将这些能力按需索取,灵活组合,实现最符合自身需要的云原生能力体系。
对与华为终端云来说,未来还将与华为云进行更紧密的基础设施联合,进一步提升数字化资源的管理能力、运维水平,降低综合开发成本,提升开发经验与技术能力。截至2022年12月31日,华为终端全球活跃用户超过7.3亿,华为终端云服务全球活跃用户超过5.8亿,华为帐号全球活跃用户超过4.2亿,华为全球注册开发者超600万。HUAWEI AppGallery Connect在国内累计提供的服务达到125项,海外达到87项,全球集成HMS Core的应用超过22.3万个。
这些数字的背后,是云原生之路在支持和赋能,是“云云协同”的战略在推动和牵引。
很多企业,经常说在寻找云原生的最优解。
答案或许就藏在华为云与华为终端云,这两朵云的合作与协同中。