“云计算进入了一个关键的突破期,如果我们定义好下一代技术,中国云计算就有超车机会。” 在2022年阿里云峰会上,阿里云智能总裁张建锋表示,阿里云今年最重要策略是“B2B”,也就是“Back to Basic”,回到云计算的本质,坚持在技术的长征路上,不断取得新的突破。
在本次峰会上,阿里云发布了一款云数据中心专用处理器CIPU,其不仅架构全自研,还号称要“替代CPU成为新一代云计算核心硬件”!CIPU可对计算资源进行云化加速,并可部署飞天操作系统对云资源进行管控。
目前,数字化转型已被国家作为十四五规划的重要内容,可以说已经上升为国家战略层面高度。而国家发改委、中央网信办则提出了“上云用数赋智”的数字化转型具体实施方案。由此可见,应用上云是数字化转型的重要标志。
CIPU是什么?
CIPU全称Cloud Infrastructure Processing Units,意为云基础设施处理器,专门用于连接服务器内硬件和云上虚拟化资源。张建锋介绍,CIPU向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器:
CIPU与计算结合:快速接入不同类型资源的服务器,带来算力的“0”损耗,以及硬件级安全的加固隔离;
CIPU与存储结合:对存算分离架构的块存储接入进行硬件加速,云盘存储IOPS最高可达300万,长尾时延降低50%;
CIPU与网络结合:可对高带宽物理网络进行硬件加速,构建大规模弹性RDMA高性能网络,时延最低可达5us。
同时,根据阿里云相关介绍,基于CIPU和飞天的新一代云计算架构体系,在通用计算、大数据、人工智能等核心场景的计算测试中展现了优越的性能,主要体现在以下几个方面:
1.在通用分布式计算领域,Redis性能提升了68%、MySQL提升了60%,Nginx提升了30%;2.高吞吐类的互联网业务上云之后,比自建物理机的集群吞吐量提升了30%,业务高峰期延迟下降了90%;3.在大数据和AI等计算与数据双密集场景下,相比传统的TCP网络,弹性RDMA高性能网络的吞吐能力提升30%以上;4.云原生方面,容器启动速度快了350%,在Serverless 场景下6秒可拉起3000个弹性容器实例。
据悉,该处理器既可无缝连接阿里云自研的飞天云操作系统,又可以对数据中心的计算、存储和网络资源做出及时云化的处理。
中国工程院院士、清华大学郑纬民教授评价道:“CIPU完全打破了上一代计算架构,在基础技术上实现了世界领先的云数据中心专用处理器。”
云计算进入“云原生”阶段
十多年来,云计算不断发展,已经历了三个重要发展阶段。
张建锋认为,云计算技术的第一阶段是分布式和虚拟化技术替代了大型机,满足了当时企业所需的算力规模;第二阶段出现了资源池化技术,把计算和存储资源分离,再规模化编排和调度,提供了超大规模的计算和存储资源池。
他表示,这两个阶段的演进推动云计算发展,但它们都是通过软件定义的方法,基于传统的以CPU为中心的体系架构去做优化,已经触及瓶颈。近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系架构去满足。
实际上,为了解决这一问题,阿里云相关研发团队早在 2015 年就开始技术攻关,并于 2017 年推出业内首款虚拟化损耗为零的神龙云服务器。经过多年自研迭代,神龙、弹性 RDMA 等核心技术不断深入垂直整合,演进出以 CIPU 为中心的全新架构形态,云计算开始进入第三阶段。在新的发展阶段,云计算关注的是云原生以及业务的重构,逐步纵向扩展应用分层架构体系,向分布式无状态的架构演进,从而使得IT在支撑企业业务敏捷化、智能化以及提升资源利用效率方面达到新的高度。
张建锋表示,新一代的云计算要从数据中心的内部做体系化创新,从以往的以CPU为中心的体系架构,进入以CIPU为中心的体系架构。
有行业人士表示,目前CIPU已经在阿里云内部有较大规模的应用,为双11、阿里集团业务等内部客户和最新实例提供支撑。对客户来说,CIPU带来的变化立竿见影:云服务的性能更高、更稳定可靠,整体性价比大幅提升。
CIPU引领新一代云计算体系
云计算的最大优势是为企业提供了提升IT灵活性的手段,同时能够有效降低企业的运作成本。在企业数字化转型逐步深入的背景下,可以预见未来几乎所有的互联网应用和企业应用都将运行在云上。
而且,云计算已经不再是单纯地提供计算能力,而是逐渐成为了一个包含了基础设施、运算平台乃至整套管理、软件解决方案的庞大体系,成为很多新型ICT技术发展的底层技术和基础。无论是大数据、VR/AR还是人工智能,或者是无人驾驶汽车、物联网、区块链等,这些新技术的发展和应用都将与云计算密不可分。
有人认为,这种趋势是普遍性的,不仅仅局限在某些高端制造领域,而是渗入生活的方方面面,把生活融入芯片,极大提高效率降低相关数字化的成本。未来,一个灯泡、一个插座、一个窗帘都是有芯片控制的,量级实在太大了,大有可为。
张建锋强调,阿里云是全球支持CPU种类最多的云厂商,基于“一云多芯”战略对X86、ARM、Risc-V等多种架构进行适配,兼容飞腾、鲲鹏、AMD、Ampere等多种CPU,形成标准形态的算力输出。与此同时,阿里云还针对云计算大规模、高并发特性,推出自研CPU芯片倚天710。目前倚天710已在阿里云数据中心内部规模化部署,并顺利支撑2021年双11等多个核心业务。今年4月,基于倚天710的公共云ECS实例已上线邀测。
阿里一直在致力于云计算等前端技术的研发和平台部署,现在发布CIPU处理器,是更上一层楼。而CIPU让整个云数据中心内的服务器形态以“CIPU+飞天”为中心,各项性能远超国际最先进水平。Gartner最新数据显示,2021年阿里云在全球云计算市场中排名第三、亚太市场排名第一;全球市场份额为9.55%。
参考资料:
1.《阿里云张建锋:Back to Basic,定义下一代的云》,阿里云
2.《刚刚,阿里云亮出杀手锏CIPU,云操作系统的最强搭档》,智东西
3.《阿里云发布云数据中心处理器CIPU,替代CPU成为云时代IDC的处理核心》,AI前线
- 作者很帅