本土首颗!中国移动发布国内领先的大云磐石DPU芯片!

皇华电子元器件IC供应商 2024-04-29 11:58




自去年ChatGPT发布以来,数据中心的芯片需求迎来了新一轮的上升周期。当中尤其以英伟达GPU的表现最为亮眼。与此同时,作为芯片最终买家的云厂商也开始以自研或跟芯片厂商合作的方式涉足数据中心核心芯片的开发。

美国的亚马逊云(AWS)2017年最先实现了DPU芯片(AWS称之为Nitro)的商业化成功部署,AWS在使用自研DPU芯片后,使其实现了巨大收益;谷歌依托于自身对业务的深刻理解及与Broadcom等芯片公司的紧密合作,成功迭代和推出了多代自研TPU芯片。

近日,国内的“云大户”中国移动也带来自己的DPU芯片“磐石”——本土首颗400Gbps带宽的DPU ASIC芯片,实现关键技术自主可控。考虑到DPU对数据中心和云业务的重要性,相信这将为近年来大力发展云业务的中国移动打下夯实基础,并为其带来独特的竞争力。


DPU,第三颗主力芯片


所谓DPU(Data Processing Unit),也就是数据处理单元。顾名思义,这是一种专门为数据处理而设计的芯片。作为继CPU、GPU以外的第三颗主力芯片, DPU成为了几乎所有云厂商甚至海外芯片巨头的关注目标。例如英伟达耗资69亿美元收购Mellanox,AMD花费19亿美元收购Pensando ,就是为了DPU。

由中国移动协同云豹智能和信通院联合撰写的DPU白皮书《云计算通用可编程DPU发展白皮书(2023年)》中指出:“随着人类生产力进入算力时代,传统以 CPU 为核心的架构正在遭受算力瓶颈考验,多样化算力需求亟需软硬件架构全面变革,算力技术发展必将遵循‘软件定义一切,硬件加速一切’的理念,重构算力基础设施,通用可编程加速单元 DPU 将成为新的算力核心,重新定义算力时代云计算技术新标准,构建算力时代新技术曲线。”

但其实在DPU面世以前,这款芯片还是经历了几代的变迁。

在一开始的时候,数据中心的数据处理工作都是由CPU完成,而网络传输任务则由专门的传统基础网卡NIC(又称网络接口卡)处理。具体工作流程就是NIC将用户需要传输的数据转换为网络设备能够识别的格式,然后把数据交由CPU处理。

但随着网络规模的不断增加和新需求的不断出现,网络和存储的数据量不断增加,进而驱动数据中心中的网卡端口速率从 10G 快速向 25G、100G甚至200G 及以上演进,给CPU带来新的压力。这个时候,一种旨在减轻 CPU 的部分处理负载,进一步提高数据中心效率的智能网卡(SmartNIC)就进入了大众的视野。据了解,智能网卡 SmartNIC 除了具备传统基础网卡的网络传输功能外,还提供一定的硬件卸载和加速能力,释放主机 CPU的部分计算资源。

然而,在后续的发展中,SmartNIC也捉襟见肘。例如,因为没有包含通用处理器 CPU,意味着仍然需要主机 CPU进行控制面管理及网络和存储等协议的大部分处理,继续消耗大量主机Host资源。而且,随着数据中心网络速率向100G及200G甚至更高速率的不断提高,主机不但仍会消耗大量宝贵的通用CPU资源对流量进行分类、跟踪和控制,而且其性能也已经无法满足更高网络速率及存储带宽的需求。

于是,如何实现主机 CPU 的“零消耗”及解锁数据中心向更大规模及更高带宽的演进,成了云厂商下一步的研究方向,DPU也应运而生。

从设计上看,DPU通过在硬件架构上增加通用处理单元CPU和丰富的硬件加速单元,从而便于实现对网络、存储、安全和管控等通用基础设施的加速和全卸载。其产品形态主要有NP/MP+CPU,FPGA+CPU和单芯片ASIC方案。据了解,在发展早期,基于FPGA的可编程性的FPGA+CPU多芯片方案成为了行业首选。

除了亚马逊以外,大部分云厂商尤其是国内的云厂商,如:阿里、腾讯、百度等,都用的传统FPGA+CPU方案,其竞争压力也随之而至。随着带宽流量的进一步增加,拥有价格和性能优势、兼顾专用加速器的优异性能和内嵌通用处理器的灵活性可编程ASIC单芯片方案成为了行业的最终选择,而国内的云厂商也正在寻求从FPGA+CPU方案到ASIC方案的演变,这最终驱使中国移动自研了采用ASIC的DPU芯片“磐石”。


磐石,取得重大突破


从产品应用角度看,如何才称得上一颗有竞争优势的DPU?

在我们看来,它首先应该能够支持高速低时延网络,因为这是这个芯片的首要任务;其次,我们还希望这个DPU能够引入高性能通用多核CPU、可编程硬件加速器,以期在提供可编程性和通用处理能力的同时,还能满足人工智能、分析和安全操作等差异化特定任务的执行。

中国移动的这颗芯片带宽为400Gbps,紧密契合了当前的数据中心高带宽需求,我们可以肯定地说,中国移动“磐石”DPU芯片的成功研发,是我国国产芯片领域取得的重大技术突破。

熟悉的读者应该清楚地知道,数据中心服务器的集成度越来越高。无论是x86还是Arm等架构服务器的CPU芯片,都在向单芯片几百个甚至更多CPU集成,密度都在不断增加;同时,网络存储也正在向基于低时延以太网技术的弹性存储方向发展,这增加了对高带宽低时延以太网的需求;再者,私有云应用程序和虚拟桌面基础设施的增加对网络提出了额外的要求;最后,物联网和边缘的海量数据积累正在增加对网络的带宽要求。

叠加AI带来的新需求,400Gbps汹涌而至,这也让磐石DPU的发布恰逢其时。据介绍,磐石DPU的面世,不但将国产DPU芯片的最高传输速率提升到一个新台阶,也让国内另一运营商基于海外FPGA+CPU多芯片方案的DPU等相形见绌。

值得一提的是,随着该芯片的面世,国产DPU还首次演进到世界顶尖水平——该芯片带宽和全球领先的英伟达BlueField-3 DPU达到同一水平。

据公开资料介绍,磐石DPU芯片拥有400Gbps的数据传输能力,将国产DPU芯片最高传输速率提升一倍,达到全球顶尖水平。该芯片拥有每秒处理百万个数据包的存储能力,远程直接存取数据(RDMA)的时延低至5微秒。同时,还具有低功耗、低成本特性,依托该芯片打造的磐石DPU硬件板卡,较上一代硬件板卡功耗下降50%,成本下降50%。中国移动推出“磐石”DPU芯片以后,无疑将为其云服务带来巨大收益,也将为其客户带来更高性价比的产品方案,这也给国内其他云服务商带来更大的压力。

我们认为,“磐石”DPU芯片将有力推动我国DPU关键技术自主可控、硬件架构持续优化、生态布局不断完善。中国移动在发布会上进一步指出,该芯片将广泛应用于中国移动数据中心建设,支撑通用计算、智能计算等业务场景,为云计算、边缘计算、大数据处理、AI大模型训练等领域提供更安全、可靠、高效的技术支持,助力我国大数据、人工智能、算力网络高速发展。

众所周知,打造一个DPU ASIC并不是一件很容易的事情,这也是为何大部分厂商基于FPGA打造相关解决方案。从目前看来,与ASIC的方案相比,基于FPGA的多芯片方案功耗高、成本高,且对用户的研发要求高、人力投入大,还不能灵活移植各种应用。更重要的是,这些方案采用的高性能FPGA芯片及配合的CPU芯片均是由海外厂商提供。

这就让中国移动协同生态伙伴自研的这颗400Gbps国产DPU芯片,在国家大力发展新质生产力战略上显得更有意义。


写在最后


作为国内领先的运营商,中国移动在过去几年频频通过旗下的企业投身芯片自研。

例如在2023年6月,中国移动旗下的中移物联正式发布全球首颗RISC-V架构的LTE-Cat.1芯片(CM8610 LTE-Cat.1芯片)和中国移动首颗量产的蜂窝物联网通信芯片(CM6620 NB-IoT芯片;当年八月,中国移动又发布了一颗核心自主创新成果“破风8676”可重构5G射频收发芯片。按照中国移动的描述,这些芯片不但能够提升公司产品的性能表现,同时还为国内自主可控事业添砖加瓦。

在“磐石”DPU面世后,中国移动的自研芯片业务又上了一个新台阶。期待他们在未来给我们带来更多的惊喜。

备注:文章来源于网络,版权归原作者所有,信息仅供参考,不代表此公众号观点,如有侵权请联系删除!


———— /END / ————



往期推荐

特斯拉季度交付量近四年来首次下降


与英特尔合作,联电进军美国生产12nm成熟芯片


中国台湾7.3级大地震:台积电、联电等部分厂区人员疏散


ROHM 6432尺寸金属板分流电阻器“PMR100”新增3款超低阻值产品!




关于AMEYA360


AMEYA360商城(www.ameya360.com)上线于2011年,现有超过3500家优质供应商,收录600万种产品型号数据,100多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+连接器等多个领域,平台主营业务涵盖电子元器件现货销售、BOM配单及提供产品配套资料等,为广大客户提供一站式购销服务。



点击下方“阅读原文”,询价吧! 

皇华电子元器件IC供应商 上海皇华信息科技有限公司研发方案部门,由多名实力雄厚的硬件、软件工程师组成,提供基于飞思卡尔(freescale)、安霸(Ambarella)、瑞芯微、NXP等最新ARM平台的产品级解决方案。同时我们也为客户提供完全定制化服务
评论 (0)
  • 温度传感器的工作原理依据其类型可分为以下几种主要形式:一、热电阻温度传感器利用金属或半导体材料的电阻值随温度变化的特性实现测温:l ‌金属热电阻‌(如铂电阻 Pt100、Pt1000):高温下电阻值呈线性增长,稳定性高,适用于工业精密测温。l ‌热敏电阻‌(NTC/PTC):NTC 热敏电阻阻值随温度升高而下降,PTC 则相反;灵敏度高但线性范围较窄,常用于电子设备温控。二、热电偶传感器基于‌塞贝克效应‌(Seebeck effect):两种不同
    锦正茂科技 2025-05-09 13:31 136浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 452浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 552浏览
  • 硅二极管温度传感器是一种基于硅半导体材料特性的测温装置,其核心原理是利用硅二极管的电学参数(如正向压降或电阻)随温度变化的特性实现温度检测。以下是其工作原理、技术特点及典型应用:一、工作原理1、‌PN结温度特性‌硅二极管由PN结构成,当温度变化时,其正向电压 VF与温度呈线性负相关关系。例如,温度每升高1℃,VF约下降2 mV。2、‌电压—温度关系‌通过jing确测量正向电压的微小变化,可推算出环境温度值。部分型号(如SI410)在宽温域内(如1.4 K至475 K)仍能保持高线性度。
    锦正茂科技 2025-05-09 13:52 152浏览
  • 后摄像头是长这个样子,如下图。5孔(D-,D+,5V,12V,GND),说的是连接线的个数,如下图。4LED,+12V驱动4颗LED灯珠,给摄像头补光用的,如下图。打开后盖,发现里面有透明白胶(防水)和白色硬胶(固定),用合适的工具,清理其中的胶状物。BOT层,AN3860,Panasonic Semiconductor (松下电器)制造的,Cylinder Motor Driver IC for Video Camera,如下图。TOP层,感光芯片和广角聚焦镜头组合,如下图。感光芯片,看着是玻
    liweicheng 2025-05-07 23:55 335浏览
  • 文/郭楚妤编辑/cc孙聪颖‍相较于一众措辞谨慎、毫无掌舵者个人风格的上市公司财报,利亚德的财报显得尤为另类。利亚德光电集团成立于1995年,是一家以LED显示、液晶显示产品设计、生产、销售及服务为主业的高新技术企业。自2016年年报起,无论业绩优劣,董事长李军每年都会在财报末尾附上一首七言打油诗,抒发其对公司当年业绩的感悟。从“三年翻番顺大势”“智能显示我第一”“披荆斩棘幸从容”等词句中,不难窥见李军的雄心壮志。2012年,利亚德(300296.SZ)在深交所创业板上市。成立以来,该公司在细分领
    华尔街科技眼 2025-05-07 19:25 366浏览
  • 飞凌嵌入式作为龙芯合作伙伴,隆重推出FET-2K0300i-S全国产自主可控工业级核心板!FET-2K0300i-S核心板基于龙芯2K0300i工业级处理器开发设计,集成1个64位LA264处理器,主频1GHz,提供高效的计算能力;支持硬件ECC;2K0300i还具备丰富的连接接口USB、SDIO、UART、SPI、CAN-FD、Ethernet、ADC等一应俱全,龙芯2K0300i支持四路CAN-FD接口,具备良好的可靠性、实时性和灵活性,可满足用户多路CAN需求。除性价比超高的国产处理器外,
    飞凌嵌入式 2025-05-07 11:54 78浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 190浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 287浏览
  • Matter协议是一个由Amazon Alexa、Apple HomeKit、Google Home和Samsung SmartThings等全球科技巨头与CSA联盟共同制定的开放性标准,它就像一份“共生契约”,能让原本相互独立的家居生态在应用层上握手共存,同时它并非另起炉灶,而是以IP(互联网协议)为基础框架,将不同通信协议下的家居设备统一到同一套“语义规则”之下。作为应用层上的互通标准,Matter协议正在重新定义智能家居行业的运行逻辑,它不仅能向下屏蔽家居设备制造商的生态和系统,让设备、平
    华普微HOPERF 2025-05-08 11:40 300浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦