DPU全球格局,国内5家崛起(2023)

智能计算芯世界 2023-03-30 00:01

——文末附智能网卡DPU专题下载——

38份DPU专业报告

DPU 行业市场集中度较高。根据头豹研究院数据,近年来国内 DPU 市场中,国际三大巨头英伟达,博通,Intel 的份额分别达到 55%、36%、9%。但国内DPU厂商也逐渐崛起,本文重点介绍星云智联、大禹智芯、云脉芯联、芯启源中科驭数。
关于DPU技术应用及技术原理,请参看文章“DPU技术原理、算力效率及应用场景解析”和“主流DPU架构实现及技术对比”、“DPU性能基准:测评框架与测试流程介绍(2022)”。

国际上,Nvidia、Intel、Xilinx、Marvell、Broadcom、Pensando、Fungible、Amazon、Microsoft 等多家厂商在近 2-5 年内均有 DPU 或相似架构产品生产,较国内相对较早。国内厂商中,华为,阿里,百度,腾讯也在近几年针对自身服务器进行自研与外购 DPU,针对的主要功能在于数据,存储与安全方面。

1、英伟达:具备先发优势,其 BlueField 系列芯片已到达第三代

BlueField 2 搭载 8 颗 64 bit 的 ARM A72 CPU 内核,2VLIM 加速器和ConnectX6Dx 智能网卡,可以提供双端口最高 100Gbps 和单端口 200Gbps 的网络连接。Blue Field 可以快速有效地捕获、分析、分类、管理和存储海量数据,实现 RDMA/RoCE、DPU Direct、弹性存储、分块存储加密和恶意外部应用自动检测等功能,从而实现单颗 DPU 芯片对 125 个 CPU 内核的释放。BlueField2X在此基础上集成了 2021 年 5 月发布的 7nm 级 Ampere 架构。

GPU 和第三代 Tensor 内核,可通过 AI 加速数据中心的安全、网络连接、数据存储等任务。此外,英伟达还发布了面向开发者的平台 DOCA SDK,通过集成Ampere GPU 和 BlueField2 DPU 优化 EGXAI 平台,向流媒体、智能驾驶、医疗等终端场景扩展。BlueField 3 已在 2022 年发布。

根据深科技数据,英伟达预计 BlueField4 将于 2023 年发布,预计性能可提升 600 倍,达到 75/400TOPS,400Gbps,吞吐量有望较 BlueField2 提升 600倍。英伟达希望凭借 GPU 和 Mellanox 智能网卡技术壁垒的协同效应,再辅以Arm 处理器整合协同后的性能提升,有望进一步抗衡英特尔/AMD 的 x86CPU 体系。

2、星云智联:首款DPU产品NebulaX D1055AS发布

根据《2021-2022 年中国人工智能创投数据报告》数据,星云智联创立于 2021年 3 月,汇聚了来自硅谷、以色列、加拿大等地 ICT 领域顶尖专家,专注于数据中心基础互联通信架构和 DPU 芯片研发,致力于构建数字世界算力的智能连接和开放生态,让云计算和数据中心成为构建未来数字社会的坚实基础。
根据星云智联官方数据,星云智联首款 DPU 产品 NebulaX D1055AS 已于2021 年 7 月发布,该产品是国内首款全硬加速、超强转发、极简运维的 DPU 产品。NebulaX D1055AS 聚焦云计算的裸金属、虚机、容器等场景,实现网络与存储卸载与加速,提升业务性能,节省主机 CPU,简化 IaaS 运维。可广泛用于互联网、公有云、运营商、政企与行业的云基础设施。产品为 PCIe 插卡形态,安装于标准服务器内运行,产品功能包括数据面和管控面两部分。

根据星云智联官方数据,管控面采用通用的 CPU+Linux 架构,其中 DPU OS上运行了 OVS 控制面、弹性块存储客户端 EBS-Client、管理监控等软件,支持带外管理网口,通过管理网络对接云平台。这个架构拥有极好的软件生态兼容性,用户可按需安装部署相应的管理和应用软件,比如 OpenStack Agent,K8S Kubelet等 IaaS/PaaS 应用,也可移植现有云基础设施中的软件到 DPU OS 上运行。这种开放的管控面架构,简化了 DPU 与用户云管控平台集成,加速定制化 DPU 新功能开发上线。

3、大禹智芯:Paratus 2.0 具备强大的软件开放性

Paratus 1.0 作为大禹智芯 DPU 的第一条产品线产品,采用 ARM SoC 作为主处理单元,提供多个 10Gbps/25Gbps 的业务网络接口,同时为了方便用户管理,单独设置了 RJ45 管理口。
Paratus 2.0 作为大禹智芯 DPU 的第二条产品线产品,已于 2022 年 10 月发布,采用 ARM SoC + FPGA 的硬件架构,在 Paratus 1.0 产品基础上,利用 FPGA对可固化逻辑的数据包实现高性能转发,提供多个 10G/25G、100G 的业务网络接口。
大禹智芯 DPU 产品 Paratus 2.0 具备强大的软件开放性,支持 VirtIO 来增强虚拟化环境下的适配性,能够灵活呈现大规模主机侧功能,可以实现包括 OVS 全卸载、存储客户端(Storage Initiator)的全卸载及 NVMe 模拟等多种功能,还能为存储服务端(Storage Target)提供数据处理服务加速。此外,Paratus 2.0的自研高性能网络传输协议可进一步支持 RDMA 应用;大禹智芯充分考虑了用户使用管理需求,在 Paratus 2.0 系统产品中还提供了云管平台对接的插件、独立的BMC 模块,使用户能方便地实现云环境下业务的自动化部署、带外管理能力及与服务器更好的联动,达到 Paratus 2.0 在实际使用中与用户管控平台的有机结合。

4、云脉芯联:打造自主研发多场景 RDMA DPU产品

2022 年 5 月 31 日,云脉芯联正式发布自主研发的国内首款多场景 RDMA 智能网卡(DPU)产品——xFusion50。xFusion50 是云脉芯联成功自主研发的第一款产品,也是国内首款实现包括支持端到端拥塞控制完整 RDMA 功能的 DPU 产品,xFusion50 基于硬件实现的可编程拥塞控制算法能够有效避免网络拥塞,充分发挥 RDMA 技术的低延迟和高性能,支持云计算、高性能计算、AI、存储集群全场景部署。xFusion50 产品具有以下核心亮点:
第一,支持可编程拥塞控制算法,可编程拥塞控制算法是实现端到端无损网络的关键技术;还可以通过开放可编程的底层网络接口,可根据客户的组网特点和上层业务的需求,灵活支持多种拥塞控制算法,最大化业务的流量吞吐。
第二,通过自主研发 HyperDirect 技术支持 GPU Direct RDMA 为跨计算节点的 GPU 实现远程内存直接访问,跳过 CPU 以降低时延、提升带宽,提升分布式异构算力集群的整体效能。
第三,支持网络/存储全场景卸载加速,支持 vSwitch 全卸载,实现云上 VPC网络全功能;支持存储卸载,对接分布式存储 NVMe-oF(TCP/RDMA),充分释放宿主机 CPU 资源。并通过支持 VirtIO 实现弹性网络和弹性存储,满足云上用户无缝迁移和快速恢复的业务诉求。

5、芯启源:自主知识产权,可扩展Chiplet 等方向

芯启源具有完全自主知识产权的 DPU 芯片。芯启源 DPU 较传统智能网卡提供了更大的处理能力、更强的灵活性、可编程数据包处理、可扩展 Chiplet(小芯片)结构等特性。采用 NP-SoC 模式进行芯片设计,通用 ARM 架构结合高度优化面向数据包的 NP 芯片(RISC-V 内核)、多线程的处理模式,使其可以达到 ASIC 固化芯片的数据处理能力,同时考虑到了全量可编程、灵活可扩展的属性,用以支持400Gbps 及以上的性能目标、低功率且具有成本效益等。
芯启源 DPU 架构中采用的 Chiplet(小芯片)技术是一种全新的芯片设计方式,也是业内众多企业正在引入的关键芯片技术。Chiplet 将满足特定功能的 Die(裸片)通过 Die-To-Die 内部互联技术实现多个模块芯片与底层基础芯片封装在一起,形成一个系统芯片。Chiplet 技术将原本一块复杂的 SoC 芯片分解为芯粒,类似模块化设计,有利于缩短产品商用时间和后续产品的迭代,同时通过支持与第三方芯片的 Die-To-Die 互联,还可以集成更多的特定专业领域的芯片。在性能和功能丰富度有飞跃式提升外,也为芯启源的客户提供更多业务场景的支持能力。

6、中科驭数:目前已开始第三代 DPU 芯片研发

中科驭数基于自研敏捷异构 KPU 芯片架构以及 DPU 软件开发平台 HADOS,公司自主研发了业界首颗融合高性能网络与数据库一体化加速功能的 DPU芯片和标准加速卡系列产品,可广泛应用于超低延迟网络、大数据处理、5G 边缘计算、高速存储等场景,助力算力成为数字时代的新生产力。
在 DPU 产品的研发迭代方面,中科驭数于 2019 年流片了第一代 DPU 芯片K1,第二代 DPU 芯片 K2 也于 2022 年初成功投片,目前已开始第三代 DPU 芯片 K2 Pro 的研发工作;2021 年 9 月,中科驭数首发 DPU 加速卡产品,其时延达到业界领先的 1.2 微秒。另外也有 DPU 存储加速卡、DPU 数据计算加速卡等产品和解决方案在研发进程中。在产品核心技术特色方面,中科驭数的 DPU 芯片创新性地采用软件定义加速器技术路线,实现了软硬协同的 DPU 设计方案。具体创新点如下:
高效的异构众核 DPU 架构,基于软件定义加速器路线,研发了异构众核 DPU芯片设计方法,解决了多核互联、计算调度、指令控制等核心问题。

超高带宽网络协议处理,研发专用网络协议处理核和大数据分析处理核,解决了软件解析网络包协议解析和数据处理的瓶颈,大大提升服务器间通信效率,提升数据中心水平扩展能力。统一的虚拟化硬件平台,针对数据中心网络、计算、存储融合的虚拟化需求,研究统一高效的硬件设备虚拟化架构,解决现有方案单一虚拟化功能的窘境(仅支持网络虚拟化),充分释放 DPU 各类资源能力,更高效支撑复杂上层应用。统一的 DPU 软件开发框架 HADOS,解决现有编程框架碎片化的问题,使得应用部署更加简单高效。

下载链接:

《38份智能网卡和DPU合集》

1、计算机行业:DPU,第三颗主力芯片(2022)
2、SmartNIC DPU技术白皮书
3、中国DPU行业发展白皮书
4、DPU发展分析报告(2022年)
5、NVIDIA DPU数据处理器架构介绍
6、中国移动DPU技术白皮书(2022)
7、ChatGPT推高算力需求,DPU支撑算力效率提升
8、2022年中国DPU行业白皮书
9、DPU发展分析报告(2022年)
10、专用数据处理器(DPU)性能基准评测方法与实现(2022)
11、网络计算及DPU在数据中心和边缘云上的应用
.......
21、专用数据处理器 (DPU)技术白皮书
22、中国DPU行业发展白皮书(2021)
23、DPU技术创新赋能5G与数据中心
24、 DPU驱动数据中心成为计算单元
25、运营商智能网卡部署场景探索及思考
26、Fungible DPU处理器
27、OCTEON DPU产品介绍
28、基于DPU的硬件加速:软件
29、2021年中国数据处理器(DPU)行业概览
30、中国数据处理器行业系列(一)
31、中国数据处理器行业系列(二)
......

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。


电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。


获取方式:点击“小程序链接”即可查看182页 PPT可编辑版本和PDF阅读版本详情。

服务器基础知识全解PPT(终极版)

服务器基础知识全解PDF(终极版)



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。

智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 一个易用且轻量化的UI可以大大提高用户的使用效率和满意度——通过快速启动、直观操作和及时反馈,帮助用户快速上手并高效完成任务;轻量化设计则可以减少资源占用,提升启动和运行速度,增强产品竞争力。LVGL(Light and Versatile Graphics Library)是一个免费开源的图形库,专为嵌入式系统设计。它以轻量级、高效和易于使用而著称,支持多种屏幕分辨率和硬件配置,并提供了丰富的GUI组件,能够帮助开发者轻松构建出美观且功能强大的用户界面。近期,飞凌嵌入式为基于NXP i.MX9
    飞凌嵌入式 2025-01-16 13:15 125浏览
  • 实用性高值得收藏!! (时源芯微)时源专注于EMC整改与服务,配备完整器件 TVS全称Transient Voltage Suppre,亦称TVS管、瞬态抑制二极管等,有单向和双向之分。单向TVS 一般应用于直流供电电路,双向TVS 应用于电压交变的电路。在直流电路的应用中,TVS被并联接入电路中。在电路处于正常运行状态时,TVS会保持截止状态,从而不对电路的正常工作产生任何影响。然而,一旦电路中出现异常的过电压,并且这个电压达到TVS的击穿阈值时,TVS的状态就会
    时源芯微 2025-01-16 14:23 128浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 73浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 65浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 68浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 88浏览
  • 随着智慧科技的快速发展,智能显示器的生态圈应用变得越来越丰富多元,智能显示器不仅仅是传统的显示设备,透过结合人工智能(AI)和语音助理,它还可以成为家庭、办公室和商业环境中的核心互动接口。提供多元且个性化的服务,如智能家居控制、影音串流拨放、实时信息显示等,极大提升了使用体验。此外,智能家居系统的整合能力也不容小觑,透过智能装置之间的无缝连接,形成了强大的多元应用生态圈。企业也利用智能显示器进行会议展示和多方远程合作,大大提高效率和互动性。Smart Display Ecosystem示意图,作
    百佳泰测试实验室 2025-01-16 15:37 132浏览
  • 近期,智能家居领域Matter标准的制定者,全球最具影响力的科技联盟之一,连接标准联盟(Connectivity Standards Alliance,简称CSA)“利好”频出,不仅为智能家居领域的设备制造商们提供了更为快速便捷的Matter认证流程,而且苹果、三星与谷歌等智能家居平台厂商都表示会接纳CSA的Matter认证体系,并计划将其整合至各自的“Works with”项目中。那么,在本轮“利好”背景下,智能家居的设备制造商们该如何捉住机会,“掘金”万亿市场呢?重认证快通道计划,为家居设备
    华普微HOPERF 2025-01-16 10:22 134浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 177浏览
  • 晶台光耦KL817和KL3053在小家电产品(如微波炉等)辅助电源中的广泛应用。具备小功率、高性能、高度集成以及低待机功耗的特点,同时支持宽输入电压范围。▲光耦在实物应用中的产品图其一次侧集成了交流电压过零检测与信号输出功能,该功能产生的过零信号可用于精确控制继电器、可控硅等器件的过零开关动作,从而有效减小开关应力,显著提升器件的使用寿命。通过高度的集成化和先进的控制技术,该电源大幅减少了所需的外围器件数量,不仅降低了系统成本和体积,还进一步增强了整体的可靠性。▲电路示意图该电路的过零检测信号由
    晶台光耦 2025-01-16 10:12 84浏览
  • 百佳泰特为您整理2025年1月各大Logo的最新规格信息,本月有更新信息的logo有HDMI、Wi-Fi、Bluetooth、DisplayHDR、ClearMR、Intel EVO。HDMI®▶ 2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新规范将支持更高的分辨率和刷新率,并提供更多高质量选项。更快的96Gbps 带宽可满足数据密集型沉浸式和虚拟应用对传输的要求,如 AR/VR/MR、空间现实和光场显示,以及各种商业应用,如大型数字标牌、医疗成像和
    百佳泰测试实验室 2025-01-16 15:41 128浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦