分析丨UALinkVS英伟达的AI网络的博弈是一场一对多游戏?

原创 AI芯天下 2025-01-24 20:31

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
2024年10月成立以来,UALink联盟已吸引超过六十五家企业加入,这些企业来自云服务提供商、芯片与知识产权供应商、软件公司、系统原始设备制造商等多个行业。

在这一生态系统中,不同厂商的产品能够实现更佳的协同工作,企业可以根据自身需求选择合适的硬件和软件,而不必受限于单一厂商的技术。


作者 | 方文三
图片来源 |  网 络 


阿里、苹果、新思科技加入UALink联盟


近日,UALink联盟发布官方公告,宣布阿里云、苹果公司以及新思科技已正式加入董事会,共同致力于推动下一代人工智能集群互连技术的发展。


据先前报道,UALink 联盟成立于2024年10月,由AMD、亚马逊AWS、Astera Labs、思科、谷歌、慧与、英特尔、Meta和微软九家知名企业共同发起,旨在联合挑战英伟达在人工智能数据中心互联领域的领先地位。


苹果公司在董事会中的影响力可能会激发公众对于其开发数据中心专用芯片的种种猜想,该芯片预期将利用UALink互连技术为iPhone提供人工智能服务。


UALink 联盟致力于为AI Pod和集群中加速器与交换机之间的纵向扩展通信制定一套高速、低延迟的互联规范,以期在该领域挑战英伟达NVLink等互联技术的主导地位。


该联盟的首个正式版规范UALink 1.0计划于今年向贡献者成员发布,并将于明年第一季度向公众开放审查。


该规范预计将实现AI Pod中最多1024个加速器的每通道扩展连接,达到高达200Gbps的扩展连接速度。


UALink 联盟此次迎来三大行业巨头的加入,标志着UALink技术获得了更广泛的业界支持,有望推动其在人工智能领域的广泛应用。


UALink 联盟主席Kurtis Bowman对新成员的加入表示热烈欢迎,并指出,联盟成员已超过65家,成员类型包括云服务提供商、芯片与IP技术供应商、软件公司以及系统OEM厂商等。


UALink 1.0规范预计将于2025年第一季度正式发布,届时将支持每通道高达200Gbps的扩展连接,最多可在AI Pod内连接1024个加速器。



UALink与英伟达的实力较量


①性能对决:在数据传输速率方面,英伟达的 NVLink 技术始终占据行业领先地位。


以第五代 NVLink 为例,单个NVIDIA Blackwell Tensor Core GPU支持高达18 个NVLink 100GB/s 连接,总带宽达到 1.8TB/s,这一成就在相当长的一段时间内是业界难以超越的。


然而,UALink 1.0 的问世打破了这一局面。


据 TechCrunch 报道,UALink 1.0 计划通过单个计算 Pod 连接多达1024个AI芯片,并且单个通道速率可达 200Gbps,在大规模芯片互联的场景下,其总带宽能力令人瞩目。


在处理大规模深度学习模型训练时,大量模型参数需要在芯片间迅速传输,UALink 1.0 的UALink作为新一代AI/ML集群性能的高速加速器互连技术,以其低延迟和高带宽特性著称。


原生支持高性能内存语义访问,与GPU等AI加速器的编程模型高度兼容,能在单一超节点内实现大规模AI计算节点的互连。


UALink的优势还体现在显存共享、支持Switch组网模式以及其超高的带宽和极低的时延性能上。


该技术规范定义了一种创新的I/O架构,单通道传输速率可达200 Gbps,支持多达1024个AI加速器的互连。


相较于传统以太网(Ethernet)架构,UALink在性能和GPU互连规模方面均展现出显著优势,其互连规模远超Nvidia NVLink技术。


以Dell PowerEdge XE9680服务器为例,单台服务器最多可支持8块AMD Instinct或Nvidia HGX GPU。


采用UALink技术后,可实现百台级服务器集群内GPU的直接低延迟访问。


更为重要的是,UALink在加速器、交换芯片、Retimer等互连技术上保持中立,不偏袒任何特定厂商,致力于构建一个开放创新的技术生态系统。



②生态系统之争:凭借在GPU领域的深厚积累及市场领导地位,英伟达构建了一个庞大且成熟的生态系统。


其CUDA平台作为该生态系统的基石,向开发者提供了广泛的开发工具和库,使得他们能够利用英伟达的GPU和NVLink技术进行高效的应用开发。


在COMPUTEX 2023大会上,英伟达透露,CUDA平台已拥有超过四百万的开发者,三千多个应用程序,以及高达四千万次的历史下载量。


众多企业和开发者基于英伟达的生态系统,进行深度学习、数据分析等应用的开发,形成了显著的用户粘性。



相对而言,UALink的生态系统尚处于成长阶段,但其开放标准的策略已吸引了众多企业的参与。


对于数据中心运营商而言,他们将拥有更多元化的选择,不再受限于英伟达的技术和产品,从而能够根据自身需求和预算,灵活选择最适宜的互联技术和硬件设备。


这将有助于降低数据中心的建设成本,提升服务质量和效率,推动整个数据中心行业的健康发展。


UALink提供了追赶英伟达的机会


尽管英伟达已将NVSwitch应用于NVIDIA DGX GB200 NVL72等产品,但AI加速器市场并非仅由英伟达一家独占。


例如,英特尔今年已销售数亿美元、数万个AI加速器,而AMD今年也将销售数十亿美元的MI300X。


拥有UALink技术后,Broadcom等公司能够生产UALink交换机,以协助其他公司扩展规模,并在多家公司的加速器中使用这些交换机。


目前,UALink已成为最具潜力的AI服务器Scale UP(纵向/垂直扩展)互连开放标准,并正在迅速构建起一个AI服务器Scale Up互连技术的超级开放生态。


截至11月,UALink联盟已有三十余家厂商加入,并持续扩展;其成员涵盖了云计算和应用、硬件、芯片、IP等产业全生态。


这一变革主要源于超大规模人工智能集群对网络带宽和低延迟需求的增加,导致行业集群规模不断扩大。



网络连接成为释放AI集群性能潜力的关键因素


在规模较小的人工智能集群中,例如包含10万个XPU的集群,网络连接的价值量占比大约为XPU总价值的5%至10%。


然而,当人工智能集群规模增长至50万至100万个XPU时,该比例显著上升至15%至20%的价值占比。


预计到2025年,北美四大超级云服务提供商的资本开支将增至3150亿美元,较前一年增长46%,资本开支的同比增速保持在高位,显示出对算力需求市场的乐观态度。


因此,建立更大规模的人工智能集群已成为海外超级云服务提供商的共同战略。


目前,英伟达的专有网络连接技术NVLink+InfiniBand,已成为其软件生态CUDA之外的硬件护城河。


面对英伟达芯片算力的垄断,行业正寻求突破,特别是随着全球推理业务需求的首次增长以及定制芯片ASIC市场份额的持续扩大,为行业打破英伟达垄断提供了极佳的时机。



结尾:


芯片领域的竞争实质上是软件生态系统之间的较量,这也是业界试图通过网络硬件技术如NVLink打破英伟达市场主导地位的关键所在。


显而易见,当前业界两大阵营,即UALink和超以太网联盟UEC,正分别针对NVLink和InfiniBand进行技术突破。


回顾历史,从挖矿时代专用集成电路ASIC的崛起,逐渐取代了通用图形处理单元GPU成为挖矿的主要力量,到如今人工智能计算芯片ASIC的再次兴起;


业界联盟正率先通过网络硬件技术如NVLink来突破英伟达的市场垄断,历史似乎正准备再次重演。


部分资料参考:半导体行业观察:《NVLink迎来劲敌:九大巨头,正式成立UALink联盟》,阿里云:《阿里云当选UALink联盟董事会成员,推进新一代GPU互连技术》,Synopsys:《如何利用业界首发的超以太网和UALink IP,高效互连技术扩展HPC和AI加速器生态系统》,电子工程世界:《英伟达的筹码,又少了一枚》,新财富:《英伟达还能走多远》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。




END


推荐阅读:


商务合作请加微信勾搭:
18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  • 政策驱动,AVAS成新能源车安全刚需随着全球碳中和目标的推进,新能源汽车产业迎来爆发式增长。据统计,2023年中国新能源汽车渗透率已突破35%,而欧盟法规明确要求2024年后新能效车型必须配备低速提示音系统(AVAS)。在此背景下,低速报警器作为车辆主动安全的核心组件,其技术性能直接关乎行人安全与法规合规性。基于WT2003H芯片开发的AVAS解决方案,以高可靠性、强定制化能力及智能场景适配特性,正成为行业技术升级的新标杆。WT2003H方案技术亮点解析全场景音效精准触发方案通过多传感器融合技术
    广州唯创电子 2025-04-10 08:53 141浏览
  • 行业变局:从机械仪表到智能交互终端的跃迁全球两轮电动车市场正经历从“功能机”向“智能机”的转型浪潮。数据显示,2024年智能电动车仪表盘渗透率已突破42%,而传统LED仪表因交互单一、扩展性差等问题,难以满足以下核心需求:适老化需求:35%中老年用户反映仪表信息辨识困难智能化缺口:78%用户期待仪表盘支持手机互联与语音交互成本敏感度:厂商需在15元以内BOM成本实现功能升级在此背景下,集成语音播报与蓝牙互联的WT2605C-32N芯片方案,以“极简设计+智能交互”重构仪表盘技术生态链。技术破局:
    广州唯创电子 2025-04-11 08:59 33浏览
  •   卫星故障预警系统软件:卫星在轨安全的智能护盾   北京华盛恒辉卫星故障预警系统软件,作为确保卫星在轨安全运行的关键利器,集成前沿的监测、诊断及预警技术,对卫星健康状况予以实时评估,提前预判潜在故障。下面将从核心功能、技术特性、应用场景以及发展走向等方面展开详尽阐述。   应用案例   目前,已有多个卫星故障预警系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润卫星故障预警系统。这些成功案例为卫星故障预警系统的推广和应用提供了有力支持。   核心功能   实时状态监测:
    华盛恒辉l58ll334744 2025-04-09 19:49 133浏览
  • 背景近年来,随着国家对资源、能源有效利用率的要求越来越高,对环境保护和水处理的要求也越来越严格,因此有大量的固液分离问题需要解决。真空过滤器是是由负压形成真空过滤的固液分离机械。用过滤介质把容器分为上、下两层,利用负压,悬浮液加入上腔,在压力作用下通过过滤介质进入下腔成为滤液,悬浮液中的固体颗粒吸附在过滤介质表面形成滤饼,滤液穿过过滤介质经中心轴内部排出,达到固液分离的目的。目前市面上的过滤器多分为间歇操作和连续操作两种。间歇操作的真空过滤机可过滤各种浓度的悬浮液,连续操作的真空过滤机适于过滤含
    宏集科技 2025-04-10 13:45 25浏览
  •   天空卫星健康状况监测维护管理系统:全方位解析  在航天技术迅猛发展的当下,卫星在轨运行的安全与可靠至关重要。整合多种技术,实现对卫星的实时监测、故障诊断、健康评估以及维护决策,有力保障卫星长期稳定运转。  应用案例       系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合就可以找到。  一、系统架构与功能模块  数据采集层  数据处理层  智能分析层  决策支持层  二、关键技术  故障诊断技术  
    华盛恒辉l58ll334744 2025-04-10 15:46 18浏览
  • 文/Leon编辑/侯煜‍关税大战一触即发,当地时间4月9日起,美国开始对中国进口商品征收总计104%的关税。对此,中国外交部回应道:中方绝不接受美方极限施压霸道霸凌,将继续采取坚决有力措施,维护自身正当权益。同时,中国对原产于美国的进口商品加征关税税率,由34%提高至84%。随后,美国总统特朗普在社交媒体宣布,对中国关税立刻提高至125%,并暂缓其他75个国家对等关税90天,在此期间适用于10%的税率。特朗普政府挑起关税大战的目的,实际上是寻求制造业回流至美国。据悉,特朗普政府此次宣布对全球18
    华尔街科技眼 2025-04-10 16:39 22浏览
  • 技术原理:非扫描式全局像的革新Flash激光雷达是一种纯固态激光雷达技术,其核心原理是通过面阵激光瞬时覆盖探测区域,配合高灵敏度传感器实现全局三维成像。其工作流程可分解为以下关键环节:1. 激光发射:采用二维点阵光源(如VCSEL垂直腔面发射激光器),通过光扩散器在单次脉冲中发射覆盖整个视场的面阵激光,视场角通常可达120°×75°,部分激光雷达产品可以做到120°×90°的超大视场角。不同于传统机械扫描或MEMS微振镜方案,Flash方案无需任何移动部件,直接通过电信号控制激光发射模式。2.
    robolab 2025-04-10 15:30 28浏览
  • 什么是车用高效能运算(Automotive HPC)?高温条件为何是潜在威胁?作为电动车内的关键核心组件,由于Automotive HPC(CPU)具备高频高效能运算电子组件、高速传输接口以及复杂运算处理、资源分配等诸多特性,再加上各种车辆的复杂应用情境等等条件,不难发见Automotive HPC对整个平台讯号传输实时处理、系统稳定度、耐久度、兼容性与安全性将造成多大的考验。而在各种汽车使用者情境之中,「高温条件」就是你我在日常生活中必然会面临到的一种潜在威胁。不论是长时间将车辆停放在室外的高
    百佳泰测试实验室 2025-04-10 15:09 18浏览
  •     前几天同事问我,电压到多少伏就不安全了?考虑到这位同事的非电专业背景,我做了最极端的答复——多少伏都不安全,非专业人员别摸带电的东西。    那么,是不是这么绝对呢?我查了一下标准,奇怪的知识增加了。    标准的名字值得玩味——《电流对人和家畜的效应》,GB/T 13870.5 (IEC 60749-5)。里面对人、牛、尸体分类讨论(搞硬件的牛马一时恍惚,不知道自己算哪种)。    触电是电流造成的生理效应
    电子知识打边炉 2025-04-09 22:35 140浏览
  •   海上电磁干扰训练系统:全方位解析      海上电磁干扰训练系统,作为模拟复杂海上电磁环境、锻炼人员应对电磁干扰能力的关键技术装备,在军事、科研以及民用等诸多领域广泛应用。接下来从系统构成、功能特点、技术原理及应用场景等方面展开详细解析。   应用案例   系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合就可以找到。   一、系统构成   核心组件   电磁信号模拟设备:负责生成各类复杂的电磁信号,模拟海上多样
    华盛恒辉l58ll334744 2025-04-10 16:45 26浏览
  • 由西门子(Siemens)生产的SIMATIC S7 PLC在SCADA 领域发挥着至关重要的作用。在众多行业中,SCADA 应用都需要与这些 PLC 进行通信。那么,有哪些高效可行的解决方案呢?宏集为您提供多种选择。传统方案:通过OPC服务器与西门子 PLC 间接通信SIMATIC S7系列的PLC是工业可编程控制器,能够实现对生产流程的实时SCADA监控,提供关于设备和流程状态的准确、最新数据。S7Comm(全称S7 Communication),也被称为工业以太网或Profinet,是西门
    宏集科技 2025-04-10 13:44 20浏览
  • 行业痛点:电动车智能化催生语音交互刚需随着全球短途出行市场爆发式增长,中国电动自行车保有量已突破3.5亿辆。新国标实施推动行业向智能化、安全化转型,传统蜂鸣器报警方式因音效单一、缺乏场景适配性等问题,难以满足用户对智能交互体验的需求。WT2003HX系列语音芯片,以高性能处理器架构与灵活开发平台,为两轮电动车提供从基础报警到智能交互的全栈语音解决方案。WT2003HX芯片技术优势深度解读1. 高品质硬件性能,重塑语音交互标准搭载32位RISC处理器,主频高达120MHz,确保复杂算法流畅运行支持
    广州唯创电子 2025-04-10 09:12 133浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦