打破垄断:UALink向英伟达NVLink宣战

智能计算芯世界 2025-04-23 07:43



图片

本文来自“UALink高速互联技术合集”,Ultra Accelerator Link(UALink)1.0规范正式发布,人工智能(AI)和高性能计算(HPC)领域开始有新的竞争。

由AMD、Broadcom、Google、Intel等科技行业领军企业联合发起的UALink倡议,正致力于构建一种开放、高速且低延迟的互连技术标准,旨在直接撼动英伟达NVLink在加速器互连领域的霸主地位。UALink 1.0版本已实现每通道200GT/s的超高带宽,能够无缝连接多达1024个AI加速器,同时凭借低成本部署、灵活扩展能力以及卓越的安全防护特性,为AI加速器生态系统注入了全新的竞争活力。
我们将从技术革新与市场竞争两大层面,深入剖析UALink的战略意义,并探讨其对AI产业未来格局的潜在影响。
本文所有资料都已上传至智能计算芯知识”星球。如《60+份AI Agent技术报告合集》”,“《清华大学:DeepSeek报告13部曲合集》”,“浙江大学:DeepSeek技术20篇(合集)”,“《280+份DeepSeek技术报告合集》”,“《100+份AI芯片技术修炼合集》”,“800+份重磅ChatGPT专业报告”,“《12+份Manus技术报告合集》,加入星球获取严选精华技术报告。

UALink的技术创新与优势

UALink的应运而生,是AMD、Broadcom、Intel等业界领军企业针对英伟达NVLink专有技术所采取的一项集体战略举措。

英伟达凭借NVLink与NVSwitch技术,成功搭建起一套高效的GPU互联体系,在诸如Blackwell NVL72等机架级解决方案中,更是彰显出卓越的性能实力。但不可忽视的是,NVLink的封闭性特质,无形中为其他厂商设置了参与门槛,进而推高了系统集成的成本。

在此背景下,UALink以开放标准为突破口,成功打破了这一技术壁垒。它使得不同厂商的加速器,诸如AMD Instinct GPU、Intel Gaudi等,能够实现无缝协同工作。这一变革,极大地简化了数据中心部署的流程,降低了相关成本。UALink所构建的这一开放生态,不仅为系统集成商和数据中心运营商带来了更为灵活的操作空间,更为众多中小型AI硬件厂商开辟了参与市场竞争的新通道,激发了整个行业的创新活力。

UALink规范发布:挑战英伟达AI统治的开始

UALink 1.0的协议栈由物理层、数据链路层、事务层和协议层组成,针对AI和HPC负载进行了深度优化。

◎ 物理层:基于标准以太网组件(如200GBASE-KR1/CR1),通过改进前向纠错(FEC)和码字交织技术,显著降低延迟,同时保持与现有以太网生态的兼容性。

◎ 数据链路层:采用64字节到640字节的flit打包机制,结合循环冗余校验(CRC)和可选重试逻辑,确保数据传输的可靠性和高效性。

◎ 事务层:通过压缩寻址和直接内存操作(读、写、原子事务),实现高达95%的协议效率,优化了跨加速器的内存访问,特别适合AI训练和推理中对低延迟的严苛要求。

◎ 协议层:支持UALinkSec硬件级加密和可信执行环境(如AMD SEV、Intel TDX),为多租户数据中心提供安全隔离和机密计算能力。

这种分层架构设计在维持卓越性能的同时,显著降低了协议的复杂程度。与PCI-Express(PCIe)或Compute Express Link(CXL)相比,UALink在带宽和延迟方面展现出更为突出的优势,因而特别适用于大规模AI计算集群的部署。

UALink具备强大的扩展能力,能够支持多达1024个加速器的连接,覆盖范围从单个机架到四个机架,其单通道双向带宽高达200GT/s,在四通道配置下更是可提升至800GT/s。这种规模化的连接能力,使其能够轻松应对AI模型不断增长的计算需求,诸如大型语言模型(LLM)的训练与推理等任务。

此外,UALink在延迟表现上同样令人瞩目。在64B/640B负载条件下,其往返延迟低于1微秒,而端口到端口的跳变延迟大约在100-150纳秒之间,这一性能已接近PCIe交换机的水平,并远优于传统以太网。UALink的这种低延迟特性,对于构建具备确定性性能的AI计算Pod而言,具有至关重要的意义,能够确保AI计算任务的高效与稳定。

UALink的设计注重能效,其交换机的功耗仅为同等以太网ASIC的1/3到1/2,每个加速器可节省150-200瓦的功耗。更小的芯片面积和更低的功耗不仅降低了硬件成本,还减少了数据中心的电力和冷却开支,从而优化了总体拥有成本(TCO)

这对于超大规模云服务提供商(如Google、Microsoft)尤为重要,他们需要平衡性能与运营成本。

UALink挑战英伟达的生态壁垒

英伟达在AI加速器市场中占据主导地位,这一成就并非仅仅依赖于其性能卓越的GPU硬件,更得益于NVLink、NVSwitch以及CUDA软件生态所形成的强大协同效应。以Blackwell NVL72机架为例,它借助NVLink技术实现了72个GPU的高效连接;而在Pod级扩展方案中,更是能够支持多达576个GPU的协同工作。不仅如此,英伟达即将推出的Vera Rubin平台,还将单机架的GPU数量进一步提升至144个,充分展现了其在硬件扩展能力上的领先地位。

相较之下,UALink 1.0在扩展潜力方面展现出了独特的优势,其理论上能够支持拥有1024个加速器的Pod规模。然而,英伟达所构建的生态壁垒,并不仅仅局限于硬件互连层面。CUDA的广泛应用以及经过深度优化的工具链,使得英伟达在开发者社区中拥有了极为深厚的根基。

面对这样的挑战,UALink联盟若想在市场中与英伟达有效竞争,仅仅在硬件层面发力是远远不够的。他们还需要大力推动软件生态的发展,例如ROCm、oneAPI等,加快这些软件生态的成熟进程。只有这样,才能吸引更多的开发者从英伟达平台迁移过来,从而真正打破英伟达在AI加速器市场的垄断地位,为行业带来更加多元化和富有竞争力的发展格局。

UALink联盟汇聚了来自多个关键领域的成员,包括芯片设计领域的AMD、Intel、Broadcom,云服务领域的Google、Microsoft、Meta,网络设备领域的Cisco,以及系统集成领域的HPE等。这种跨行业的广泛支持,为UALink技术的迅速落地奠定了坚实基础。举例来说,Synopsys已经成功推出了UALink IP控制器和验证IP,而AsteraLabs和Broadcom也计划投入生产UALink交换机,这些进展都彰显了联盟在推动UALink技术发展方面的积极作为。

然而,联盟在推进过程中也面临着不小的挑战,其中利益协调问题尤为突出。以Google和Meta为例,它们更侧重于定制加速器(如TPU)的研发与应用;而AMD和Intel则致力于推广通用GPU。这种成员间优先级的差异,可能会给UALink标准的演进带来复杂性。此外,由于英伟达的缺席,UALink在短期内难以撼动其在市场中的主导地位,特别是在高端AI训练市场这一关键领域。

尽管UALink1.0规范的发布标志着技术开发取得了重大进展,但从规范到商用产品的转化通常需要12-18个月的时间。联盟预计首批UALink设备将在2026年面世,而与此同时,英伟达的NVLink6.0和RubinUltra平台也有可能在2027年进一步提升性能。这意味着UALink需要在有限的时间窗口内,充分展示其性能和成本优势,以在激烈的市场竞争中抢占份额。

市场接受度在很大程度上将取决于UALink在实际部署过程中的具体表现。这其中包括它能否与现有的数据中心基础设施实现无缝集成,以及能否切实有效地降低AI训练和推理的总体成本。对于中小型企业而言,它们对开放标准的接纳程度可能会高于那些深度依赖英伟达生态的大型客户,这无疑为UALink开辟了一条切入市场的可行路径。

UALink与UltraEthernet Consortium(UEC)之间的合作,构成了其战略布局中的关键一环。UEC专注于对以太网进行优化,以满足AI和高性能计算在规模化方面的需求,而UALink则聚焦于Pod内部加速器之间的高速互连。将这两者结合起来,有望打造出一个涵盖“规模内与规模外”的全方位解决方案。举例来说,UALink能够用于连接包含8 - 128台服务器的Pod,而UltraEthernet则可实现跨Pod的扩展。这种协同作用极大地增强了UALink在生态方面的竞争力,但同时也带来了技术整合方面的复杂性。这就要求联盟在标准制定以及产品开发等各个环节,都必须保持高效且紧密的协作。

UALink 1.0规范的发布,无疑是AI产业竞争格局演变的一个重要标志。作为一项开放标准,UALink凭借其高速、低延迟以及低成本的互连技术,为AMD、Intel、Google等公司向英伟达的AI统治地位发起挑战,提供了至关重要的有力武器。

下载链接:

重磅合集
1、《70+篇半导体行业“研究框架”合集》
2、《56+份智能网卡和DPU合集
3、《14份半导体“AI的iPhone时刻”系列合集》
4、《21份走进“芯”时代系列深度报告合集》
5、800+份重磅ChatGPT专业报告
6、《92份GPU技术及白皮书汇总》
7、《11+份AI的裂变时刻系列报告》

8、《3+份技术系列基础知识详解(星球版)》

9、《12+份Manus技术报告合集》

10、《100+份AI芯片修炼合集》

11、《60+份AI Agent技术报告合集》 

《100+份AI芯片技术修炼合集》

《270+份DeepSeek技术报告合集》

《42篇半导体行业深度报告&图谱(合集)

亚太芯谷科技研究院:2024年AI大算力芯片技术发展与产业趋势

SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)
2025新技术前瞻专题系列合集
《科技龙头巡礼专题:华为技术合集》
1、科技龙头巡礼专题(一):如何看待华为盘古大模型5.0? 
2、科技龙头巡礼专题(二):华为欧拉五问五答 
3、科技龙头巡礼专题(三):国产算力AI芯片专题,一文读懂华为昇腾310芯片

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。


图片

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索AI_Architect”或“扫码关注公众号实时掌握深度技术分享,点击阅读原文获取更多原创技术干货


图片
图片

智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 104浏览
  • 4月22日下午,备受瞩目的飞凌嵌入式「2025嵌入式及边缘AI技术论坛」在深圳深铁皇冠假日酒店盛大举行,此次活动邀请到了200余位嵌入式技术领域的技术专家、企业代表和工程师用户,共享嵌入式及边缘AI技术的盛宴!1、精彩纷呈的展区产品及方案展区是本场活动的第一场重头戏,从硬件产品到软件系统,从企业级应用到高校教学应用,都吸引了现场来宾的驻足观看和交流讨论。全产品矩阵展区展示了飞凌嵌入式丰富的产品线,从嵌入式板卡到工控机,从进口芯片平台到全国产平台,无不体现出飞凌嵌入式在嵌入式主控设备研发设计方面的
    飞凌嵌入式 2025-04-28 14:43 125浏览
  • 在电子电路设计和调试中,晶振为电路提供稳定的时钟信号。我们可能会遇到晶振有电压,但不起振,从而导致整个电路无法正常工作的情况。今天凯擎小妹聊一下可能的原因和解决方案。1. 误区解析在硬件调试中,许多工程师在测量晶振时发现两端都有电压,例如1.6V,但没有明显的压差,第一反应可能是怀疑短路。晶振电路本质上是一个交流振荡电路。当晶振未起振时,两端会静止在一个中间电位,通常接近电源电压的一半。万用表测得的是稳定的直流电压,因此没有压差。这种情况一般是:晶振没起振,并不是短路。2. 如何判断真
    koan-xtal 2025-04-28 05:09 172浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 96浏览
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 171浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 93浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 84浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 89浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 139浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 126浏览
  • 晶振在使用过程中可能会受到污染,导致性能下降。可是污染物是怎么进入晶振内部的?如何检测晶振内部污染物?我可不可以使用超声波清洗?今天KOAN凯擎小妹将逐一解答。1. 污染物来源a. 制造过程:生产环境不洁净或封装密封不严,可能导致灰尘和杂质进入晶振。b. 使用环境:高湿度、温度变化、化学物质和机械应力可能导致污染物渗入。c. 储存不当:不良的储存环境和不合适的包装材料可能引发化学物质迁移。建议储存湿度维持相对湿度在30%至75%的范围内,有助于避免湿度对晶振的不利影响。避免雨淋或阳光直射。d.
    koan-xtal 2025-04-28 06:11 123浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 120浏览
  •  探针台的维护直接影响其测试精度与使用寿命,需结合日常清洁、环境控制、定期校准等多维度操作,具体方法如下:一、日常清洁与保养1.‌表面清洁‌l 使用无尘布或软布擦拭探针台表面,避免残留清洁剂或硬物划伤精密部件。l 探针头清洁需用非腐蚀性溶剂(如异丙醇)擦拭,检查是否弯曲或损坏。2.‌光部件维护‌l 镜头、观察窗等光学部件用镜头纸蘸取wu水jiu精从中心向外轻擦,操作时远离火源并保持通风。3.‌内部防尘‌l 使用后及时吹扫灰尘,防止污染物进入机械滑
    锦正茂科技 2025-04-28 11:45 94浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 141浏览
  • 一、智能家居的痛点与创新机遇随着城市化进程加速,现代家庭正面临两大核心挑战:情感陪伴缺失:超60%的双职工家庭存在“亲子陪伴真空期”,儿童独自居家场景增加;操作复杂度攀升:智能设备功能迭代导致用户学习成本陡增,超40%用户因操作困难放弃高阶功能。而WTR096-16S录音语音芯片方案,通过“语音交互+智能录音”双核驱动,不仅解决设备易用性问题,更构建起家庭成员间的全天候情感纽带。二、WTR096-16S方案的核心技术突破1. 高保真语音交互系统动态情绪语音库:支持8种语气模板(温柔提醒/紧急告警
    广州唯创电子 2025-04-28 09:24 179浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦