深度丨拒绝英伟达垄断,八大科技巨头组团推出UALink

原创 AI芯天下 2024-06-05 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
当前,众多企业正积极尝试引入标准PCIe交换机,并据此构建基于PCIe的架构体系,以实现对更多加速器的有效扩展。

尽管如此,业界领军企业对此类做法多持审慎态度,将其视为一种权宜之计。

相较之下,英伟达的NVLink技术已确立为行业内横向扩展技术的典范,获得了广泛认可。

如今,一个致力于打破专有技术壁垒的开放标准阵营正逐渐崭露头角。


作者 | 方文三
图片来源 |  网 络 



英伟达的NVLink让厂商们心生不安


作为英伟达的核心技术,NVLink在GPU网络通信系统中占据重要地位,其对于提升数据传输效率和处理性能具有显著作用。


NVLink技术实现了GPU与支持该技术的CPU之间以及多个GPU之间的高带宽直接连接,从而大幅提升了整体性能。


然而,值得注意的是,NVLink技术并未向行业开放,这在一定程度上影响了其他厂商在相关领域的竞争力。


尽管英伟达的AI系统在市场上表现出色,但人们往往忽视了其背后的众多关键技术。


实际上,英伟达不仅拥有出色的GPU和软件,还在跨多个GPU和系统横向扩展工作负载方面拥有丰富的技术积累。


这些技术包括芯片上和封装上互连、用于服务器或pod中GPU到GPU通信的NVLink、用于超pod扩展的Infiniband以及连接到更庞大基础设施的以太网等。



IBM指出,NVLink技术使得CPU与GPU之间能够实现快速数据交换,从而提升了整个计算系统的数据吞吐量,有效克服了加速计算领域的一大瓶颈。


随着英伟达GPU芯片的更新迭代,NVLink技术也在不断进化。


从2017年的NVLink 2.0到2020年的NVLink 3.0,再到2022年的NVLink 4.0,每一次更新都带来了更高的性能和更广泛的应用场景。


在2024年的GTC大会上,英伟达推出了全新的NVLink 5.0技术,并与最新一代Blackwell芯片一同亮相。


这一技术极大地提升了大型多GPU系统的可扩展性,单个Blackwell Tensor Core GPU支持多达18个NVLink 100GB/s连接,总带宽达到1.8TB/s,较上一代产品提升了两倍之多。


此外,NVLink 5.0技术还支持跨节点扩展,通过NVLink Switch实现无缝、高带宽、多节点GPU集群的构建,从而满足数据中心级别的大型GPU需求。


利用NVLink技术,多服务器集群能够平衡GPU通信与增加的计算量,从而实现了更高的性能和效率。


例如,在GB200 NVL72等服务器平台上,NVLink技术的应用使得这些平台能够支持更为复杂的大型模型,并提供了更高的可扩展性。


这些优势使得英伟达在GPU网络通信领域继续保持领先地位,并为其在AI、数据中心等领域的广泛应用提供了有力支持。



八大科技巨头组团推出UALink

近日,包括谷歌、Meta、微软、AMD、英特尔、博通、思科、惠普在内的科技巨头联合宣布成立Ultra Accelerator Link(UALink)联盟,致力于开发人工智能数据中心GPU网络通信系统的全新行业开放标准。


此举旨在打破英伟达在市场上的垄断地位,推动行业内的竞争与创新。


UALink倡议由AMD牵头提出,得到了英特尔、博通等公司的积极响应与支持。

作为倡导组织的成员,思科、谷歌、惠普、Meta和微软等公司亦表示大力支持。


该倡议致力于构建一种内存语义结构,在首个版本规范中便支持扩展至1024个端点,以适应不同规模的AI计算需求。


UALink联盟计划推出的首个UALink 1.0版本将实现AMD的Instinct GPU和英特尔的Gaudi等专用处理器之间的直接数据传输,从而显著提升AI计算的性能与效率。


UALink的高速I/O通信设计与协议展现出强大的技术实力,彰显了联盟成员挑战市场领导者的决心。


UALink专家组将负责制定管理数据中心中不同GPU之间连接的标准,并预计于2024年第三季度向联盟成员提供这些标准。


此举将为其他厂商提供更多参与市场竞争的机会,进一步推动行业的创新与发展。



去年,Ultra Ethernet技术的出现为行业带来了增强型以太网作为Infiniband的替代方案。


今年,UALink的推出更是剑指NVLink,旨在打破其市场垄断地位。


UALink的推出为业界其他公司提供了追赶英伟达步伐的契机。


随着AI计算需求的不断增长,拥有一个稳健、低延迟且可高效扩展的网络对于提升计算性能至关重要。


UALink及行业规范的制定将有助于为AI工作负载创建开放的高性能环境,推动行业的持续进步。


UALink工作组将致力于制定规范,以界定AI计算容器组中加速器与交换机之间进行纵向扩展通信所需的高速低延迟互连。


通过标准化接口和实现方式,UALink将为新一代AI数据中心提供更加高效、灵活的AI和机器学习、高性能计算以及云应用程序解决方案。



微软、谷歌以及Meta等或是最大受益者

对于AMD和英特尔等业界巨头,UALink的推出为它们提供了一条复制NVLink和NVSwitch功能的路径,并促进了与其他企业的合作与成果共享。


博通等公司在UALink的助力下,可生产UALink交换机,有效推动其他公司的规模扩张。


AMD数据中心总经理Forrest Norrod明确指出,行业亟需开放标准以推动持续发展,并鼓励多家公司共同参与价值创造。首批UALink产品预计将在未来几年内陆续问世。


博通数据中心副总裁Jas Tremblay表示,作为UALink联盟的创始成员,博通一直致力于将AI技术融入数据中心领域,并支持开放生态系统协作,这对于实现网络扩展至关重要。


思科通用硬件集团执行副总裁Martin Lund亦强调,随着AI工作负载的不断增长,高性能互连技术的重要性日益凸显。


思科将积极参与UALink的开发,共同打造可扩展且开放的解决方案,以应对构建AI超级计算机所面临的挑战。



UALink的最大潜在受益者可能包括微软、谷歌和Meta等科技巨头。


这些公司已投入数十亿美元购买英伟达GPU以支持云服务和AI模型训练,并期望通过UALink降低对主导供应商的依赖。


目前,谷歌已拥有TPU和Axion定制芯片,亚马逊推出了多个AI芯片系列,微软推出了Maia和Cobalt芯片,而Meta也在不断完善其加速器阵容。


微软与OpenAI计划投入1000亿美元建造超级计算机,并将采用Cobalt和Maia芯片。UALink将成为连接这些高性能芯片的关键技术。


对于AMD和英特尔等公司而言,UALink不仅提供了一条复制NVLink和NVSwitch功能的途径,还促进了与其他企业的合作与成果共享。


英特尔今年的AI加速器销售额已达到数亿美元,尽管销量相对较小,但UALink有望助力其扩大市场份额。


AMD今年也将销售数十亿美元的MI300X产品,尽管与英伟达在AI领域的规模相比仍有差距,但UALink的推出将为其带来新的发展机遇。


此外,UALink的推广和应用还将为博通等公司创造新的商机。


这些公司可利用UALink技术生产UALink交换机,协助其他公司扩大规模,并在多家公司的加速器产品上广泛应用这些交换机,共同推动行业的发展和进步。



结尾:


值得一提的是,UALink联盟并未将英伟达排除在合作范围之外,然而,鉴于英伟达的商业利益主要聚焦于推广和维护其专有技术生态系统,预计其不会主动加入UALink联盟。


显而易见,UALink将对英伟达的市场优势造成一定削弱。


不过,从现实角度来看,要在短时间内取代英伟达的地位并不切实际。


据相关消息透露,首批UALink产品预计将在[几年]后推向市场。


然而,尽管面临诸多挑战,UALink联盟仍坚定地认为这一步是必须迈出的。


毕竟,没有任何人愿意看到某一领域长期被垄断性企业所主导。


部分资料参考:通信干货:《八大科技巨头联手挑战英伟达,新的行业开放标准UALink来袭》,云头条:《挑战英伟达 NVLink:8大IT巨头制定UALink标准》,有新Newin:《微软、谷歌、Meta以及AMD等硅谷巨头联手成立 UALink 制定统一标准》,SDNLAB:《英特尔、AMD等联手推出 UALink,剑指英伟达NVLink》,半导体行业观察:《芯片巨头组团,向英伟达NVLink开战》,问芯:《英特尔、AMD、谷歌、微软等组建[反英伟达联盟],联手打造AI芯片互联新标准》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:

18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 69浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 117浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 101浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 20浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 82浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 96浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 155浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 33浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 135浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 34浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 106浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦