“这并不是要彻底改革以太网,”超级以太网联盟主席 J Metz 博士说,“而是要调整以太网以提高具有特定性能要求的工作负载的效率。我们正在研究每一层,从物理层一直到软件层,以找到提高效率和性能的最佳方法。”

随着以ChatGPT为代表的AIGC应用火爆,带来了对算力需求的急剧攀升。传统以太网性能不够的问题逐渐暴露,这种情况已经影响到人工智能(AI)和高性能计算(HPC)的发展,各大厂商也提高了对于网络架构的重视程度。

近日,Linux 基金会(Linux Foundation)宣布成立超以太网联盟 (Ultra Ethernet Consortium,UEC),以优化高性能网络的以太网标准。该联盟由 AMD、Arista、Broadcom、Cisco、Eviden、HPE、Intel、Meta 和 Microsoft 等行业领导者组成,旨在完善以太网标准,以更好地支持人工智能、机器学习和高性能计算不断增长的需求。

该联盟瞄准的是一个快速增长的领域,从而可能为渠道合作伙伴带来重大机遇。研究公司650 Group表示,预计今年数据中心AI网络市场规模将扩大到30亿美金,到2027年将达到100亿美金。

高性能网络的协作方法

UEC 旨在寻求通过“全行业合作”,构建一个完整的基于以太网的通信堆栈架构,该架构可以处理各种工作负载,同时具有可扩展性和可扩展性。性价比高。该联盟由在高性能解决方案领域拥有悠久历史和经验的公司创立,每家公司都以平等的方式为更广泛的高性能生态系统做出了重大贡献。

“这并不是要彻底改革以太网,”超级以太网联盟主席 J Metz 博士说,“而是要调整以太网以提高具有特定性能要求的工作负载的效率。我们正在研究每一层,从物理层一直到软件层,以找到提高效率和性能的最佳方法。”

该联盟的目的是寻求在远程直接数据存取(RDMA)基础上进一步升级。

目前,基于RDMA的RoCE能够在以太网协议下实现远程内存访问,绕过CPU控制,实现数据的“0拷贝”,同时,数据包的封装和解封都由网卡完成,从而极大节省CPU资源。但目前RoCE暴露出一个问题:必须运行在无损网络中。RDMA协议下,如果出现丢包或乱包,会导致回退N帧(Go-back-N,GBN)问题,必须重新传输丢失/乱序的这N个包。RDMA引入优先流量控制(PFC)协议,从接收方向发送方发送PAUSE帧,从而实现无损网络,但这也带来队头堵塞问题,导致通信网络性能下降。

超以太网传输(Ultra Ethernet Transport,UET)是下一代应用于AI超算和HPC的网络协议。对于AI超算和HPC,通信网络必须又快又准地将数据包传送到对应节点,UET提出在有损网络下的针对队头堵塞和堵塞扩散的解决方案:保留IP协议,因此UET本质还是开放协议;多路径+数据包喷洒(packet-spraying)技术,充分利用高带宽通信网络,无需负载平衡算法;播送管理机制,减少掉线;支持对API进行无序数据包发送,提升网络并发性能;支持百万数量级端口,满足AI超算和HPC集群所需的交换规模。

此外,UET特别考虑了AI计算的安全工程问题。UET利用IPSec和PSP等现代加密方法,实现高效的API会话管理、身份验证和数据保密。UET支持数万个计算节点共享密钥,符合AI超算多节点训练和推理的安全工程需求,从而实现保护用户隐私、便于内容监管。

英伟达可能遭遇重创?

一位解决方案提供商高管认为,超以太网联盟的一个可能目标是提供英伟达(Nvidia) InfiniBand网络解决方案的替代方案,该解决方案主要是针对人工智能和高性能计算工作负载的,而且值得注意的是,Nvidia并不是该联盟的成员。

Nor-Tech是一家总部位于美国明尼苏达州伯恩斯维尔的高性能计算系统集成商,公司工程副总裁Dominic Daninger表示:“他们正在尝试找这些框架的替代选择。”

Nvidia没有对此进行置评。

Daninger表示,如果成功构建可互操作且速度更快的、基于以太网的解决方案堆栈,那么该联盟则可能会削弱Nvidia在人工智能和高性能计算领域的主导地位,因为Nvidia推广的InfiniBand是在2021年收购Mellanox时获得的,作为连接GPU集群以执行此类工作负载的最佳低延迟解决方案。

此前适配于AI/HPC的Infiniband架构相对封闭,基于以太网的UEC在RoCE的基础上更多考虑了结合以太网的优势,在开放的生态下做非无损网络以满足AI和HPC的要求。他表示:“英特尔、AMD和博通等公司可能想要借此摆脱和Nvidia加速器及连接结构的束缚。”

2024年上市的相关产品或因此改变

联盟将专注于最大限度地减少通信堆栈更改,同时维护和促进以太网互操作性。技术目标包括开发规范、API 和源代码,以定义以太网通信的协议、信令特征、接口和数据结构。该联盟还将致力于链路级和端到端网络传输协议、拥塞、遥测、信令机制以及软件、存储、管理和安全结构。

该联盟将分成四个工作组,分别负责物理层、链路层、传输层和软件层,每个工作组先完成自己的工作然后不同工作组结合到一起,最终推出超以太网传输协议。

联盟的终极目标是开发一种性能超越“当今专业技术”的、基于以太网的架构,重点关注功能、性能、总拥有成本、互操作性以及为用户和开发人员提供的友好环境。

超以太网联盟预计首批采用其规范的产品将于2024年问世,行业分析师和创始成员表达了他们对 UEC 计划的支持和兴奋。 

Hyperion Research首席执行官Earl Joseph博士、Intersect360 Research首席执行官Addison Snell以及Cambrian-AI Research创始人兼首席分析师Karl Freund均强调了UEC在满足大规模人工智能和高性能计算不断增长的网络需求方面的重要性。

创始成员也表达了对UEC的承诺。 AMD 的 Robert Hormuth、Arista 的 Hugh Holbrook、Broadcom 的 Ram Velaga、思科的 Rakesh Chopra、Atos Group 的 Eric Eppe、HPE 的 Justin Hotard、英特尔的 Jeff McVeigh、Meta 的 Alexis Björlin 和微软的 Steve Scott 都分享了他们对 UEC 重要性以及各自公司将在联盟中扮演的角色的看法。

网友热议

@蚁工厂 :似乎是数据中心里RoCE协议的升级版,和普通网络关系不大。大的数据中心包括阿里云应该都在搞自己的类似的技术。

@不倒翁:这个联盟要做好持久战的准备,要是拍电影可以,“复仇者联盟”分分钟搞起,但是现实世界中,针对以太网的标准、技术、应用进行升级革命,是个大工程。

@梵蒂冈城的同胞 :没有中国企业的联盟都是伪高科技。

@周一见:这个项目的出现令人兴奋,这对于处理大量数据和复杂计算任务的人工智能和HPC系统来说至关重要,期待看到这个项目的进一步发展以及后续给我们带来的新技术和新产品。

@JaysonPetrelli :大模型的爆发必然会让DCN做相应的改变,这也是我的研究方向之一,很多网友都在说我们在干嘛,看看别人什么的话,这个其实不用担心,我们不仅在学术界,而且在工业界早就看到这个趋势了,也早就有部署跟研究了。

@贰言:这种跨公司、跨行业的合作模式,虽然有利于打破行业壁垒,推动技术的融合和创新。但这种巨头公司的联合也可能会导致技术垄断、技术依赖、影响市场的竞争。

责编:Luffy
您可能感兴趣
韩国公平贸易委员会宣布了一项重要决定,对美国半导体巨头博通提起诉讼。博通被指控利用其在有线电视机顶盒SoC市场的垄断地位,迫使韩国机顶盒制造商在采购竞标中排除其他竞争对手的产品方案。通迅速提出一系列纠正方案以规避更严厉的制裁。KFTC虽决定提起诉讼,但倾向于接受博通的提议......
龚诚表示,“该技术体现了光电融合的巨大优势,是微波光子学领域的新尝试。利用该技术,未来我们可以用光来实现对任意电磁波(微波、太赫兹、红外等)的高速探测、调制甚至计算。”
电视信号主要分为模拟信号和数字信号,不同类型的信号在传输和接收上都有特定的要求 ……
Philip Brace接任Skyworks CEO后,辞去了在Lantronix Inc.的董事会职务。他目前还担任Inseego和Blackberry Limited董事会成员。
这一成绩不仅显示出华为在复杂多变的市场环境中保持了强劲的增长势头,也标志着其消费者业务重回增长轨道,智能汽车解决方案业务快速发展。
随着AI模型规模越来越大,所需的训练硬件也需同步升级。然而,目前缺乏一种开放的互连标准来支持AI加速器间的高效通信。
全球人形机器人领域上市公司的百强名单将人形机器人产业链区分为大脑、身体以及集成三大核心环节,覆盖全球共计100家上市公司。中国共37家企业上榜(中国大陆32家,台湾5家),其中深圳7家,占中国大陆上榜企业近四分之一,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等......
DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块......
凭借新一代3nm制程工艺与全新架构,骁龙® 8至尊版的单核和GPU 性能提升均超过 40%,使得Find N5在性能上实现质的飞跃……
简化物联网连接:应用就绪型软件构建模块
2月10日晚,比亚迪举办了“天神之眼 开创全民智驾时代”智能化战略发布会,正式发布了全民智驾战略,并推出了首批21款智驾车型,覆盖7万级至20万级价格区间,全部保持原价。           其中,海
UN高性能10W开关电源芯片U95143能效领跑小家电有很多功能上的创新可以随着技术的发展而进行,也能给终端的客户带来有效且实际的操作理念,最重要是能保障产品品质。而零件产品的品质会对出品整体效果有所
据业内人士2月11日透露,三星显示器近期限时推出名为“平衡假期”的特别假期。具体内容是,每周平均工作超过52小时的员工可获得三天带薪休假,每周工作超过60小时的员工可获得六天带薪休假。上个月,三星显示
点击蓝字 关注我们SUBSCRIBE to USImage: TASA总部位于东京的初创公司ArkEdge Space声称,其拍摄的可能是小型立方星(CubeSat)所拍摄的质量最高的地球照片(htt
2月10日盘后,光峰科技发布公告,于近日收到某知名车企出具的开发定点通知书,将为其旗下新时代科技品牌的SUV车型供应智能座舱显示产品,预计2025年内量产供货。光峰科技认为,随着消费者对智能座舱需求的
近日,中国证监会官网显示,格兰菲智能科技股份有限公司(简称“格兰菲”)已在上海证监局办理辅导备案登记,正式启动A股上市进程,辅导机构为海通证券。据披露,格兰菲成立于2020年12月,注册资本为1.28
恩智浦 NXP 荷兰当地时间昨日宣布已同边缘 NPU 企业 Kinara 达成最终协议,计划以 3.07 亿美元现金收购后者。这笔交易预计将于 2025 上半年完成,但须满足包括监管部门批准在内的惯例
比亚迪放大招,智驾卷到10万元内!王传福:比亚迪全系车型搭载高阶智驾2月10日晚,比亚迪智驾发布会放出“王炸”,这家全球新能源汽车销量冠军宣布,将推出低、中、高三套不同配置高阶智能驾驶解决方案,首批搭
  电子无尘车间在设计时需要重视多个问题,以确保生产环境的洁净度、生产效率和安全性。以下是需要重视的设计问题,具体随合洁科技电子洁净工程公司一起来了解下吧! &emsp
 △广告 与正文无关 近日,南浔区举行项目签约仪式,晶洲长三角TGV玻璃基板半导体工艺装备研发及产业化项目、玻璃基板PVD镀膜设备研发及生产项目签约落户南浔。据悉,苏州晶洲装备科技有限公司是目前国内唯