过去约半个世纪里,计算机网络领域的以太网标准一直在推动创新。
如今的计算应用正面临着前所未有的挑战。机器学习处理需求持续增长,当前网络难堪重负,以太网标准更新愈发紧迫。
为此,2023年夏季,超以太网联盟(UEC)宣布成立。该联盟汇聚了来自超大规模企业、OEM及新思科技等机构的70多位成员,旨在通过优化以太网,来适应人工智能与高性能计算工作负载的快速演进,进而推动网络革新。联盟致力于解决大型计算集群中机器学习算法所面临的关键问题,为数据中心网络的横向扩展性能提供前瞻性解决方案。
该联盟目前仍在起草新标准,现阶段已经取得很多令人兴奋的成果。接下来,本文将详细介绍超以太网联盟的发展方向、人工智能需求对新标准制定的影响,以及在最新标准发展态势下,新思科技如何利用1.6T/224G以太网IP专业知识,为SoC开发者加速通往硅的成功之路。
为什么需要新的以太网标准?
以太网诞生于1973年,主要用于连接早期工作站。几十年来,计算和连接技术早已不可同日而语。当前的大型语言人工智能模型(LLM)包含数万亿个参数,需要大幅增加计算带宽以防止出现性能瓶颈。
▲ 图1:需要AI集群来实现处理数万亿LLM参数所需的计算能力、存储空间和带宽
随着应用需求不断推动网络性能和效率的提升,现在正是对以太网技术和标准进行革新的时候。
网络尾部延迟的影响是超以太网着力解决的一个问题。尾部延迟指的是个别数据包在网络传输过程中遇到的显著延迟,可能会导致系统因数据包丢失或网络拥堵而暂时停滞。超以太网将通过允许数据包乱序传输,以及智能的数据包低层重传机制来解决这一问题,从而减少人工智能处理器的停顿时间,提升性能,并尽可能提高这些高价值资源的利用率和效率。
现代问题,现代超以太网解决方案
今年早些时候,新思科技宣布推出全球首个1.6T以太网IP解决方案,帮助用户为超以太网做好准备,助力行业应对大规模数据处理的挑战。当前的计算格局表明,我们即将逼近现有基础结构能力的上限。
扩展性是现代计算中最具挑战性的一大问题。为了处理LLM,必须进行横向扩展,即在架构中加入更多加速器,以分散工作负载。考虑到这一点,超以太网将打破过去的限制,使AI集群能够横向扩展到几乎无限数量的加速器。
新思科技的完整1.6T以太网IP解决方案,支持即将推出的超以太网规范,旨在为全球数据中心提供亟需的人工智能带宽,并表现出了一系列优势:
与现有实施方案相比,互连功耗降低多达50%
与800G解决方案相比,多通道/多速率以太网控制器提供1.6T支持,可将延迟降低40%,占用面积减少50%
预验证MAC+PCS+224G PHY IP子系统,可加快上市时间(TTM)并大幅降低集成风险
通过先进的协议、方法和效率功能,新思科技1.6T以太网验证IP可加快验证收敛
太比特时代即将到来
网络生态系统各个领域的组织都将从与UEC的合作中受益匪浅。该联盟汇集了来自新思科技等知名企业的行业专家、研究人员和创新者,提供了丰富的合作机会,为生态系统中的每个参与者带来了许多裨益;初创企业可以获得宝贵的知识、资源和专业知识,从而加快开发周期,而大型企业则确保他们在创新和制作最佳实践方面继续引领行业。UEC专注于超高速以太网,符合下一代人工智能和高性能计算应用的需求,推动了稳健且可扩展的网络解决方案。
过去几年,人工智能和机器学习呈爆炸式增长,将计算需求推向了历史上从未见过的高度。为了保持这一发展势头,新思科技很荣幸能成为超以太网联盟的一员,继续参与塑造网络标准的未来。
如需了解更多详细信息,请点击阅读原文。