太比特时代，1.6T以太网如何迎接人工智能算力新标准？

原创新思科技 2024-10-21 18:16 633浏览 0评论 0点赞

汽车照明的秘密武器，竟然是…… 工程师速看！中端示波器软件升级“隐藏福利”曝光

过去约半个世纪里，计算机网络领域的以太网标准一直在推动创新。

如今的计算应用正面临着前所未有的挑战。机器学习处理需求持续增长，当前网络难堪重负，以太网标准更新愈发紧迫。

为此，2023年夏季，超以太网联盟(UEC)宣布成立。该联盟汇聚了来自超大规模企业、OEM及新思科技等机构的70多位成员，旨在通过优化以太网，来适应人工智能与高性能计算工作负载的快速演进，进而推动网络革新。联盟致力于解决大型计算集群中机器学习算法所面临的关键问题，为数据中心网络的横向扩展性能提供前瞻性解决方案。

该联盟目前仍在起草新标准，现阶段已经取得很多令人兴奋的成果。接下来，本文将详细介绍超以太网联盟的发展方向、人工智能需求对新标准制定的影响，以及在最新标准发展态势下，新思科技如何利用1.6T/224G以太网IP专业知识，为SoC开发者加速通往硅的成功之路。

为什么需要新的以太网标准？

以太网诞生于1973年，主要用于连接早期工作站。几十年来，计算和连接技术早已不可同日而语。当前的大型语言人工智能模型（LLM）包含数万亿个参数，需要大幅增加计算带宽以防止出现性能瓶颈。

▲ 图1：需要AI集群来实现处理数万亿LLM参数所需的计算能力、存储空间和带宽

随着应用需求不断推动网络性能和效率的提升，现在正是对以太网技术和标准进行革新的时候。

网络尾部延迟的影响是超以太网着力解决的一个问题。尾部延迟指的是个别数据包在网络传输过程中遇到的显著延迟，可能会导致系统因数据包丢失或网络拥堵而暂时停滞。超以太网将通过允许数据包乱序传输，以及智能的数据包低层重传机制来解决这一问题，从而减少人工智能处理器的停顿时间，提升性能，并尽可能提高这些高价值资源的利用率和效率。

现代问题，现代超以太网解决方案

今年早些时候，新思科技宣布推出全球首个1.6T以太网IP解决方案，帮助用户为超以太网做好准备，助力行业应对大规模数据处理的挑战。当前的计算格局表明，我们即将逼近现有基础结构能力的上限。

扩展性是现代计算中最具挑战性的一大问题。为了处理LLM，必须进行横向扩展，即在架构中加入更多加速器，以分散工作负载。考虑到这一点，超以太网将打破过去的限制，使AI集群能够横向扩展到几乎无限数量的加速器。

新思科技的完整1.6T以太网IP解决方案，支持即将推出的超以太网规范，旨在为全球数据中心提供亟需的人工智能带宽，并表现出了一系列优势：

与现有实施方案相比，互连功耗降低多达50%
与800G解决方案相比，多通道/多速率以太网控制器提供1.6T支持，可将延迟降低40%，占用面积减少50%
预验证MAC+PCS+224G PHY IP子系统，可加快上市时间（TTM）并大幅降低集成风险
通过先进的协议、方法和效率功能，新思科技1.6T以太网验证IP可加快验证收敛

太比特时代即将到来

网络生态系统各个领域的组织都将从与UEC的合作中受益匪浅。该联盟汇集了来自新思科技等知名企业的行业专家、研究人员和创新者，提供了丰富的合作机会，为生态系统中的每个参与者带来了许多裨益；初创企业可以获得宝贵的知识、资源和专业知识，从而加快开发周期，而大型企业则确保他们在创新和制作最佳实践方面继续引领行业。UEC专注于超高速以太网，符合下一代人工智能和高性能计算应用的需求，推动了稳健且可扩展的网络解决方案。

过去几年，人工智能和机器学习呈爆炸式增长，将计算需求推向了历史上从未见过的高度。为了保持这一发展势头，新思科技很荣幸能成为超以太网联盟的一员，继续参与塑造网络标准的未来。

如需了解更多详细信息，请点击阅读原文。