我们每天都在搜索引擎中搜寻大量信息,并期望在短短几秒钟内得到大量的相关信息,超大规模数据中心需要处理海量数据、经历复杂的流程和完成各种各样的处理工作。如果您是设计数据中心SoC的开发者,肯定会敏锐地意识到这个过程对高带宽和低延迟的需求。高带宽和低延迟是人工智能(AI)和高性能计算(HPC)应用的关键特性,可以让上述网络搜索及其他许多令人惊叹的应用成为可能。
在这样一个日益互联、数据密集、由AI驱动的世界中,实现高带宽和低延迟的关键是什么?
五十多年来,以太网协议一直是互联网数据连接的支柱。超大规模运营商的大型数据中心至少管理着ZB级的信息,因此在制定以太网路线图方面发挥着不可或缺的作用。以太网协议标准不断发展,每一代的数据传输速率都在提高。新一代以太网的速度能达到1.6Tbps,有助于推动数据中心转型,让更多信息唾手可得,满足我们的持续需求。
虽然负责管理以太网标准的IEEE预计要到2026年才能最终确定1.6TbE标准,但802.3dj特别工作组有望在2024年完成一组基线功能。因此,现在有必要展开了解1.6T以太网的设计需求。
数据中心正在如何发展?
近年来,云和边缘计算日益普及,AI也正迅速成为带宽发展的强大驱动力。为应对这些趋势,数据中心内的设施已经从仅能处理常规数据量的基本服务器,转型为更复杂、更精密的多机架系统,从而处理远远超出我们想象的海量数据。IDC预计,到2025年,全球数据量将多达175 ZB,这些数据将广泛分布在云端和数据中心。
展望未来,数据中心正向着解耦架构的方向发展,存储、计算和网络等同质资源将分别存在于通过电/光互连进行连接的不同模块中。网络架构本身也呈扁平化趋势,不仅提供了所需的速度和可扩展性,也推动了对更高带宽及更远距离高效连接的需求。
以太网兼具多重优势,例如支持速度协商,能够支持光纤、铜缆和PCB背板等不同种类和类别的介质,是设备间连接的主要接口。1.6TbE最初的应用目标可能是数据中心内的计算集群,用于处理大语言模型(LLM)上的非结构化工作负载。ChatGPT等工具持续涌现,大语言模型在市场中迅速崭露头角。这些模型包含数万亿个参数,且参数量每隔几个月就会翻一番。模型中的大量数据被留在内存中,必须一起处理,因此系统需要大量通过低延迟网络相连的处理器。为了处理这样的工作负载,整个集群将充当单个计算设备,并由多个这样的集群一起处理TB级数据。以太网为这些大规模系统提供了理想的连接协议(见图1)。
▲ 图1 本图着重显示了超大规模数据中心工作负载如何推动对1.6T以太网的需求
为1.6T以太网构建数据连接基础
支持1.6T以太网的数据连接基础结构由控制器和物理层(PHY)组成。控制器包含媒体访问控制(MAC)层、物理编码子层(PCS)和物理媒体连接(PMA)层,负责在硅芯片内实现基本以太网协议功能。集成不同的层后,还需具备优异性能和超低延迟特性。PHY包括PMA和物理媒体相关(PMD)层组成,负责发送和接收数据。此外高性能和低延迟对于PHY也至关重要。考虑到每个物理链路上传输的高速信号,用于防止信号衰减的前向纠错(FEC)成为了PCS的一项基本功能。需要注意的是,如果这些子层都来自不同的供应商,可能会遇到互操作性问题。图2描述了1.6T以太网子系统的组成。
▲ 图2 本图描绘了完整的1.6T以太网子系统和延迟路径
IEEE 802.3dj特别工作组概述了以每秒1.6 TB运行时的PHY和管理参数。具体来说,工作组指定了MAC层的最大误码率(BER)为10^-13,并为使用112G和224G SerDes的芯片到模块(C2M)和芯片到芯片(C2C)应用指定了可选的16通道和8通道连接单元接口(AUI)。对于PHY,规范中说明了三种情况:每个方向上通过八对双轴铜缆进行传输,传输距离至少为1m;通过八对光纤进行传输,传输距离最远达500m;通过八对光纤进行传输,传输距离最远达2km。
经验证的以太网PHY和延迟优化型以太网控制器IP可以满足这些设计的数据传输速度和延迟要求,同时缓解互操作性问题。224G SerDes技术的诞生以及MAC和PCS IP的进步,带来了许多完整、现成的解决方案,这些方案与持续演进的1.6T以太网标准高度契合,展现出强大的性能表现。行业标准不断发展,生态系统在面对多个渠道、多种配置和多个供应商时展现出的互操作性,可以让开发者对无缝生态系统集成充满信心。
▲ 图3 过去两年里,新思科技224G以太网PHY IP在六个开放平台和多个plugfest测试中展现出了行业互操作性
新思科技为1.6T以太网提供了完整的解决方案,目前已为多位客户解决了棘手难题。该解决方案从底层开始采用全新设计,并且融合了我们为400G和800G开发IP的丰富经验和多方面行业优势,与现有实施方案相比,能够将互连功耗降低多达50%。凭借在优化子系统方面的深厚专业底蕴,我们的完整解决方案能够帮助开发者缩短周转时间、降低功耗和延迟。新思科技224G以太网PHY IP兼具出色的信号完整性和抖动性能,FEC后误码率为零,且可以提供额外的信道损耗裕度,能够支持4级脉冲幅度调制(PAM-4)和不归零(NRZ)信令,可交付最高达1.6T的以太网。新型多速率以太网MAC和PCS控制器采用Reed Solomon前向纠错(FEC)专利架构,与前几代产品相比,延迟减少了40%。可配置的以太网PHY和控制器IP均已通过测试且具有互操作性,因此开发者更能专注于设计差异化产品。图3展示了224G以太网PHY IP在各种行业活动中表现的互操作性。
此外,新思科技还率先提供了1.6T验证IP(VIP),可支持早期RTL验证、SoC启动和系统级验证,从而帮助开发者快速完成设计验证收敛。我们发挥自身的技术专长,积极参与标准委员会的活动,与主要生态系统和芯片合作伙伴开展协作,不断扩充产品组合,从而涵盖车用BaseT、AVB/TSN、USXGMII、FlexE和最高达1.6T以太网的所有速度模式。图4重点说明了我们的1.6T以太网IP解决方案。
▲ 图4 新思科技提供完整的1.6T以太网IP解决方案,包括控制器、PHY和验证产品
总结
1.6T以太网有望实现高速数据连接,满足持续飙升的数据需求。以太网IP对于1.6T以太网的基础结构至关重要,可以为超大规模数据中心实现所需的高带宽和低延迟特性。基于多年来在高速接口领域积累的丰富经验,新思科技推出了完整的1.6T以太网IP解决方案,助力各位开发者抢占市场先机,顺利打造下一代数据中心解决方案。