兼容批量LPO光模块,凭什么是新华三交换机?

原创 网优雇佣军 2024-09-29 11:29

尽可能减少数据传输所消耗的电力,以致于让每一瓦特电力都用于AI计算。面对“算力的尽头是电力”,这是AI时代每一位智算中心运营者的梦想。


但要接近这一梦想变得越来越难。当前,AI应用和大模型的飞速发展正推动智算中心AI集群的规模和数据流量激增,带动智算网络的能耗和成本节节攀升。尤其是网络中的光模块器件,由于带宽和数量都将成倍提升,面临的整体功耗问题尤为突出。


在此背景下,为了给“实际计算腾出更多的电力”,一种新的光模块技术——LPO(线性驱动可插拔光模块)脱颖而出。LPO采用线性直驱技术,取消了传统可拔插光模块中的DSP或CDR芯片,从而可显著降低光模块的功耗、成本和时延。


尽管LPO优势明显,但要实现规模部署,首先面临着交换机与光模块之间的互联互通挑战。


值得庆贺的是,在不久前举行的IFOC 2024上,业界传出了一则劲爆消息:新华三独家受邀在现场展示了H3C S9827-128DH高密400G智算交换机与多家厂商的400G DSP&LPO模块的互联测试,结果显示DSP和LPO的性能表现相近,验证了基于112G SerDes的LPO方案的市场可行性。


此次互联测试背后有着怎样的技术逻辑和门槛?为什么偏偏新华三能做到?我们来展开讲一讲。



去掉DSP的LPO



众所周知,光模块在网络连接中执行光信号和电信号转换的任务,传统可拔插光模块主要由DSP(数字信号处理器)、TIA(跨阻抗放大器)、Driver(驱动器)、LD(激光器)、PD(光电探测器)等部分组成。连接交换机后,信号发送的大致流程是:交换机ASIC SerDes将电信号通过PCB(印刷电路板)驱动到光模块,光模块中的DSP芯片接收电信号并执行信号再生、信号均衡补偿等功能,然后电信号经过Driver放大后由激光器转换为光信号发射出去。


显然,在传统可拔插光模块中,DSP是关键组件。由于信号通过PCB上的传输线时会发生损耗,且损耗会随着数据速率和传输线长度增加而增加,而DSP芯片的引入可缓解链路损耗和对抗信号失真。


但DSP芯片也有缺点,大家都知道,凡是负责高速数字信号处理的芯片都很耗电且成本高昂。数据显示,400G光模块中典型的7nm DSP功耗占模块功耗的50%。进入AI时代,随着AI集群规模不断扩张,光模块在智算网络中的整体功耗还会进一步加剧。一方面,光模块速率从100G、200G向400G、800G甚至1.6T演进,致使单个光模块的功耗持续攀升。另一方面,由于智算网络架构更加扁平且无收敛,AI集群规模扩张会引发对光模块的数量需求急剧上涨。据计算,智算网络所需的光模块数量将相对GPU数量呈数倍增长。


正因如此,LPO技术从2023年开始受到业界广泛关注。如上图所示,LPO摒弃了传统光模块里的DSP,取而代之的是,将相关功能集成到交换机ASIC,并采用性能更优、信号补偿能力更强的TIA和Driver电芯片。这样一来,光模块中只剩下线性模拟组件和光引擎部分,从而可显著降低光模块功耗、延迟、成本和尺寸。



压力给到了交换机



显而易见,LPO方案将信号再生和数字信号补偿功能转移到交换机侧后,主要依靠ASIC SerDes来整合端到端链路性能,自然对交换机的性能和兼容性提出了更高的要求。


首先,LPO光模块去掉DSP后只剩下对抖动、噪声、干扰、衰减等更加敏感的线性模拟组件,尽管Driver/TIA具有更强的均衡能力,但仍然不可避免地会将这些影响信号完整性的因素层层传递和叠加,进而造成整条链路的误码率增加。因此,这要求对交换机的电路部分进行精心设计,以实现更低的交换机端口损耗,确保到达光模块的电信号质量足够好。


其次,交换机ASIC SerDes与光模块之间通过PCB上的传输线路连接,受走线、打孔、焊接等PCB制造工艺的影响,交换机各个端口的插入损耗和回波损耗必然存在一定的差异,导致同一LPO光模块在不同交换机端口的误码率性能表现不一致。这要求交换机能对高损耗端口进行补偿,并能根据不同端口的损耗匹配最优的均衡参数,从而确保交换机全端口支持LPO光模块。


再者,由于采用的激光器方案、支持的传输距离等不同,LPO光模块具有多种类型,考虑不同厂家、不同类型的LPO光模块的光电通道特性不同,交换机还需具备识别光模块类型的能力,并能根据不同的信道特性、TIA/Driver参数进行均衡参数自动调优,以主动适配光模块,使端到端链路性能达到最优。



为什么是新华三?



本次互联测试在H3C S9827-128DH与各厂商的多种类型的LPO光模块之间完成了光眼图测试和误码率测试,结果显示:一、H3C S9827-128DH端口可以识别400G VR4+VCSEL、400G DR4+硅光、400G DR4+EML等不同类型、不同规格的QSFP112模块,同时交换机不同端口保持较好的电信号一致性;二、各厂商的LPO模块在H3C S9827上的误码率均低于门限要求,且经过与主机适配调优的LPO模块误码率表现较好,与DSP方案光模块误码率相近。


图示:不同厂商的LPO模块在不同端口上的误码率对比图

这些良好的测试结果无疑证明了新华三智算交换机已解决LPO方案带给交换机的新挑战,彰显出新华三智算交换机产品强大的性能、稳定性和兼容性,为LPO光模块规模应用再添助力。这背后,新华三是如何做到的?


首先,为确保交换机全端口性能一致良好,新华三 S9827-128DH采用51.2T交换芯片、以及领先的超低损PCB板材,并精密设计端口与PCB板材之间的布局走线,最大化减少电信号衰减和串声干扰。同时,经过长达半年的反复测试、修改、优化交换机驱动软件和高速模块寄存器中的高速电信号参数(预加重、均衡等),选取最优的参数模型,导入交换机的固化软件系统中。在模块上电后,将自动识别高速模块并赋予其兼容范围最好的电信号,实现较低的误码率,保障业务端口稳定运行。


其次,为了广泛兼容不同规格、不同技术方案的高速模块,H3C S9827-128DH交换机软件遵循CMIS和SFF-8636,采用逻辑读取器,在读取光模块寄存器中的信息后,通过在驱动软件导入的灵活、完善的识别策略,实现对各厂家的不同模块规格(VR4、DR4等)、不同芯片方案(DSP、LPO)、不同激光器方案(EML、硅光)、多种应用模式(一对一、一分二)的QSFP112模块的类型读取,可灵活智能识别端口模块模式,快速上电。


最后,谋全局,方能引领变革。以上所有的技术创新突破当然都离不开新华三的前瞻性布局。面对日新月异的AI技术和应用推动智算中心的异构算力规模和复杂性节节攀升,给智算网络的性能、能效等提出了越来越高的要求,新华三始终倡导以开放标准的联接技术打通智算互联互通的大动脉。光模块作为智算网络的关键器件,此次新华三智算交换机完成与各厂商、各种类型的LPO光模块的良好对接,正是践行开放标准路线的一次生动实践。


事实上,在前瞻性布局引领下,新华三不只是推出了400G/800G LPO高密智算交换机,还推出了支持同城长距集群间的互联互通的400G/800G ZR/ZR+ DCI硬件方案、具有极致的转发性能与网卡解耦能力的算力集群核心交换机H3C S12500 AI等众多产品与解决方案,充分表明其已在AI算力时代把握住了先发优势,为推动智算网络变革和助力AI产业绿色高效发展做好了充分准备。


网优雇佣军投稿邮箱:wywd11@126.com
长按二维码关注
通信路上,一起走!

网优雇佣军 通信、科技、未来!通信路上,一起走!
评论
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 66浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 41浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 166浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 107浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 73浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 78浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 73浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 63浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 76浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 71浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦