【光电通信】博通的CPO没等到,等来了Nvidia的,800G以上光模块还有戏吗?

今日光电 2025-03-24 18:01
今日光电

     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!


----追光逐电 光引未来----

随着Nvidia  GPU 技术大会 2025 在公司联合创始人兼首席执行官黄仁勋的主题演讲中如火如荼地拉开帷幕,Nvidia 公布了其采用硅光子学和在其 Quantum InfiniBand  Spectrum 以太网交换机系列中部署共封装光学器件(CPO) 的计划。

这不仅是一个令人兴奋的发展,而且事实证明,它将大大降低数据中心规模AI 系统中网络的功率要求。

网络中光学器件消耗的功率巨大,资本支出也是如此。之前一直有传言说数据中心规模集群的大部分成本在于链路两端的光收发器和它们之间的光缆。一些将交换机连接到网络接口卡的部件占网络成本的75%  80%,而交换机和 NIC 则占另外的 20% 25%。听起来很疯狂。

图片

上图基于使用服务器节点的数据中心,每个服务器节点中每四个GPU 配备两个 CPU(如 GB200 NVL72 机架式 MGX 系统设计),数据中心中有100,000 台服务器,因此有400,000  GPU。(如果您使用 HGX 设计,它不会完全连接机架内的 GPU 内存,而只会连接服务器节点内的GPU,那么每四个GPU 就会有一个CPU,并且只需要50,000 台服务器即可容纳400,000  GPU,但它占用的空间只有一半,光收发器也略少。但它占用的空间是原来的两倍。)

Nvidia选择的方案将有240 万个光收发器,这些可插拔模块插入每个服务器端口和每个交换机端口,将电信号转换为可以通过光纤管道传输的光信号。这240 万个收发器使用40 兆瓦的功率,而这些可插拔模块上的激光器占其中的24 兆瓦。

在“传统”超大规模和云数据中心中,它们采用Clos 拓扑而不是像AI  HPC 超级计算机那样采用全胖树拓扑,在收发器上消耗大约 2.3 兆瓦的功率,如果将数字倒过来,则略低于 140,000 个这样的可插拔模块。收发器数量如此之少的原因很简单:一台具有一两个 CPU 的服务器执行 Web 基础设施甚至搜索引擎抓取时只有一个端口,而 GPU 服务器每个 GPU 至少需要一个端口。AI超级计算机中计算引擎的绝对数量推动了光学收发器的使用。

它为业界提供了一个摆脱它们的完美借口,Nvidia正在其下一代Quantum-X InfiniBand Spectrum-X 交换机上实现这一目标,并且可能最终会在其Connect-X SmartNIC BlueField DPU 上实现这一目标,正如我们上面指出的那样,GPU CPU 上的 NVLink 端口以及 NVSwitch 内存原子交换机上

Nvidia 采用了两种不同的共封装光学器件方法,这些方法是与众多合作伙伴共同开发的。硅光子引擎由Nvidia 自己创建(Mellanox在制造可插拔光学器件方面拥有丰富的专业知识),并为这些交换机ASIC 创建了一种新的微环调制器(MRM) 设计,以集成其光学器件。(关于MRM我们在122号的文章中有介绍过)

800 Gb/秒端口中 200 Gb/秒信号通道的迁移可能是推动力。仅仅将信号从交换机ASIC 传输到面板上的端口就需要大量的信号重定时器(每个端口可能多达两个)。

Nvidia 还与晶圆厂合作伙伴台湾半导体制造公司合作,优化了自己的光引擎设计,包括高功率(和高效率)激光器和可拆卸光纤连接器。
图片

未来带有 CPOQuantum-X InfiniBand ASIC 有一个单片交换机ASIC 芯片,带有六个不同的CPO 模块,每个模块都有三个连接器,总共看起来像18 个端口,运行速度为800 Gb/秒,但实际上有36 个端口(每个插头似乎有两个端口)。

显然,这个InfiniBand 较小的 CPO 模块设计为低成本且可高产量制造。这是第一步,它不会导致具有高基数的交换机,因此需要大量的CPO 模块通过服务器上的NIC 互连一定数量的GPU 端口。

带有CPO的 Spectrum-X 采用多芯片设计,以太网交换机ASIC 具有单片数据包处理引擎,由八个SerDes 芯片(每侧两个)包裹,在角落处有四个未知芯片。Spectrum-X CPO 芯片的每一侧都有九个端口,总共36 个端口以 800 GB/秒的速度运行。

在这两种设计中,SerDes的运行速度均为每通道224 Gb/秒,四个通道组成一个端口,Quantum-X ASIC 上的SerDes 总共有 72 个通道,而 Spectrum-X 芯片集合上的 SerDes 144 个通道。

图片

如上图所示,光收发器上的数字信号处理器消耗20 W,为收发器提供光源的外部调制激光器的功率为10 W。因此,240万个收发器共有30 W功率,用于交叉连接100,000 台服务器和400,000  GPU

使用 CPO,交换机盒中有一个连续波激光源,每个端口消耗 2 瓦功率,光学引擎与 Spectrum 交换机 ASIC 使用的相同基板集成,消耗瓦功率。因此,现在每个端口的功率降至瓦,跨越 240万个链路,功率降至21.6 兆瓦。根据计算,链路的功率减少了3.3 倍。

因此使用 CPO 不仅降低了功率,而且由于信号组件之间的转换更少,整体端到端配置中的噪声更少。

图片

每次从一个组件跳转到另一个组件时,都会产生信号噪声,而将可插拔光学器件连接到交换机后,收发器和交换机PCB、基板和端口笼之间会有五次转换,总共会产生 22 dB的信号损失。使用 CPO,基板中有一个转换,用于将交换机 ASIC 连接到硅光子模块,信号损失仅为分贝。信号噪声降低了5.5 倍。

图片

上图显示,在相同的光学功率范围内,GPU数量可以增加 3倍,但正如上图所看到的,实际数量是3.3 倍。值得注意的是,连接任意数量的GPU 所需的激光器数量也将减少倍以上。当然,诀窍是将激光源置于Quantum-X Spectrum-X 交换机内部,以便在发生故障时轻松在现场更换,或者足够可靠,不用担心发生故障。因此,带有CPO Quantum-X Spectrum-X 交换机将采用液体冷却,这样可以让它们在更冷的温度下运行,并且不会让激光器变得异常。

图片

目前,Nvidia计划推出三种不同的交换机。

第一个是Quantum 3450-LD,它将在盒子内部配备四个Quantum-X CPO 插槽,以无阻塞方式完全连接,以800 Gb/秒的速度提供144 个端口,这些端口的总有效带宽为115 Tb/秒。这款Quantum-X 交换机将于2025 年下半年上市。

两款采用 CPOSpectrum-X 交换机需要更长时间才能投入使用,预计要到2026 年下半年才能投入使用。

Nvidia 的第一款采用CPO 的以太网交换机是Spectrum SN6810,它将配备单个Spectrum-X CPO 设备,为 128个以 800 Gb/秒运行的端口提供102.4 Tb/秒的总带宽。(封装上显然有一些额外的CPO 单元,以提高封装产量。)Spectrum SN6800 交换机非常糟糕,有512 个以 800 Gb/秒运行的端口,盒子内的四个ASIC 总共提供409.6 Tb/秒的有效总带宽。

最后,我们把Nvidia Quantum-X与之前大火的BroadcomTomahawk5做了一下比较。如下:

图片
上述文章部分摘自nextplatform


来源:YoYo酱慢谈


申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。



----与智者为伍 为创新赋能----


【说明】欢迎企业和个人洽谈合作,投稿发文。欢迎联系我们
诚招运营合伙人 ,对新媒体感兴趣,对光电产业和行业感兴趣。非常有意者通过以下方式联我们!条件待遇面谈
投稿丨合作丨咨询

联系邮箱:uestcwxd@126.com

QQ:493826566



评论 (0)
  • 汽车导航系统市场及应用环境参照调研机构GII的研究报告中的市场预测,全球汽车导航系统市场预计将于 2030年达到472亿美元的市场规模,而2024年至2030年的年复合成长率则为可观的6.7%。汽车导航系统无疑已成为智能汽车不可或缺的重要功能之一。随着人们在日常生活中对汽车导航功能的日渐依赖,一旦出现定位不准确或地图错误等问题,就可能导致车主开错路线,平白浪费更多行车时间,不仅造成行车不便,甚或可能引发交通事故的发生。有鉴于此,如果想要提供消费者完善的使用者体验,在车辆开发阶段便针对汽车导航功能
    百佳泰测试实验室 2025-03-27 14:51 120浏览
  • 在当今竞争激烈的工业环境中,效率和响应速度已成为企业制胜的关键。为了满足这一需求,我们隆重推出宏集Panorama COOX,这是Panorama Suite中首款集成的制造执行系统(MES)产品。这一创新产品将Panorama平台升级为全面的工业4.0解决方案,融合了工业SCADA和MES技术的双重优势,帮助企业实现生产效率和运营能力的全面提升。深度融合SCADA与MES,开启工业新纪元宏集Panorama COOX的诞生,源于我们对创新和卓越运营的不懈追求。通过战略性收购法国知名MES领域专
    宏集科技 2025-03-27 13:22 119浏览
  • 文/陈昊编辑/cc孙聪颖‍2025 年,作为中国实施制造强国战略第一个十年计划的关键里程碑,被赋予了极为重大的意义。两会政府工作报告清晰且坚定地指出,要全力加速新质生产力的发展进程,推动传统产业全方位向高端化、智能化与绿色化转型。基于此,有代表敏锐提议,中国制造应从前沿技术的应用切入,逐步拓展至产业生态的构建,最终延伸到提升用户体验的维度,打出独树一帜、具有鲜明特色的发展牌。正是在这样至关重要的时代背景之下,于 AWE 2025(中国家电及消费电子博览会)这一备受瞩目的舞台上,高端厨房的中国方案
    华尔街科技眼 2025-03-25 16:10 76浏览
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 136浏览
  • ​2025年3月27日​,贞光科技授权代理品牌紫光同芯正式发布新一代汽车安全芯片T97-415E。作为T97-315E的迭代升级产品,该芯片以大容量存储、全球化合规认证、双SPI接口协同为核心突破,直击智能网联汽车"多场景安全并行"与"出口合规"两大行业痛点,助力车企抢占智能驾驶与全球化市场双赛道。行业趋势锚定:三大升级回应智能化浪潮1. 大容量存储:破解车联网多任务瓶颈随着​车机功能泛在化​(数字钥匙、OTA、T-BOX等安全服务集成),传统安全芯片面临存储资源挤占难题。T97-415E创新性
    贞光科技 2025-03-27 13:50 116浏览
  • 长期以来,智能家居对于大众家庭而言就像空中楼阁一般,华而不实,更有甚者,还将智能家居认定为资本家的营销游戏。商家们举着“智慧家居、智慧办公”的口号,将原本价格亲民、能用几十年的家电器具包装成为了高档商品,而消费者们最终得到的却是家居设备之间缺乏互操作性、不同品牌生态之间互不兼容的碎片化体验。这种早期的生态割裂现象致使消费者们对智能家居兴趣缺失,也造就了“智能家居无用论”的刻板印象。然而,自Matter协议发布之后,“命运的齿轮”开始转动,智能家居中的生态割裂现象与品牌生态之间的隔阂正被基于IP架
    华普微HOPERF 2025-03-27 09:46 80浏览
  • 六西格玛首先是作为一个量度质量水平的指标,它代表了近乎完美的质量的水平。如果你每天都吃一个苹果,有一间水果店的老板跟你说,他们所卖的苹果,质量达到六西格玛水平,换言之,他们每卖一百万个苹果,只会有3.4个是坏的。你算了一下,发现你如果要从这个店里买到一个坏苹果,需要805年。你会还会选择其他店吗?首先发明六西格玛这个词的人——比尔·史密斯(Bill Smith)他是摩托罗拉(Motorloa)的工程师,在追求这个近乎完美的质量水平的时候,发明了一套方法模型,开始时是MAIC,后来慢慢演变成DMA
    优思学院 2025-03-27 11:47 103浏览
  • 在电子设计中,电磁兼容性(EMC)是确保设备既能抵御外部电磁干扰(EMI),又不会对自身或周围环境产生过量电磁辐射的关键。电容器、电感和磁珠作为三大核心元件,通过不同的机制协同作用,有效抑制电磁干扰。以下是其原理和应用场景的详细解析:1. 电容器:高频噪声的“吸尘器”作用原理:电容器通过“通高频、阻低频”的特性,为高频噪声提供低阻抗路径到地,形成滤波效果。例如,在电源和地之间并联电容,可吸收电源中的高频纹波和瞬态干扰。关键应用场景:电源去耦:在IC电源引脚附近放置0.1μF陶瓷电容,滤除数字电路
    时源芯微 2025-03-27 11:19 91浏览
  • 在智能语音产品的开发过程中,麦克风阵列的选型直接决定了用户体验的优劣。广州唯创电子提供的单麦克风与双麦克风解决方案,为不同场景下的语音交互需求提供了灵活选择。本文将深入解析两种方案的性能差异、适用场景及工程实现要点,为开发者提供系统化的设计决策依据。一、基础参数对比分析维度单麦克风方案双麦克风方案BOM成本¥1.2-2.5元¥4.8-6.5元信噪比(1m)58-62dB65-68dB拾音角度全向360°波束成形±30°功耗8mW@3.3V15mW@3.3V典型响应延迟120ms80ms二、技术原
    广州唯创电子 2025-03-27 09:23 101浏览
  • 案例概况在丹麦哥本哈根,西门子工程师们成功完成了一项高安全设施的数据集成项目。他们利用宏集Cogent DataHub软件,将高安全设施内的设备和仪器与远程监控位置连接起来,让技术人员能够在不违反安全规定、不引入未经授权人员的情况下,远程操作所需设备。突破OPC 服务器的远程连接难题该项目最初看似是一个常规的 OPC 应用:目标是将高安全性设施中的冷水机(chiller)设备及其 OPC DA 服务器,与远程监控站的两套 SCADA 系统(作为 OPC DA 客户端)连接起来。然而,在实际实施过
    宏集科技 2025-03-27 13:20 76浏览
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 176浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦