本文来自“深度拆解CPO:AI智算中心光互联演进方向之一”,光电共封装(Co-Packaged Optics,CPO)是一种新型的光电子集成技术。光电共封装基于先进封装技术将光收发模块和控制运算的专用集成电路(ASIC)芯片异构集成在一个封装体内,形成具有一定功能的微系统。
8、《3+份技术系列基础知识详解(星球版)》
光电共封装技术进一步缩短了光信号输入和运算单元之间的电学互连长度,在提高光模块和 ASIC 芯片之间的互连密度的同时实现了更低的功耗,是解决未来大数据运算处理中海量数据高速传输问题的重要技术途径。
根据 Cisco 数据,2010—2022 年全球数据中心的网络交换带宽提升了 80 倍,背后的代价是交换芯片功耗增加约 8 倍,光模块功耗增加 26 倍,交换芯片串行器/解串器(SerDes)功耗增加25 倍。由于光接口依赖于数模混合的 SerDes 技术,其能效演进低于 ASIC 部分,光接口的单比特成本和功耗下降的速率远落后于交换机 ASIC 部分,为了进一步降低功耗,需要通过缩短 SerDes 的距离或者减少 SerDes 的数量来降低功耗,因此在光互联的系统结构上出现了很多新型技术如 OBO、NPO、CPO 等。
AI 光通信时代,CPO 迎三大产业变化
1、 变化 1:硅光技术加速发展,CPO 硅光光引擎不断成熟
硅光光引擎作为 CPO 的技术核心,在 AI 光通信时代加速成熟。硅光技术是实现光子和微电子集成的理想平台。在当前“电算光传”的信息社会下,微电子/光电子其技术瓶颈不断凸显,硅基光电子具有和成熟的 CMOS 微电子工艺兼容的优势,有望成为实现光电子和微电子集成的最佳方案。硅光光引擎作为当前 CPO 光引擎的主流方案,硅光技术的成熟有望进一步带动 CPO 的发展
(1)从硅光技术应用来看,硅光技术作为硅光光模块、CPO 和 OIO 光引擎底
层技术,高速时代基于硅光光通信的拓展,有望进一步催化硅光光引擎技术成熟。
硅光作为光通信技术,有望充分受益于 AIGC 的发展,硅光子技术在数据中心中芯片侧的 OIO、设备侧 CPO、设备间光模块以及数据中心间的相干光通信都有望迎来进一步发展。
(2)从硅光发展节奏来看,全球企业积极推动硅光技术发展,硅光产业链进一
步完善。目前,硅光技术产业仍在发展,产业链不断构建,已初步覆盖了前沿技术研究机构、设计工具提供商、器件芯片模块商、Foundry、IT 企业、系统设备商、用户等各个环节。2010 年左右,硅光技术的研发体制开始由学术机构推进转变为厂商主导。硅光子技术主要有以下几种发展模式:
一是国家项目支持,如美国 2014 年发布“国家光子计划”,出资打造集成光子工艺研究院,随后在 2015 年投资 6.1 亿美元成立集成光子学创新机构 AIM Pho.tonics,组织产业链各环节共同打造标准化的集成光子平台。全球其他相关研究项目和机构,如欧盟 Leti 硅光光模块量产研究计划等。
二是 Intel、IBM 等 IT 巨头的投入,Intel、IBM 从 2003 年左右开始致力于硅光子技术研究,进行了长期、巨额投入。三是小型初创公司早期靠风险资金进入,后期被大企业并购再持续投人,该模式已成为硅光子的一种重要发展模式。四是一些新崛起的初创公司,如 Acacia、SiFotonics 等。
(3)从硅光产业机会来看,硅光方案景气度不断提高,硅光技术有望成厂商切入CPO 产业契机。
第 25 届中国国际光电博览会(CIOE 2024)于 2024 年 9 月 11-13日在深圳国际会展中心举办。在 AI 的拉动下,从光电芯片及光器件/光引擎到光模块在向高速率方向快速升级,同时以硅光/CPO/薄膜铌酸锂/相干等为代表的新技术成熟度不断提升,其中硅光技术成熟度和市场关注度显著提升,众多企业布局硅光技术。
2、 变化 2:龙头厂商积极布局 CPO,进一步催化 CPO 产业发展
各大芯片厂商积极布局 CPO 技术,硅光 CPO 原型机不断推出。CPO 方案众多,各大芯片厂商推出 CPO 方案,其中 Intel、Broadcom、Raonvus、AMD、Marvell、Cisco 等均有在近年 OFC 展上推出 CPO 原型机,不断实现交换容量的提升和功耗的降低,Nvidia 及 TSMC 等厂商也展示了自己的 CPO 计划。我们认为,一方面,其中基于硅光光引擎的 CPO 技术为主流方案,有望充分受益于硅光技术的发展;另一方面,龙头厂商的入局,有望进一步加速 CPO 产业链的完善和发展。
Intel 一直致力于可插拔光模块和微环调制器技术的研究和开发,并在 2020 年后利用其硅光工艺平台来搭建基于微环调制器的 CPO 系统。在“OFC 2020”会议上,Intel 推出首款 CPO 样机,由 1.6Tbit/s 的硅光引擎与 12.8Tbit/s 的可编程以太网交换机集成,并在架构设计上考虑了散热。在 2024 年 IEEE ISSCC 上,Intel 公布了其 CPO技术的最新进展,信号传输速率达到 4x64Gb/s,同时保持了仅为 1.3pl/bit 的低系统功耗;Intel 和 Ayar Labs 合作多年,Supercomputing 2023 大会上展示了将 2 颗 4Tb/s带宽的 TeraPHY OIO chiplet 嵌入到 Intel Agilex FPGA 中,并由两个 SuperNova 光源支持每个 chiplet 上 8 根光纤的 64 个光通道的高速光通信;
Broadcom 在“OFC 2022”会议上,博通推出了首款 CPO 交换机,将 25.6TbpsTomahawk4 交换芯片与光引擎相结合;2023 年推出 Strata Tomahawk XGS5,交换容量为 51.2Tbps,功耗仅为 5.5W,速率为 800Gbps;在“OFC 2024”会议上,Broadcom宣布已向客户交付了业界首款 51.2Tbps CPO 以太网交换机—Bailly,该产品将八个基于硅光子的 6.4-Tbps 光学引擎与 StrataXGS Tomahawk5 交换芯片集成在一起,使光互连的功耗降低了 70%,硅面积效率提高了 8 倍;
Ranovus 在“OFC 2021”会议上发布了 Odin 品牌模拟驱动 CPO 2.0 架构,该架构由 Ranovus、IBM、TE 和 Senko 共同开发,通过消除重定时功能和实施 IC 有效的单芯片解决方案,实现了 40%的功耗降低和成本节约;Ranovus 在“OFC 2023”上展示了将 800G 直驱硅光引擎与 AMD 的 FPGA 芯片相结合;
Marvell 在“OFC 2022”会议上展示了其首款 CPO 样机,带宽为 1.6Tbit/s;在“OFC 2023”会议上发布了 51.2Tbit/s 的交换芯片;
Cisco 在“OFC 2023”上展示了基于 CPO 技术的 25.6T 交换机原型,有八个 3.2T硅光引擎,每个引擎配备八个 400G-FR4 硅光芯片,每个光引擎单通道 100Gbps。
Nvidia 一直在开发硅光 CPO,在“2020 GTC”会议上展示了一个通过 CPO 将GPU 和交换机芯片互连的系统架构图,并与与台积电、Ayarlabs 等公司积极合作开发 CPO 技术;
TSMC 于 2017 年开始与 Luxtera 合作开发了一个 65nm 节点的 12 英寸硅光子工艺平台,随后引入先进封装,推出 COUPE1.0/2.0 平台,在公布的 CPO 发展路线计划 2025 年实现 6.4Tbps 光引擎。
TSMC 宣布推出 COUPE 平台。TSMC 在 2024 年北美技术研讨会上,披露了自身的 3D 光学引擎路线图,并计划为台积电制造的处理器提供高达 12.8 Tbps 的光连接。由于铜缆信号无法满足不断增长的带宽需求,硅光子学将成为未来数据中心的一项关键技术。TSMC 的紧凑型通用光子引擎(COUPE)是硅光子学领域的重要成果之一。该技术采用 TSMC 的 SoIC-X 封装技术,将电子集成电路(EIC)堆叠在光子集成电路(PIC)上,形成 EIC-on-PIC 结构。这种结构可以在模对模接口处实现最低的阻抗,从而实现最高的能效。此外,COUPE 还具备紧凑的集成设计、广泛的波长兼容性、高效的光电转换以及可扩展性和灵活性等特点,使得它能够支持多种光互联应用,并满足不同应用的需求。
目前,台积电的 3D 光学引擎已经进入开发阶段,未来将逐步提升传输速度并将光学连接更靠近处理器本身。COUPE 发展计划有三个阶段,每个阶段都致力于提高传输速率和降低功耗:
(1)2025 年,TSMC 的第一代 3D 光学引擎将集成到运行速度为 1.6 Tbps 的OSFP 可插拔设备中,两倍于当前基于铜的以太网解决方案的最高速率。第一代COUPE 不仅有望实现高带宽,还有望提高电源效率,而这两个问题是现代数据中心中亟待解决的关键问题。
(2)2026 年,TSMC 的第二代硅光产品计划将 COUPE 集成到 CoWoS 封装中,实现交换芯片及光学器件的共封装,这将实现速度高达 6.4 Tbps 的主板级光学互连,第二代功耗预计为第一代的 50%以下,延迟预计为第一代的 10%以下。
(3)第三代产品旨在集成到处理器封装中,COUPE 运行在 CoWoS Interposer上,目标传输速率达 12.8 Tbps,同时使光学连接更接近处理器本身。此阶段迭代仍处于探索阶段,没有明确的发布时间,TSMC 表示正在考虑进一步降低功耗和延迟。
变化 3:AI 时代高速交换机需求增长,CPO 方案优势不断凸显
CPO 交换机 AI 时代迎来产业机遇期。在光互连不断穿透机架和计算系统的背景下,交换机作为光通信网络系统中核心网络设备,随着全球 AI 的高速发展,AI集群规模持续增长,AI 集群网络对组网架构、网络带宽、网络时延、功耗等方面提出更高要求,带动交换机朝着高速率、多端口、低功耗等方向迭代升级,AI 时代 CPO方案交换机有望迎来产业机遇期。
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。