了解光纤传输PCIe

FPGA开发圈 2024-08-28 12:02

作者:技术产品管理部 Keivan Javadi Khasraghi 和 Ruben Sousa

数据中心目前正在努力应对不断增长的带宽容量需求。这主要是由于新技术的出现,特别是对 AI/ML 应用的需求不断增长。随着这些技术的发展,带宽需求预计将呈指数级增长。具体来说,随着大语言模型 (LLM) 变得更加精确和广泛,它们需要越来越高的处理速度。这种对于快速处理 LLM 模型的需求激增,凸显了数据中心内部的低效问题。本技术将深入探讨光纤传输 PCIe 领域,这一解决方案有望解决数据中心激增的带宽需求。我们将探讨资源限制、延迟挑战和能耗。

PCIe 是机架式服务器的首选接口,通过铜缆或背板将资源连接在一起。经过六代部署,再加上即将推出的 PCIe Gen 7.0 规范的审批,PCIe 将继续担当高速互连领域的重要参与者。图 1 展示了 PCIe 链路上的数据通信全栈及其相关组件。

图 1:PCIe 链路上的数据通信全栈




数据中心 AI 工作负载的关键瓶颈



资源限制

当前数据中心正在因为内存带宽和内存利用率问题面临效率挑战。仅能访问本地内存的限制不仅限制了数据处理的速度,还导致数据中心内存的利用不充分。尽管处理器不断发展,纳入了更多速度更快的内核,但这种情况仍在发生。

延迟

目前,延迟问题成为大多数 AI/ML 应用的严重瓶颈。通过铜缆、背板传输高数据速率和复杂调制方案,需要使用前向纠错 (FEC) 这样的先进均衡技术和算法,但这些技术和算法又进一步导致了系统延迟。

能耗

电力是数据中心最亟需的资源,目前的技术需要使用高耗电芯片。据估计,数据中心总电量的 25% 都完全用于点对点数据传输。随着数据传输需求的增长,特别是随着 AI/ML 应用的出现,预计这种能耗将急剧上升。

扩展挑战

随着新的要求和技术的出现,对数据传输和数据处理的需求也越来越高,这将直接导致更高的内存和更快的内存访问需求。数据中心的增长需要网络架构进行相应的扩展,设计可以扩展而不会造成过多财务负担的网络变得非常重要。能够根据需求增加或减少资源,这一能力对于变化激烈的 AI 工作负载至关重要。




为什么选择光纤传输 PCIe



与电气链路相比,光纤链路的带宽密度更高。最初,PCIe 接口开发用于铜缆、DAC 和 PCB 互连。然而,随着数据速率的增加和电气损耗的升级,这种方案变得越来越没有吸引力。

光纤链路具有覆盖更长距离的优势。资源限制,特别是内存限制,让使用仅允许访问本地内存的现有铜缆传输 PCIe 架构来解决问题变得越来越具有挑战性。然而,光纤技术支持不同的处理单元去访问不同服务器单元或机架中的其他内存单元,从而能够突破这一限制。这有利于通过 CXL 交换机和其他类似应用进行资源集中或共享。

在较长距离范围内保持能效和成本效益方面,光纤链路表现优异。与电气链路相比,它们的损耗要小得多,这意味着它们在相同的距离内需要更少的重定时器和信号调节装置。此外,使用低成本、高良率的光纤元件可以进一步降低单位距离的成本。另一方面,铜缆互连在数据中心占据了很大的空间,不适合密集型数据中心。相比之下,光纤更灵活,占用的空间更小,使其成为提高数据中心密度的更好选择。

最后,线性直接驱动光纤链路也有助于减少延迟和降低功耗。可为光纤传输 PCIe 部署不同的光纤架构,从而改善延迟。例如,线性直接驱动光纤可避免链路中出现过多的定时器,从而降低延迟。

图 2 显示了一个光纤传输 PCIe 用例场景,用于根据 OCP(开放计算项目)要求执行的数据中心机架内和机架间配置。此类应用包括 NVMe 和 CXL 支持的离散数据中心的计算、存储、加速器和内存连接场景。

图 2:OCP 通用机架内和机架间 PCIe 连接




实现光纤 PCIe 接口的设计注意事项



PCIe 接口的最初构思并未考虑光纤兼容性。PCIe 互连的应用(如 CPU 到 CPU、GPU 到 GPU 以及 GPU 到存储器)通常使用当前的 PCIe PHY 和控制器,通过铜缆通道,从根联合体到端点加以实现。因此,从使用电气通道的 PCIe 过渡到光纤传输 PCIe 并不是一个简单的过程,有其自己的难题。

第一个挑战在于达到 PCIe 电气合规。这需要明确定义合规规范以确保互操作性。这一挑战的另一个方面是保持与光纤链路的向后兼容性。第二个挑战涉及对光纤传输 PCIe 协议的支持。这可能需要对现有协议进行更改以适应光纤技术。这些变化可能涵盖诸如 Rx 检测(这种方法目前使用阻抗确定远程电气接收器是否可以进行通信,不兼容光纤方法)、电气 IDLE 状态管理、带有光纤器件的 SSC 时钟的性能以及边带信号的处理等方面。

PCI-SIG 光纤工作组成立于 2023 年 8 月,旨在应对 PCIe 光纤技术采用方面的挑战。Synopsys 积极参与讨论,帮助推进“光纤友好型”PCIe 标准。




PCIe 上光纤链路的重定时和非重定时拓扑



重定时拓扑是一种关键方法,最多可在端到端链路中使用两个重定时器。在此拓扑结构中需要考虑的一些重要方面包括战略布局,以及部署的重定时器的精确数量。

相反,非重定时(即线性)拓扑引入了一组更复杂的挑战。这主要是因为线性链路破坏了路径的连续性,使得更难以遵循现有的 PCIe 标准和合规性规定。在此拓扑中,有效调节通道损耗至关重要。此外,还需要对协议层进行重大改变,并且可能还需要对 PHY 层进行重大改变。对所有类型的光纤引擎进行全面的可行性研究,也是该拓扑结构的一个关键方面。

图 3:实现光纤传输 PCIe 的各种拓扑

除了链路拓扑外,还应考虑其他关键元素,如外形标准化和 FEC 方案,以便通过光纤成功建立 PCIe 链路。目前正在评估 CDFP、OSFP、QSFP、QSFPDD 等形状,仔细考虑每个形状的优缺点。FEC 讨论中也发生了同样的情况,正在考虑采用级联 FEC 架构部分满足光纤 PMD 要求或扩展其范围,同时为整个系统提供低延迟。




在实践中见真章



光纤传输 PCIe 是建立机架单元互联,使其能够作为一个集群运行的关键。PCIe 发挥着核心作用,因为它充当控制器,是与特定软件连接的数字逻辑。其中一个主要障碍是确保向光纤 PCIe 的过渡不会干扰软件堆栈的控制过程。

更大的挑战是物理层的管理和电气-光纤接口的互操作性。Synopsys 与 OpenLight 合作,通过提供可与光纤 IP 配合使用的电气 IP 解决方案,在这个领域发挥着关键作用。一旦建立通用标准,任何光晶粒供应商都将能够集成 PCIe。Synopsys 和 OpenLight 在 OFC 2024 期间展示了全球首款采用线性驱动方法的光纤传输 PCIe 7.0 数据速率演示版本,此外,我们还展示了光纤传输 PCIe 6.x 演示版本。该演示版本展示了端到端链路 BER 性能比 FEC 阈值高出几个数量级,表明采用光纤传输 PCIe 7.0 的可行性优于采用 128Gbps PAM4 传输。这样的性能是通过使用离散电气和光纤组件构建光纤传输 PCIe 链路达到的。正如 OFC24 期间展示的那样,驱动具有卓越 PPA 和延迟的电气 PCIe 链路的 Synopsys SerDes 依然不受这种不理想甚至最差情况用例场景的限制,展示了 Synopsys SerDes 的灵活性和稳定性。




总结



很明显,在 AI/ML 及随之而来的带宽需求主导的时代,光纤传输 PCIe 代表了信号传输的未来趋势。其开发和采用取决于支持性生态系统的实现情况,Synopsys 正在积极构建这一生态系统。Synopsys 适用于 PCIe 的完整 IP 解决方案,经过不断开展互操作性演示并在 PCIe 7.0 数据速率和光纤传输 PCIe 6.x 方面取得了出色的现场成绩,有助于减少集成和降低风险,并实现首次即流片成功。

文章来源:Synopsys

FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 58浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 105浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 156浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 188浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 184浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 123浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 64浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 502浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 76浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 118浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 200浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦