以太网+PCIe+UCIeIP:数据中心的三重“超能力”

原创 新思科技 2025-02-19 17:38


Multi-Die设计正成为增强数据中心现代计算性能、可扩展性和灵活性的关键解决方案。通过将传统的单片设计拆分为更小的异构或同构芯片(也称小芯片),开发者可以针对特定任务优化每个组件,进而显著提高效率和能力。这种模块化策略对数据中心特别有利,因为数据中心需要高性能、可靠且可扩展的系统来处理大量数据和复杂的AI工作负载。 


超大规模数据中心不断发展的复杂架构可以使用各种类型的Multi-Die设计:


  • 计算芯片负责核心处理任务,包括通用CPU、用于并行处理的GPU以及专用于人工智能(AI)和机器学习(ML)的加速器

  • 内存芯片为数据密集型应用提供必要的存储和带宽,支持各种类型的内存,如DDR、HBM和新兴的非易失性技术

  • IO芯片负责管理输入和输出操作,促进计算单元与内存、网络和存储等外部接口之间的数据传输,确保高数据带宽和低延迟 

  • 此外,定制芯片可以满足特定要求或优化特定功能,包括增强数据保护的安全设计、高效节能的电源管理设计以及具备高级通信功能的网络设计。 

本文深入探讨了PCIe和以太网以及UCIe IP的多芯片设计如何最大限度地提高带宽和性能,助力现代化AI数据中心基础设施实现纵向和横向扩展。


为何纵向和横向扩展是数据中心连接性的关键


互连是构建AI基础结构的一大挑战,我们应如何将多个数据中心的数万台服务器连接在一起,形成能够处理AI工作负载的庞大网络?AI数据中心的复杂性不言而喻,涵盖多个CPU和加速器、各种交换机、大量NIC以及其他设备。无缝连接这些组件离不开高效的网络。因此,纵向和横向扩展技术就显得至为关键。IO分解为这两种扩展策略提供了契机。在纵向扩展场景中,PCIe和UCIe利用UCIe IP实现Die-to-Die连接,构建内部网络结构;同时,对于横向扩展场景,以太网和UCIe IP则可以在服务器间建立高速、低延迟链路。


纵向扩展和横向扩展概述


纵向扩展(或垂直扩展)指的是通过添加CPU数量、扩展内存或增强存储容量增加单台服务器的资源。这种方法将所有资源集中在一台机器内,可以简化架构、降低延迟。纵向扩展的核心在于用来构建内部网络结构的PCIe技术。最新的PCIe 7.0标准可连接CPU、GPU、NIC、存储驱动器等外设,提供低延迟和高带宽接口,确保服务器内的高效通信。


横向扩展(或水平扩展)是将工作负载分配到多台服务器上,创建协同工作的机器网络。这种方法经济高效、具备冗余能力,并能灵活应对不断增长的工作负载。然而,这也增加了网络配置与管理的复杂性,因为多台机器间的通信可能会增加延迟。因此,以太网技术和即将推出的超级以太网标准便显得尤为重要,它们为数据中心内的服务器提供了高速、低延迟通信链路。目前,业界正在积极探讨新标准,旨在实现AI加速器与交换机之间的高速链路,确保数据传输与协调工作更加高效。 

  ▲ 图1 数据中心架构扩展所需关键互连技术一览


集成以太网和PCIe的Multi-Die设计


如图1所示,Multi-Die设计为实现纵向与横向扩展提供了诸多可能。Multi-Die设计采用了PCIe、以太网和UCIe IP,对缩短上市时间、降低成本和风险至关重要,同时提供了全面的架构灵活性。接下来,本文将详细介绍Multi-Die设计的几个主要IO小芯片类型,包括超大型AI训练芯片、交换机SoC以及重定时器。 


  超大型AI训练芯片 


为了处理庞大的数据模型,AI芯片必须能高效执行计算和数据管理任务。AI训练专用芯片旨在满足这些巨大的计算和数据处理需求,在单个芯片上集成多个处理单元、内存和互连,以提供优越的性能和效率。因此,集成了40G UCIe和224G以太网的Multi-Die设计应运而生,为AI的高效训练带来了实现方案。数据中心不再需要依赖于数千个庞大的GPU,而是可以通过更加小巧的SoC来执行AI训练,这大幅减小了延迟和功耗,进一步改善了带宽和传输距离。


224G以太网PHY IP提供了强大且可定制的接口。CEI-224G还在不断发展,对AI训练操作来说,实现每通道224Gbps,同时保持生态系统互操作性并降低功耗至关重要。此外,UCIe IP可以在多个芯片上提供高速、低延迟、节能的数据传输,速度高达40Gbps,显著增强这些芯片的可扩展性和模块化。


  ▲ 图2 适用于AI训练芯片的224G/UCIe Multi-Die设计


  具有电或光合封接口的100T交换机SoC


AI加速器当然非常重要,但怎么将它们连接到一起呢?这需要很多交换机。交换机SoC正成为横向扩展AI和HPC数据中心并保持低功耗的另一种解决方案,电传输距离为3-4米,光传输距离为10-100米。这些SoC将电和光互连直接集成到CPU和GPU中,有助于增强网络优化的可扩展性和效率,对缓解集群规模迅速扩张时的连接性瓶颈非常重要。电I/O虽支持高带宽密度且功耗低,但传输距离有限;而光互连则能显著延长数据传输范围。可插拔光收发器模块能增加传输距离,但大规模AI工作负载难以承受其高昂成本与整体能耗。相比之下,共封装光I/O方案支持更高带宽,其功耗更低、延迟更小且传输距离更远,恰好能够迎合AI/ML基础结构的扩展需求。


光和电IO可支持以224Gbps运行的多条高速通道,且相比传统可插拔QSFPDD或OSFP收发器模块,其功耗显著降低。此外,集成UCIe和高速以太网等先进标准,可促进与主芯片的高速、低延迟通信,突破传统互连的局限性。 


  ▲ 图3 100T光/电交换机SoC


  用于重定时器或扩展传输范围的高带宽IO 


重定时器和扩展传输范围解决方案也同样不可或缺,可以维持信号完整性、减少长距离延迟。重定时器支持PCIe和CXL等高级协议,可无缝集成到现代数据中心架构中,并实现大量内存扩展,无需彻底改造现有系统。这种兼容性对于处理内存密集型AI推理操作以及克服PCIe 7.0等新标准带来的信号完整性挑战至关重要。


PCIe和CXL协议的融合正通过实现内存池和动态、经济高效的内存分配重塑数据中心架构。为了使重定时器在新环境中发挥作用,它们必须具有协议感知能力,并能够适应快速发展的CXL标准。片上诊断、安全启动功能和低功耗等特性对于确保安全、易于调试和可持续性至关重要。业界向Multi-Die设计的转变进一步强调了通用、高带宽I/O解决方案的必要性,从而简化了系统设计并加快了上市时间。这些技术进步不仅对于满足当前AI与高性能计算的需求至关重要,也确保了数据中心能够轻松应对未来不断攀升的算力与带宽需求。


  ▲ 图4 重定时器或扩展传输范围IO设计



采用以太网、PCIe和UCIe IP的Multi-Die实现示例


图5为Multi-Die设计示例,其中包含224G以太网PHY和集成1.6T PCS和MAC以太网控制器、PCIe 6.x或7.0 PHY和控制器、安全IP、传感器、DFT和UCIe PHY和控制器IP。该设计可以重新配置,为各种通道实现1.6T/3.2T/6.4T带宽,包括45dB LR、MR和VSR以太网以及PCIe 6.x和7.0范围。


  • 45dB长距离以太网和UCIe重定时器Die-to-Die设计

  • 组合PCIe/CXL/以太网和UCIe Die-to-Die设计

  • 适用于交换机的1.6T/3.2T/6.4T可扩展IO设计 


  ▲ 图5 Multi-Die设计框图 


这种Multi-Die设计支持双向224G数据传输的可配置通道数,能应对高达45dB的插入损耗。其目的是满足AI基础结构对更高带宽、更低功耗和更远传输距离的需求。该示例增强了CPU/GPU集群连接和创新计算架构的可扩展性,包括一致性内存扩展和资源解耦。



总结


集成PCIe和以太网等高速接口以及UCIe IP和链路健康监控功能,有助于扩展Multi-Die设计的带宽。新思科技为UCIe提供高达40Gbps的高质量、完整IP解决方案,集成信号完整性监视器和可测试性功能、224G以太网及PCIe 7.0,能够大幅提高带宽、降低延迟并改善可扩展性。新思科技的Multi-Die设计IP解决方案遵循不断演变的行业标准,可以与生态系统内的产品互操作,其多项前沿技术已经应用到芯片中,是实现下一代数据中心AI芯片的低风险解决方案。 





如需了解更多信息,请扫描下方二维码联系我们

    
               

                      

                    
             

                   
                   

                 
                 

                 

         
                                     
                                     


                               

                                 

新思科技 新思科技(Synopsys, Inc.)以芯片产业的“根技术”推动AI、5G、高性能计算、智能汽车等前沿应用的核心技术发展。
评论 (0)
  • 【拆解】+CamFi卡菲单反无线传输器拆解 对于单反爱好者,想要通过远程控制自拍怎么办呢。一个远程连接,远程控制相机拍摄的工具再合适不过了。今天给大伙介绍的是CamFi卡菲单反无线传输器。 CamFi 是专为数码单反相机打造的无线传输控制器,自带的 WiFi 功能(无需手机流量),不但可通过手机、平板、电脑等设备远程连接操作单反相机进行拍摄,而且还可实时传输相机拍摄的照片到 iPad 和电视等大屏设备进行查看和分享。 CamFi 支持大部分佳能和尼康单反相机,内置可充电锂离子电池,无需相机供电。
    zhusx123 2025-05-11 14:14 92浏览
  • ‌磁光克尔效应(Magneto-Optic Kerr Effect, MOKE)‌ 是指当线偏振光入射到磁性材料表面并反射后,其偏振状态(偏振面旋转角度和椭偏率)因材料的磁化强度或方向发生改变的现象。具体表现为:1、‌偏振面旋转‌:反射光的偏振方向相对于入射光发生偏转(克尔旋转角 θK)。2、‌椭偏率变化‌:反射光由线偏振变为椭圆偏振(克尔椭偏率 εK)。这一效应直接关联材料的磁化状态,是表征磁性材料(如铁磁体、反铁磁体)磁学性质的重要非接触式光学探测手段,广泛用于
    锦正茂科技 2025-05-12 11:02 95浏览
  • 递交招股书近一年后,曹操出行 IPO 进程终于迎来关键节点。从 2024 年 4 月首次递表,到 2025 年 4 月顺利通过中国证监会境外发行上市备案,并迅速更新招股书。而通过上市备案也标志着其赴港IPO进程进入实质性推进阶段,曹操出行最快有望于2025年内完成港股上市,成为李书福商业版图中又一关键落子。行路至此,曹操出行面临的挑战依然不容忽视。当下的网约车赛道,早已不是当年群雄逐鹿的草莽时代,市场渐趋饱和,竞争近乎白热化。曹操出行此时冲刺上市,既是背水一战,也是谋篇布局。其招股书中披露的资金
    用户1742991715177 2025-05-10 21:18 57浏览
  •   基于 2025 年行业权威性与时效性,以下梳理国内知名软件定制开发企业,涵盖综合型、垂直领域及特色技术服务商:   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转型、新能源软件、光伏软件、汽车软件,ERP,系统二次开发,CRM等领域有很多成功案例。   五木恒润科技有限公司:是一家专业的部队信
    华盛恒辉l58ll334744 2025-05-12 16:13 75浏览
  • 体积大小:14*11*2.6CM,电气参数:输入100V-240V/10A,输出16V24A。PCB 正面如下图。PCB 背面如下图。根据实际功能可以将PCB分成几部分:EMI滤波,PFC电路,LLC电路。EMI滤波区域,两级共模电感,LN各用了保险丝加压敏电阻,继电器(HF32FV-G)用来切除NTC的,为了提高效率点,如下图。PFC电路区域,如下图。LLC电路区域,如下图。详细分析一下该电源用的主要IC还有功率器件。AC侧采用了两颗整流桥进行并联,器件增加电流应力,如下图。共模电感都有放电针
    liweicheng 2025-05-10 20:03 42浏览
  •         信创产业含义的“信息技术应用创新”一词,最早公开信息见于2019年3月26日,在江苏南京召开的信息技术应用创新研讨会。本次大会主办单位为江苏省工业和信息化厅和中国电子工业标准化技术协会安全可靠工作委员会。        2019年5月16日,美国将华为列入实体清单,在未获得美国商务部许可的情况下,美国企业将无法向华为供应产品。       2019年6
    天涯书生 2025-05-11 10:41 128浏览
  • 蓝牙耳机是长这个样子,如下图。背部图,如下图。拆开L耳的一侧,有NFC和电池包(501230 3.7V 150mAh)如下图。电池包(501230 3.7V 150mAh)如下图。NFC正面,如下图。NFC背面,如下图。如何理解NFC的工作原理呢,搜集一下相关的资料,如下图。拆开R耳的一侧,PCB正面,如下图。PCB背面,如下图。有两组红黑的线,一组连接到了喇叭,另一组连接到了MIC头上,MIC头参数如下图。蓝牙模块(CSR 8635),有蛇形PCB走线做成天线,节约了天线成本,如下图。该IC介
    liweicheng 2025-05-10 00:45 39浏览
  • 在 AI 浪潮席卷下,厨电行业正经历着深刻变革。AWE 2025期间,万得厨对外首次发布了wan AiOS 1.0组织体超智能系统——通过AI技术能够帮助全球家庭实现从健康检测、膳食推荐,到食材即时配送,再到一步烹饪、营养总结的个性化健康膳食管理。这一创新之举并非偶然的个案,而是整个厨电行业大步迈向智能化、数字化转型浪潮的一个关键注脚,折射出全行业对 AI 赋能的热切渴求。前有标兵后有追兵,万得厨面临着高昂的研发成本与技术迭代压力,稍有懈怠便可能被后来者赶
    用户1742991715177 2025-05-11 22:44 73浏览
  • 【拆解】+自动喷香机拆解 家里之前买了从PDD买了一个小型自动喷香机放在厕所里。来增加家里的温馨感,这东西看着确实小巧,精致。可是这东西吧,耗电就是快,没过几天就没电了。今个就让我拆开看看什么在捣鬼。如下是产品的实物和宣传图: 由于螺丝孔太小和限位很深。对于我的螺丝刀套装没用。只能使用那种螺丝刀细头,同时又长的小螺丝刀进行拆解 拧下三颗螺丝钉,用一字螺丝刀撬开外壳,内部结构就呈现在眼前。 内部构造相当简单,部件没多少。就是锂电池供电,通过MCU实现按键控制,段码屏控制,LE
    zhusx123 2025-05-10 19:55 56浏览
  • 在印度与巴基斯坦的军事对峙情境下,歼10C的出色表现如同一颗投入平静湖面的巨石,激起层层涟漪,深刻印证了“质量大于数量”这一铁律。军事领域,技术优势就是决定胜负的关键钥匙。歼10C凭借先进的航电系统、强大的武器挂载能力以及卓越的机动性能,在战场上大放异彩。它能够精准捕捉目标,迅速发动攻击,以一敌多却毫不逊色。与之形成鲜明对比的是,单纯依靠数量堆砌的军事力量,在面对先进技术装备时,往往显得力不从心。这一现象绝非局限于军事范畴,在当今社会的各个领域,“质量大于数量”都已成为不可逆转的趋势。在科技行业
    curton 2025-05-11 19:09 180浏览
  •   定制软件开发公司推荐清单   在企业数字化转型加速的2025年,定制软件开发需求愈发多元复杂。不同行业、技术偏好与服务模式的企业,对开发公司的要求大相径庭。以下从技术赛道、服务模式及行业场景出发,为您提供适配的定制软件开发公司推荐及选择建议。   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转
    华盛恒辉l58ll334744 2025-05-12 15:55 106浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦