以太网+PCIe+UCIeIP:数据中心的三重“超能力”

原创 新思科技 2025-02-19 17:38


Multi-Die设计正成为增强数据中心现代计算性能、可扩展性和灵活性的关键解决方案。通过将传统的单片设计拆分为更小的异构或同构芯片(也称小芯片),开发者可以针对特定任务优化每个组件,进而显著提高效率和能力。这种模块化策略对数据中心特别有利,因为数据中心需要高性能、可靠且可扩展的系统来处理大量数据和复杂的AI工作负载。 


超大规模数据中心不断发展的复杂架构可以使用各种类型的Multi-Die设计:


  • 计算芯片负责核心处理任务,包括通用CPU、用于并行处理的GPU以及专用于人工智能(AI)和机器学习(ML)的加速器

  • 内存芯片为数据密集型应用提供必要的存储和带宽,支持各种类型的内存,如DDR、HBM和新兴的非易失性技术

  • IO芯片负责管理输入和输出操作,促进计算单元与内存、网络和存储等外部接口之间的数据传输,确保高数据带宽和低延迟 

  • 此外,定制芯片可以满足特定要求或优化特定功能,包括增强数据保护的安全设计、高效节能的电源管理设计以及具备高级通信功能的网络设计。 

本文深入探讨了PCIe和以太网以及UCIe IP的多芯片设计如何最大限度地提高带宽和性能,助力现代化AI数据中心基础设施实现纵向和横向扩展。


为何纵向和横向扩展是数据中心连接性的关键


互连是构建AI基础结构的一大挑战,我们应如何将多个数据中心的数万台服务器连接在一起,形成能够处理AI工作负载的庞大网络?AI数据中心的复杂性不言而喻,涵盖多个CPU和加速器、各种交换机、大量NIC以及其他设备。无缝连接这些组件离不开高效的网络。因此,纵向和横向扩展技术就显得至为关键。IO分解为这两种扩展策略提供了契机。在纵向扩展场景中,PCIe和UCIe利用UCIe IP实现Die-to-Die连接,构建内部网络结构;同时,对于横向扩展场景,以太网和UCIe IP则可以在服务器间建立高速、低延迟链路。


纵向扩展和横向扩展概述


纵向扩展(或垂直扩展)指的是通过添加CPU数量、扩展内存或增强存储容量增加单台服务器的资源。这种方法将所有资源集中在一台机器内,可以简化架构、降低延迟。纵向扩展的核心在于用来构建内部网络结构的PCIe技术。最新的PCIe 7.0标准可连接CPU、GPU、NIC、存储驱动器等外设,提供低延迟和高带宽接口,确保服务器内的高效通信。


横向扩展(或水平扩展)是将工作负载分配到多台服务器上,创建协同工作的机器网络。这种方法经济高效、具备冗余能力,并能灵活应对不断增长的工作负载。然而,这也增加了网络配置与管理的复杂性,因为多台机器间的通信可能会增加延迟。因此,以太网技术和即将推出的超级以太网标准便显得尤为重要,它们为数据中心内的服务器提供了高速、低延迟通信链路。目前,业界正在积极探讨新标准,旨在实现AI加速器与交换机之间的高速链路,确保数据传输与协调工作更加高效。 

  ▲ 图1 数据中心架构扩展所需关键互连技术一览


集成以太网和PCIe的Multi-Die设计


如图1所示,Multi-Die设计为实现纵向与横向扩展提供了诸多可能。Multi-Die设计采用了PCIe、以太网和UCIe IP,对缩短上市时间、降低成本和风险至关重要,同时提供了全面的架构灵活性。接下来,本文将详细介绍Multi-Die设计的几个主要IO小芯片类型,包括超大型AI训练芯片、交换机SoC以及重定时器。 


  超大型AI训练芯片 


为了处理庞大的数据模型,AI芯片必须能高效执行计算和数据管理任务。AI训练专用芯片旨在满足这些巨大的计算和数据处理需求,在单个芯片上集成多个处理单元、内存和互连,以提供优越的性能和效率。因此,集成了40G UCIe和224G以太网的Multi-Die设计应运而生,为AI的高效训练带来了实现方案。数据中心不再需要依赖于数千个庞大的GPU,而是可以通过更加小巧的SoC来执行AI训练,这大幅减小了延迟和功耗,进一步改善了带宽和传输距离。


224G以太网PHY IP提供了强大且可定制的接口。CEI-224G还在不断发展,对AI训练操作来说,实现每通道224Gbps,同时保持生态系统互操作性并降低功耗至关重要。此外,UCIe IP可以在多个芯片上提供高速、低延迟、节能的数据传输,速度高达40Gbps,显著增强这些芯片的可扩展性和模块化。


  ▲ 图2 适用于AI训练芯片的224G/UCIe Multi-Die设计


  具有电或光合封接口的100T交换机SoC


AI加速器当然非常重要,但怎么将它们连接到一起呢?这需要很多交换机。交换机SoC正成为横向扩展AI和HPC数据中心并保持低功耗的另一种解决方案,电传输距离为3-4米,光传输距离为10-100米。这些SoC将电和光互连直接集成到CPU和GPU中,有助于增强网络优化的可扩展性和效率,对缓解集群规模迅速扩张时的连接性瓶颈非常重要。电I/O虽支持高带宽密度且功耗低,但传输距离有限;而光互连则能显著延长数据传输范围。可插拔光收发器模块能增加传输距离,但大规模AI工作负载难以承受其高昂成本与整体能耗。相比之下,共封装光I/O方案支持更高带宽,其功耗更低、延迟更小且传输距离更远,恰好能够迎合AI/ML基础结构的扩展需求。


光和电IO可支持以224Gbps运行的多条高速通道,且相比传统可插拔QSFPDD或OSFP收发器模块,其功耗显著降低。此外,集成UCIe和高速以太网等先进标准,可促进与主芯片的高速、低延迟通信,突破传统互连的局限性。 


  ▲ 图3 100T光/电交换机SoC


  用于重定时器或扩展传输范围的高带宽IO 


重定时器和扩展传输范围解决方案也同样不可或缺,可以维持信号完整性、减少长距离延迟。重定时器支持PCIe和CXL等高级协议,可无缝集成到现代数据中心架构中,并实现大量内存扩展,无需彻底改造现有系统。这种兼容性对于处理内存密集型AI推理操作以及克服PCIe 7.0等新标准带来的信号完整性挑战至关重要。


PCIe和CXL协议的融合正通过实现内存池和动态、经济高效的内存分配重塑数据中心架构。为了使重定时器在新环境中发挥作用,它们必须具有协议感知能力,并能够适应快速发展的CXL标准。片上诊断、安全启动功能和低功耗等特性对于确保安全、易于调试和可持续性至关重要。业界向Multi-Die设计的转变进一步强调了通用、高带宽I/O解决方案的必要性,从而简化了系统设计并加快了上市时间。这些技术进步不仅对于满足当前AI与高性能计算的需求至关重要,也确保了数据中心能够轻松应对未来不断攀升的算力与带宽需求。


  ▲ 图4 重定时器或扩展传输范围IO设计



采用以太网、PCIe和UCIe IP的Multi-Die实现示例


图5为Multi-Die设计示例,其中包含224G以太网PHY和集成1.6T PCS和MAC以太网控制器、PCIe 6.x或7.0 PHY和控制器、安全IP、传感器、DFT和UCIe PHY和控制器IP。该设计可以重新配置,为各种通道实现1.6T/3.2T/6.4T带宽,包括45dB LR、MR和VSR以太网以及PCIe 6.x和7.0范围。


  • 45dB长距离以太网和UCIe重定时器Die-to-Die设计

  • 组合PCIe/CXL/以太网和UCIe Die-to-Die设计

  • 适用于交换机的1.6T/3.2T/6.4T可扩展IO设计 


  ▲ 图5 Multi-Die设计框图 


这种Multi-Die设计支持双向224G数据传输的可配置通道数,能应对高达45dB的插入损耗。其目的是满足AI基础结构对更高带宽、更低功耗和更远传输距离的需求。该示例增强了CPU/GPU集群连接和创新计算架构的可扩展性,包括一致性内存扩展和资源解耦。



总结


集成PCIe和以太网等高速接口以及UCIe IP和链路健康监控功能,有助于扩展Multi-Die设计的带宽。新思科技为UCIe提供高达40Gbps的高质量、完整IP解决方案,集成信号完整性监视器和可测试性功能、224G以太网及PCIe 7.0,能够大幅提高带宽、降低延迟并改善可扩展性。新思科技的Multi-Die设计IP解决方案遵循不断演变的行业标准,可以与生态系统内的产品互操作,其多项前沿技术已经应用到芯片中,是实现下一代数据中心AI芯片的低风险解决方案。 





如需了解更多信息,请扫描下方二维码联系我们

    
               

                      

                    
             

                   
                   

                 
                 

                 

         
                                     
                                     


                               

                                 

新思科技 新思科技(Synopsys, Inc.)以芯片产业的“根技术”推动AI、5G、高性能计算、智能汽车等前沿应用的核心技术发展。
评论 (0)
  • 家电,在人们的日常生活中扮演着不可或缺的角色,也是提升人们幸福感的重要组成部分,那你了解家电的发展史吗?#70年代结婚流行“四大件”:手表、自行车、缝纫机,收音机,合成“三转一响”。#80年代随着改革开放的深化,中国经济开始飞速发展,黑白电视机、冰箱、洗衣机这“新三件”,成为了人们对生活的新诉求。#90年代彩电、冰箱、全自动洗衣机开始大量进入普通家庭,快速全面普及,90年代末,家电产品实现了从奢侈品到必需品的转变。#00年代至今00年代,随着人们追求高品质生活的愿望,常用的电视机、洗衣机等已经远
    启英AI平台 2025-03-25 14:12 90浏览
  • ​2025年3月27日​,贞光科技授权代理品牌紫光同芯正式发布新一代汽车安全芯片T97-415E。作为T97-315E的迭代升级产品,该芯片以大容量存储、全球化合规认证、双SPI接口协同为核心突破,直击智能网联汽车"多场景安全并行"与"出口合规"两大行业痛点,助力车企抢占智能驾驶与全球化市场双赛道。行业趋势锚定:三大升级回应智能化浪潮1. 大容量存储:破解车联网多任务瓶颈随着​车机功能泛在化​(数字钥匙、OTA、T-BOX等安全服务集成),传统安全芯片面临存储资源挤占难题。T97-415E创新性
    贞光科技 2025-03-27 13:50 148浏览
  • 汽车导航系统市场及应用环境参照调研机构GII的研究报告中的市场预测,全球汽车导航系统市场预计将于 2030年达到472亿美元的市场规模,而2024年至2030年的年复合成长率则为可观的6.7%。汽车导航系统无疑已成为智能汽车不可或缺的重要功能之一。随着人们在日常生活中对汽车导航功能的日渐依赖,一旦出现定位不准确或地图错误等问题,就可能导致车主开错路线,平白浪费更多行车时间,不仅造成行车不便,甚或可能引发交通事故的发生。有鉴于此,如果想要提供消费者完善的使用者体验,在车辆开发阶段便针对汽车导航功能
    百佳泰测试实验室 2025-03-27 14:51 188浏览
  • 在当今竞争激烈的工业环境中,效率和响应速度已成为企业制胜的关键。为了满足这一需求,我们隆重推出宏集Panorama COOX,这是Panorama Suite中首款集成的制造执行系统(MES)产品。这一创新产品将Panorama平台升级为全面的工业4.0解决方案,融合了工业SCADA和MES技术的双重优势,帮助企业实现生产效率和运营能力的全面提升。深度融合SCADA与MES,开启工业新纪元宏集Panorama COOX的诞生,源于我们对创新和卓越运营的不懈追求。通过战略性收购法国知名MES领域专
    宏集科技 2025-03-27 13:22 189浏览
  • 文/陈昊编辑/cc孙聪颖‍2025 年,作为中国实施制造强国战略第一个十年计划的关键里程碑,被赋予了极为重大的意义。两会政府工作报告清晰且坚定地指出,要全力加速新质生产力的发展进程,推动传统产业全方位向高端化、智能化与绿色化转型。基于此,有代表敏锐提议,中国制造应从前沿技术的应用切入,逐步拓展至产业生态的构建,最终延伸到提升用户体验的维度,打出独树一帜、具有鲜明特色的发展牌。正是在这样至关重要的时代背景之下,于 AWE 2025(中国家电及消费电子博览会)这一备受瞩目的舞台上,高端厨房的中国方案
    华尔街科技眼 2025-03-25 16:10 85浏览
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 206浏览
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 146浏览
  • 案例概况在丹麦哥本哈根,西门子工程师们成功完成了一项高安全设施的数据集成项目。他们利用宏集Cogent DataHub软件,将高安全设施内的设备和仪器与远程监控位置连接起来,让技术人员能够在不违反安全规定、不引入未经授权人员的情况下,远程操作所需设备。突破OPC 服务器的远程连接难题该项目最初看似是一个常规的 OPC 应用:目标是将高安全性设施中的冷水机(chiller)设备及其 OPC DA 服务器,与远程监控站的两套 SCADA 系统(作为 OPC DA 客户端)连接起来。然而,在实际实施过
    宏集科技 2025-03-27 13:20 109浏览
  •       知识产权保护对工程师的双向影响      正向的激励,保护了工程师的创新成果与权益,给企业带来了知识产权方面的收益,企业的创新和发明大都是工程师的劳动成果,他们的职务发明应当受到奖励和保护,是企业发展的重要源泉。专利同时也成了工程师职称评定的指标之一,专利体现了工程师的创新能力,在求职、竞聘技术岗位或参与重大项目时,专利证书能显著增强个人竞争力。专利将工程师的创意转化为受法律保护的“无形资产”,避免技术成果被他人抄袭或无偿使
    广州铁金刚 2025-03-25 11:48 181浏览
  • 长期以来,智能家居对于大众家庭而言就像空中楼阁一般,华而不实,更有甚者,还将智能家居认定为资本家的营销游戏。商家们举着“智慧家居、智慧办公”的口号,将原本价格亲民、能用几十年的家电器具包装成为了高档商品,而消费者们最终得到的却是家居设备之间缺乏互操作性、不同品牌生态之间互不兼容的碎片化体验。这种早期的生态割裂现象致使消费者们对智能家居兴趣缺失,也造就了“智能家居无用论”的刻板印象。然而,自Matter协议发布之后,“命运的齿轮”开始转动,智能家居中的生态割裂现象与品牌生态之间的隔阂正被基于IP架
    华普微HOPERF 2025-03-27 09:46 109浏览
  • 在智能语音产品的开发过程中,麦克风阵列的选型直接决定了用户体验的优劣。广州唯创电子提供的单麦克风与双麦克风解决方案,为不同场景下的语音交互需求提供了灵活选择。本文将深入解析两种方案的性能差异、适用场景及工程实现要点,为开发者提供系统化的设计决策依据。一、基础参数对比分析维度单麦克风方案双麦克风方案BOM成本¥1.2-2.5元¥4.8-6.5元信噪比(1m)58-62dB65-68dB拾音角度全向360°波束成形±30°功耗8mW@3.3V15mW@3.3V典型响应延迟120ms80ms二、技术原
    广州唯创电子 2025-03-27 09:23 157浏览
  • 在电子设计中,电磁兼容性(EMC)是确保设备既能抵御外部电磁干扰(EMI),又不会对自身或周围环境产生过量电磁辐射的关键。电容器、电感和磁珠作为三大核心元件,通过不同的机制协同作用,有效抑制电磁干扰。以下是其原理和应用场景的详细解析:1. 电容器:高频噪声的“吸尘器”作用原理:电容器通过“通高频、阻低频”的特性,为高频噪声提供低阻抗路径到地,形成滤波效果。例如,在电源和地之间并联电容,可吸收电源中的高频纹波和瞬态干扰。关键应用场景:电源去耦:在IC电源引脚附近放置0.1μF陶瓷电容,滤除数字电路
    时源芯微 2025-03-27 11:19 157浏览
  • 六西格玛首先是作为一个量度质量水平的指标,它代表了近乎完美的质量的水平。如果你每天都吃一个苹果,有一间水果店的老板跟你说,他们所卖的苹果,质量达到六西格玛水平,换言之,他们每卖一百万个苹果,只会有3.4个是坏的。你算了一下,发现你如果要从这个店里买到一个坏苹果,需要805年。你会还会选择其他店吗?首先发明六西格玛这个词的人——比尔·史密斯(Bill Smith)他是摩托罗拉(Motorloa)的工程师,在追求这个近乎完美的质量水平的时候,发明了一套方法模型,开始时是MAIC,后来慢慢演变成DMA
    优思学院 2025-03-27 11:47 151浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦