当AI芯片遇上带宽瓶颈,看40GUCIeIP如何打破僵局?

新思科技 2025-01-08 18:05


越来越多的日常设备开始部署生成式人工智能,市场对大语言模型和出色算力的需求也随之日益增长。Yole Group在2024年OCP区域峰会的演讲过程中表示:“对于训练参数达到1750亿的GPT-3,我们估计需要6000到8000个A100 GPU历时长达一个月才能完成训练任务。”不断提高的HPC和AI计算性能要求正在推动Multi-Die设计的部署,将多个异构或同构裸片集成到一个标准或高级封装中。为了快速可靠地处理AI工作负载,Multi-Die设计中的Die-to-Die接口必须兼具稳健、低延迟和高带宽特性,最后一点尤为关键。本文概述了利用Multi-Die设计的AI数据中心芯片对40G UCIe IP的需求。


高带宽Die-to-Die接口用例


AI应用正在给半导体行业带来新的挑战。为支持深度学习和机器学习算法的海量数据处理任务,对更大带宽的需求不断增加,特别是对于计算和网络应用。这些AI应用对于Die-to-Die接口提出了不同的要求。本文以100Tb网络交换机和AI加速器为例。 


图1为100Tb交换机示例,该交换机可用于AI数据中心,采用横向扩展方法来处理跨数据中心的海量数据。横向扩展方法在机器协同工作的网络中将工作负载分配到多台服务器上。交换机SoC不断扩展,正在接近尺寸极限,因此它被分割成更小的裸片,以提高边缘使用率。在这种情况下,Die-to-Die接口通过高速以太网在裸片之间以及向外界传输大量数据,反之亦然。 


  ▲ 图1 100Tb交换机的裸片分割用例片 


类似Google张量处理单元这样的AI加速器采用Multi-Die设计,为PCIe和以太网等接口配备单独的计算裸片和IO裸片。此类AI处理器在更主流的技术工艺上使用IO裸片来节省成本,并在更先进的技术工艺上使用计算裸片来提高性能和能效,从而充分发挥Multi-Die设计的优势。一些AI加速器使用图3所示的裸片分割方法,需要高带宽Die-to-Die接口来无缝传输裸片之间的数据。 


  ▲图2 使用AI加速器的裸片分割用例


另一个示例是裸片连接用例,其中主服务器裸片或处理器连接到AI加速器裸片,以便执行可分流到特定功能加速器的任务。在这种用例中,Die-to-Die接口用于在需要时将数据从服务器裸片发送到加速器裸片,而无需在高带宽下运行。此类用例使用标准封装技术(如有机衬底),复杂性较低。许多边缘AI和移动应用都使用此类用例。


  ▲图3 裸片连接用例


利用40G UCIe IP为Die-to-Die连接提供最大带宽


UCIe规范已成为Die-to-Die连接的事实标准,确保裸片之间的互操作性、低延迟和实时数据传输。得益于UCIe,100Tb交换机和AI加速器等使用Multi-Die设计技术在标准封装和高级封装下实现了带宽效率更高。作为通用芯粒互联产业联盟(UCIe Consortium)的成员,新思科技在其当前经验证的UCIe IP基础上,推出了40G UCIe IP解决方案,可提供比UCIe规范高25%的带宽,而不会影响能效或面积。 


40G UCIe PHY符合新的UCIe规范,实现了各种功能,可确保Die-to-Die链路可靠性和质量。PHY具有全面的可测性设计(DFT)功能,可用于已知良好裸片和生产测试,从而提高了可测试性。嵌入式信号完整性监视器(SIMs)可监测Die-to-Die链路的任务模式。监视器可以持续分析Die-to-Die信号质量,并在任务模式下执行校正措施,以实现可靠的通信。 


PHY在2GHz频率下支持高达128B的接口宽度,可以利用整个PHY的带宽。对于必须以较低时钟频率运行的系统,它还在1GHz频率下支持更宽的256B接口。40G UCIe控制器支持不同的接口选项,例如流式传输、CXS、AXI,以及PCIe、CXL、AXI和CHI C2C等协议,以在Die-to-Die链路上运行标准化数据。 


虽然更高的数据速率有助于AI应用实现高带宽效率并满足数据处理要求,但也带来了设计挑战。开发者必须精心设计通道规格,避免更高的插入损耗和串扰,以实现更优性能。速度较低时,可能不需要对发射器(TX)进行均衡处理。但在速度较高时,为了达到所需的信道性能,就需要进行TX均衡,比如使用2抽头前馈均衡(FFE)。此外还需要采用更强大的接收器(RX)均衡技术,例如1抽头决策反馈均衡(DFE)及连续时间线性均衡(CTLE)。Die-to-Die通道需经过大量的信号完整性和电源完整性仿真,以验证Die-to-Die链路特性和性能是否符合预期。 


  ▲图4 16G奈奎斯特频率下的有损信道示例


  ▲图5 良好渠道设计示例


40G UCIe PHY支持新兴的先进封装技术,例如硅或RDL中介层、硅桥和RDL扇出,以及传统的有机衬底封装技术。PHY为先进封装技术提供高达12 Tbps/mm的总带宽效率,为标准封装技术提供高达1.8 Tbps/mm的总带宽效率,同时运行速度高达40Gbps/pin。有机衬底封装技术虽然更为常见且比较实惠,但需要更多的布线层来支持IP实现更高速的布线。相反,先进封装技术可以改善布线密度,但也增加了封装设计所面临的挑战。了解到这种复杂性,新思科技提供了用于中介层设计的3DIC Compiler平台及UCIe-A IP参考设计。3DIC Compiler是统一的探索到签核解决方案,其中包含用于自动布线和自定义中介层设计的工具和脚本。 


40G UCIe IP实现了前向时钟架构,以简化接收器架构,从而降低功耗和延迟。其中使用了四倍速率架构,对于32 Gbps/pin速度,PHY操作频率限制为8 GHz;对于40 Gbps/pin速度,PHY操作频率限制为10 GHz。此外还借助嵌入式低延迟FIFO来补偿前向时钟和本地时钟之间以及不同通道之间的偏差不匹配。通用的100MHz参考时钟用作PHY锁相环(PLL)的输入,可生成PHY和控制器所需的所有高频时钟,这样逻辑电路就无需向PHY提供高频时钟。图6为40G UCIe PHY架构。 


  ▲图6 UCIe PHY架构


UCIe未来的发展道路


3D封装具有功耗和性能优势,正逐渐成为快速Multi-Die设计的优选解决方案。

UCIe规范2.0正在促使3D封装中的Die-to-Die连接实现标准化,与2D和2.5D技术相比,其带宽更高且功耗更低。UCIe规范为3D封装定义了以下特性: 


  • 简约的PHY架构,例如简单的逆变器/驱动器 

  • 适合凸块区域的电路和逻辑,这有助于实现较低的工作频率和更简单的电路 

  • 较小的凸块间距,例如几微米 

  • 预定义的Bump-PHY的Bump图,可简化互操作性 


新思科技利用3DIO IP解决方案实现了3D封装中的Die-to-Die连接。 


3D封装技术正蓬勃发展,未来几年对更高数据速率的需求可能会越来越大。Die-to-Die接口也将持续演进,以支持更高的速度和能效。


业界首款40G UCIe IP解决方案,包括控制器、PHY和验证IP,提供更高算力,可满足速度更高的基于UCIe的Multi-Die设计需求。PHY的简化架构简化了IP集成,全面的监控、测试和修复功能则改善了可靠性和芯片的健康状况。新思科技走在技术发展的前沿,并将继续部署先进的IP来适应千变万化的市场需求。点击阅读原文,了解关于新思科技40G Ucle Ip更多信息。



如需了解更多信息,请扫描下方二维码联系我们


    =              

                      

                    
             

                   
                   

                 
                 

                 

         
                                     
                                     


                               

                                 

新思科技 新思科技(Synopsys, Inc.)以芯片产业的“根技术”推动AI、5G、高性能计算、智能汽车等前沿应用的核心技术发展。
评论
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 100浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 127浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 211浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 172浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 89浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 82浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 113浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 147浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 122浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 75浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦