UCIe标准白皮书:构建开放的芯粒生态系统

TechSugar 2022-03-16 08:00


作者:英特尔高级研究员兼首席架构师、UCIe I/O技术与标准推动委员Debendra Das Sharma博士

翻译:陈巍 团队

文章来源:陈巍谈芯


Universal Chiplet Interconnect Express (UCIe)® 是一种开放的行业标准互连,可在芯粒(Chiplet)之间提供高带宽、低延迟、节能且具有成本效益的封装连接。它解决了跨越云、边缘、企业、5G、汽车、高性能计算和手持领域的整个计算领域对计算、内存、存储和连接的增长需求。UCIe 提供了封装来自不同厂家芯片的能力,包括不同的晶圆厂、不同的设计和不同的封装技术。


Chiplets 封装集成的动机


摩尔在他的开创性论文《Cramming more components onto integrated circuits》中(Electronics , 1965/ 4/19,),预测集成电路中的晶体管数量将每两年翻一番。“摩尔定律”至今已维持了 50 多年。在同一篇论文中,摩尔还预言了“清算日”:“用较小的功能体构建大型系统可能会更经济,这些功能是单独打包和互连的。”今天,我们看到主流商业产品(如客户端 CPU、服务器 CPU、GP-GPU 等)中的都是由多个芯粒封装集成的。


有许多使用小芯片整合封装的动机。随着芯片尺寸的增加以及不断增长的性能需求,设计正面临芯片掩模版的限制——例如包括具有数百个核心数的多核 CPU。即便一个裸片可以符合光罩限制,在一个封装中进行多个芯粒的连接,也可能更方便进行良率优化以及跨多个细分市场的芯粒复用。而统一的封装连接会支持这些高速增长的应用。


封装集成的另一个动机是从产品和项目的角度降低整体投资组合成本,并获得上市时间优势。例如,图中所示的计算核心(图1)可以在先进工艺节点中实施,以更高的成本提供领先的能效比和性能,而内存和 I/O 控制器功能可以从已经部署在已建立(N-1 或 N-2)工艺节点中的设计并重复使用。这种划分产生更小的裸片,从而拥有更好的良率。跨进程节点的 IP核移植成本很高,并且对于先进工艺节点来说增长非常迅速,如图所示(图 2)由于我们不必移植功能不变的的所有 IP,因此除了获得上市时间优势外,我们还节省了成本。封装上的 Chiplet 集成还使客户能够通过选择不同的数字和类型的芯粒。例如,可以根据设计的需要选择不同数量的计算、存储和 I/O 裸片。无需针对不同的细分市场进行不同的芯粒设计,从而降低产品 SKU 成本。


芯粒的封装集成能够以快速且经济高效的方式提供定制解决方案。例如,不同的用途可能需要不同的算力,但使用相同的内核、内存和 I/O,如图所示(图1)。芯粒技术还允许根据功能选择最适合的芯粒进行封装。例如,内存、逻辑、模拟和共同封装的光学器件都需要不同的工艺,这些不同工艺芯粒可以一起封装。由于封装走线较短并提供密集布线,因此存储器访问等需要高带宽的应用(例如,高带宽内存)被实现为封装集成。


图 1:UCIe 支持在封装上交付平台的开放式 Chiplet 生态系统


UCIe 是一种战略性的片上封装互连,以前瞻性的方式定义用例模型,以促进行业不断进步。


影响行业广泛采用标准的因素


成功开发生态系统的秘诀如下(图 3)。UCIe 是基于业内数十年的标准体系构建的,广泛参考了开放生态(例如 PCIe、USB、CXL等)。


图 2:跨不同工艺节点的设计成本(来源:IBS,引用于 IEEE 异构集成路线图)


一个开放的行业标准机构定义,其关键性能指标 (KPI) 的规范应适应广泛的用途,具备全面的合规性和可交互机制。这对于发展健康的生态至关重要。UCIe 规范修订版 1.0 包含行业领先的 KPI、调试支持和合规性注意事项。作为涵盖制造、组装和测试公司的整个行业的技术,管芯的封装集成已经成熟。我们看到多个代工厂以及市场上的外包半导体组装和测试 (OSAT) 公司使用专有互连。UCIe 是行业领导者共同努力开发通用标准的结果,以便来自不同厂家的多个芯粒可以无缝互操作。虽然 UCIe 发起人涵盖云、半导体制造、OSAT、知识产权供应商, 和芯片设计师,UCIe 联盟对所有人开放。UCIe 有望成为小芯片无处不在的封装互连,推动蓬勃发展的开放小芯片生态系统。


图 3:成功且广泛的可互操作小芯片生态系统的组成部分


由 UCIe 1.0 规范驱动的使用模型和 KPI


UCIe 是一个分层协议,如图4 a所示。物理层负责电信号、时钟、链路协商、边带等。Die-to-Die 适配器为芯粒提供链路状态管理和参数协商。它可选地通过其循环冗余校验 (CRC) 和链路级重试机制保证数据的可靠传输。当支持多种协议时,它定义了底层的仲裁机制。当适配器负责可靠传输时,一个 256 字节的 FLIT(流控制单元)定义了底层传输机制。


UCIe 本地映射 PCIe 和 CXL 协议,这些协议广泛应用在计算机的板级。这样可以利用现有的计算机生态系统来确保无缝的交互性。借助 PCIe 和 CXL, 已有的SoC 构建、链路管理和安全解决方案都可用于 UCIe。解决的用例也很全面:使用DMA的数据传输、软件发现、错误处理等,都可通过 PCIe/http://CXL.io 解决;内存用例可通过 CXL.Mem 处理;CXL.cache 解决了加速器等应用程序的缓存要求。UCIe 还定义了“流协议”,可用于映射任何其他协议。此外,随着未来用例模型的发展,UCIe 联盟还可以在未来针对芯粒技术优化的协议进行创新。


UCIe 1.0 定义了两种封装,如图 4 b。标准封装 (2D) 用于具有成本效益的性能。先进的封装用于节能性能。有多种商用选项已列在图表中。UCIe 规范支持这些类别中的所有类型的封装选择。


图 4:UCIe:分层方法和不同的封装选择


UCIe 支持两类被广泛使用使用的模型。一类是封装级集成,以提供高能效和高性价比的性能,如图图 5 a所示。连接在板级的组件,如内存、加速器、网络设备、调制解调器等,可以在封装级集成,适用于从手持到高端服务器,可在同一封装中通过不同的封装选项连接来自多个厂家的芯粒。另一类方式是使用 UCIe重定时器,使用不同类型的媒介(例如,光信号、电缆、毫米波)提供封装外连接,用于在机架甚至POD(性能优化的数据中心)级别传输底层协议(例如PCIe、CXL),以实现资源池、资源共享,甚至使用超出节点级别的load-store语义传递到机架/POD 级别的消息,为边缘和数据中心提供更好的能效和成本效益性能。


图 5:UCIe 支持的使用模型:封装内集成以及与不同媒体(例如,光学器件、毫米波、电缆)的封装外连接


UCIe 支持不同的数据速率、数据位宽、凸块(Bump)间距和通道(Channel)范围,以确保实现最广泛的交互性,详见表1。它定义了一个边带接口,以便于设计和验证。互连的构造单元是一个簇(Cluster),其中包含 N (N = 16 用于标准封装,64 用于高级封装)个单端、单向、全双工数据通道(Lane),一个用于有效的单端通道(Lane),一个用于跟踪的通道(Lane),每个方向一个差分转发时钟,每个方向 2 个边带通道(单端,一个 800 MHz 时钟通道和一个数据通道)。高级封装支持备用通道以处理故障通道(包括时钟、Valid、边带等),而标准封装支持宽度降级以处理故障。可以聚合多个簇(Cluster)来为每个链路提供更高的性能,如图 6所示。


表格1总结了这两个封装选项的关键指标。具有标准封装设计的管芯可与其他标准封装的任何其他芯粒交互。同样,采用高级(UCIe)封装设计的芯粒可与高级封装设计的芯粒交互,从 25um 到 55um 的宽凸块间距均符合这一方式。需要注意的是,该表保守地估计了目前的凸块间距的传输性能。例如,对于45um高级封装,如我们采用更密集的 25um 凸块间距,带宽密度将提高 3.24 倍。在 45u 时,1300+ 的带宽密度(对线性和面积)大约是我们使用最高效的 PCIe SERDES 可以实现的 20 倍。同样,PCIe PHY 目前的功率效率约为 10pJ/b,由于通道(Channel)范围更短,基于 UCIe 的设计可将其降低多达 20 倍。UCIe 还支持线性功率-带宽消耗曲线,具有非常快的进入和退出时间(对于基于 SERDES 的设计,亚纳秒 vs 多微秒),同时节省 90% 以上的功耗。因此,除了真正的低功耗之外,它在节能方面也非常有效,提供了引人注目的节能超高性能。重要的是随着技术的进步,低功耗将更加显着。UCIe 1.0 被认为在本世纪末期仍能满足各种具有挑战性的应用的性能需求。


表 1:UCIe 1.0 特征和关键指标


图 6:簇宽度;每个封装选项中可以组合 1、2 或 4 个簇,以提供更高的带宽


结论


对开放式芯粒生态系统的巨大需求,将促进整个计算体系中的创新。UCIe 1.0 提供引人注目的高能效和高性价比的性能。它是一个具有即插即用模型的开放标准,以几个成功的标准为蓝本,并由行业领导者推出,并确保其广泛采用。我们预计下一代创新将发生在芯粒级别,允许一组芯粒提供不同的功能供客户选择,以最好地满足他们的应用需求。


未来,随着凸块间距不断缩小和 3D 集成成为主流,我们预计该联盟将推动更节能、更具成本效益的解决方案。从延迟、带宽和能效的角度来看,这些可能需要更宽的链路运行更慢,并更接近芯片上的连接。封装和半导体制造技术的进步将在未来几十年彻底改变计算领域。UCIe 已做好充分准备,使生态系统中的创新能够充分利用这些技术进步。


免责声明:本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将立即删除内容!本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。

TechSugar 做你身边值得信赖的科技新媒体
评论
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 116浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 164浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 106浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 69浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 92浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 141浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 61浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 202浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 222浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 119浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 58浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦