广告

科技导报 | 芯耀辉受邀参与撰写并发表《Chiplet 技术发展现状》一文(内附文章)

2023-11-07 芯耀辉科技 阅读:
在应科技导报的邀请下,国内十多位Chiplet技术专家协力撰写了题为《Chiplet技术发展现状》的文章。该文深入探讨了Chiplet技术的核心概念和原理,详细介绍了其基本组成要素深刻剖析了技术上的挑战,同时也探讨了国内在Chiplet技术领域的发展机遇。

值得一提的是,芯耀辉科技有限公司高级工程师方刘禄在本文中执笔3.1章节,涵盖了Chiplet接口电路,以及4.2章节,着重探讨了信号与电源完整性设计方面的挑战。

在应科技导报的邀请下,国内十多位Chiplet技术专家协力撰写了题为《Chiplet技术发展现状》的文章。该文深入探讨了Chiplet技术的核心概念和原理,详细介绍了其基本组成要素深刻剖析了技术上的挑战,同时也探讨了国内在Chiplet技术领域的发展机遇。

值得一提的是,芯耀辉科技有限公司高级工程师方刘禄在本文中执笔3.1章节,涵盖了Chiplet接口电路,以及4.2章节,着重探讨了信号与电源完整性设计方面的挑战。摘录如下:

 

组成 Chiplet 设计方法的核心技术组件

作为一种芯片的设计方法,Chiplet技术涉及到了 Chiplet 接口电路、Chiplet EDA(electronic designautomation,电子设计自动化)设计工具,以及 Chiplet先进封装技术等技术组件。

 

3.1 Chiplet接口电路

Chiplet 接口电路是基于 Chiplet 架构的芯片所特有的一种技术,其主要功能是传递不同芯粒之间的数据。值得注意的是,需要避免将Chiplet接口电路与 DDR(double data rate,双倍数据速率)协议、PCIe等用于芯片I/O的协议混淆,虽然DDR和PCIe可能采用了和Chiplet接口一样的底层物理接口,但主要区别在于 Chiplet 接口电路一般被用在连接位于一个封装内的多个芯粒实体,其通信协议中一般只包括物理层和链路层等层次,且在2个互连的芯粒上都有对等的 PHY(物理层)部分。典型的 Chiplet标准协议层次如图9所示。

 

图9 典型chiplet标准协议层次图

 

在多种Chiplet场景中,用于多个芯粒之间互连的物理层只有 2 种方式:一种基于并行单端信号;另外一种基于串行差分信号。在 Chiplet 接口电路中的层次通常只有物理层(含物理适配层)和链路层,这是因为Chiplet芯片中多个芯粒之间距离非常近,通常在物理层实现互连,而在物理层实现互连则主要考虑电气性能如何达到要求、数据速率的匹配等,一般不会涉及到上层协议层面的通信,上层协议内容通常和具体应用场景有关系。

图10 chiplet接口电路中的并行单端物理层

 

3.1.1 并行单端物理层

基于并行单端物理层的 Chiplet 接口电路包括发送器、接收器和前向时钟架构,如图10所示。其优点是低延时,延时一般小于5 ns;传输能效好,能效比优于 1 pJ/bit;面积和功耗小。其缺点是单端传输,对于干扰抵抗能力弱,单个信号速率无法做到非常高速,速率很难超过32 Gbps;为了提升总传输带宽,通常信号间距小,不仅成本高,走线密集度高,信号间干扰严重,传输距离无法太长,一般控制在5 mm,信道的奈奎斯特速率损耗大约为5 dB;同时信号完整性的设计也面临很大的挑战。基于并行单端物理层的 Chiplet 接口电路通常用于多个功能紧耦合、对延时和能效比敏感的芯粒单元之间实现互连。

3.1.2 串行差分物理层

基于串行差分物理层的 Chiplet 接口电路包括发送器、前馈均衡器(FFE)、连续时间均衡器(CTLE)和时钟恢复电路,如图 11所示。其优点是对抗干扰能力好,传输距离长,可达50 mm,信道的奈奎斯特速率损耗可以控制在10 dB以内,单通道传输速率可以做到112 Gbps,并可以适用低成本的有机基板封装。其缺点是传输延时较高,可以达到8 ns,且传输能效较单端接口差,达到 1.5 pJ/bit,另外占据的面积和功耗较大。基于串行差分物理层的 Chiplet 接口电路通常用来扩展已经设计好的芯片,或者用于对延时不敏感的多个芯粒互连场景。

 

图11 chiplet接口电路中的串行差分物理层

 

4.2 信号与电源完整性设计挑战

在Chiplet架构的芯片设计中,由于多个芯粒要进行互连,因此在每个芯粒的边缘会设计很多用于互连的信号,当芯粒之间的带宽需求变得很高,这些互连信号的数量也会变得很多,从而引起信号和电源完整性问题。

4.2.1 信号完整性设计挑战

互连信号质量会影响芯粒的信号抖动、均衡等指标,引起芯粒互连信号质量的问题源头主要来自凸点(bump)布局。bump的布局不仅和芯粒内的布局规划(floor-plan)有关,还和封装基板走线有关,引起信号完整性问题的主要因素为阻抗不连续、噪声耦合。阻抗不连续表现为 bump 阻抗不连续,走线阻抗不连续和过孔(via)阻抗不连续,噪声耦合主要表现为信号bump间的耦合和走线间的交叠。


阻抗不连续是信号完整性领域影响信号传输质量的一个重要因素[28],特别是对于Chiplet这样的跨尺度系统,横跨纳米维度的芯片级别和毫米维度的封装级别,存在着大量的因为尺度转换造成的阻抗不连续的问题[29]。例如,信号从芯片到硅转接板,会在 2 个尺度的交界面-微焊球(micro bump)处出现阻抗的变化,另外在硅转接板内部,BEOL(back end of line,后端)金属各层连接的Via和TSV都会造成阻抗的不连续[30],同时也要考虑走线导致的阻抗不连续。因此,对这些影响阻抗的关键位置进行阻抗优化设计,对于保持信号的完整性,有着至关重要的意义。噪声耦合通常发生在信号非常密集的 Chiplet应用场景。HBM接口是 Chiplet中最常见的一种并行接口,其数据 I/O 数已达到 1024 bit,所以在 Chiplet中通常会有大量的TSV孔及RDL设计,上千个数据信号间会因电感和电容效应产生噪声耦合。


此外,基板层通常被其他高速数字信号、时钟、串行数据总线通道填满,串扰效应严重阻碍了单引脚数据传输能力的提升。所以,噪声耦合给Chiplet设计中高速信号传输的稳定性带来巨大的挑战。针对以上 2 个因素,一般采用如图 28 所示的bump 布局和走线方案。通过优化阻抗和屏(shielding)来减少其对信号质量的影响。

图28 bump map和走线

 

4.2.2 电源完整性设计挑战

 
电源性能会影响芯粒互连信号的抖动、均衡等指标。引起芯粒设计中电源完整性问题的因素首先来自凸点分布导致电流分布不均匀、电压降不一致;其次来自芯粒内电源网络的IR drop,影响最低工作电压,可使模拟均衡性能下降,以及芯粒内高频电流引起的电源高频噪声,也会影响电源完整性;最后来自芯粒外电压源纹波和封装电源网络RLCK 引起的纹波,可引起电源网络振铃或谐振。


另外,不同地方的电流密度,会引起电源网络的可靠性问题。Chiplet技术的典型应用是AI/高性能计算等芯片,芯片本身工作功率较高,工作电流可达 200 A,设计者必须仔细设计 Interposer/基板上的电源结构,保证较小的直流压降、电流密度和交流电源噪声。同时还需要模拟多种芯片工况反转所导致的电压降,很难处理的硅转接板上的精细结构也是Chiplet设计的电源完整性的挑战之一。


Chiplet芯片比起传统的封装结构,具有更高的集成度,同时多芯片的集成,也带来了电源噪声去耦合的挑战。相较于传统在 PCB(印制电路板)或BGA(ball grid array,球状引脚栅格阵列)封装的背面进行添加表贴去耦电容(decoupling capacitor)的方式,先进封装可能需要更高性能的去耦电容。因此,MIM(metal-insulator-metal,金属-绝缘体-金属)这种方式的堆电容(stacked capacitor)和在 3D方向有延展的沟电容(trench),得到了广泛的应用。沟电容是通过深入到硅基底中形成的,相当于从2D到 3D的拓展,设计难度较传统的 2D设计更高,对于空间在 3D 方向的尺寸有一定的要求,而 MIM电容存在于不同的金属层中间,可以有效地利用芯片面积,但工艺复杂,成本较高。

 

鸣谢:

郝沁汾 中国科学院计算技术研究所,博士生导师

李孟璋 芯耀辉CTO兼全球总裁

陈建诚 芯耀辉系统讯号完整性资深经理

王小锋 芯耀辉资深SIPI工程师

魏小博 芯耀辉资深测试主管工程师

杨   耕 芯耀辉设计总监

 

参考文献:

[28] 虞振洋 . 基于多物理场耦合特性的电气设备分析与设计[D]. 南京: 南京航空航天大学, 2015.
[29] Pu B. Design of 2.5D interposer in high bandwidth memory and through silicon via for high speed signal[J].IEEE, 2020, doi:10.36227/techrxiv.12950261.
[30] Kim J, Chekuri V C K, Rahman N M, et al. Chiplet/interposer co-design for power delivery network optimization in heterogeneous 2.5-D ICs[J]. IEEE Transactionson Components, Packaging and Manufacturing Technology, 2021, 11(12): 2148-2157.

原文摘要:

Chiplet (芯粒)技术是近年来兴起的新一代集成电路技术,因其具有提升良率、突破光罩极限、芯片架构灵活、芯片组件技术供应货架化等特点,受到产业界的广泛重视。为进一步推动Chiplet技术在中国的发展,梳理了Chiplet技术的应用场景,分析了Chiplet中的各种核心组件技术,阐述了在Chiplet技术开发中可能出现的各种技术挑战,回顾了中国Chiplet标准的发展情况,最后针对中国发展Chiplet技术提出了建议。

作者团队:
项少林 合肥复睿微电子有限公司
郭   茂 上海市微电子材料与元器件微分析专业技术服务平台
蒲   菠 宁波德图科技有限公司
方刘禄 芯耀辉科技有限公司
刘淑娟 湖北江城实验室
王少勇 超聚变数字技术有限公司
孔宪伟 中国电子技术标准化研究院
郑    拓 芯和半导体科技(上海)股份有限公司
刘   军 无锡芯光互连技术研究院
赵   明 无锡芯光互连技术研究院
郝沁汾 中国科学院计算技术研究所
孙凝晖 中国科学院计算技术研究所

 

下载该篇报道的完整版

Chiplet技术发展现状.pdf

 
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
  • 人工智能是否是硅光子的杀手级应用? 人工智能(AI)是促进硅光子技术广泛应用的杀手级应用吗?鉴于过去几年AI的爆炸式增长推动了对高速互连和更高带宽的需求,以及随之而来的以太网光收发器的需求,人们可能会这么认为。
  • 简化AI芯片设计:单一指令集和工具链的集成创新 目前AI芯片设计人员通常会在系统CPU旁边集成单独的IP模块,以满足AI日益增长的需求。这种方法导致了AI芯片的配置不够理想,因为通常需要依赖三家不同的IP供应商和三套工具链,这不仅使得功率、性能和面积(PPA)指标较差,也增加了适应新算法的难度。
  • 如何加速SoC设计的CPU性能 SoC的创建者通常希望从他们的系统中榨取最大的性能。为了达到这一目的,使用高性能的IP内核,包括CPU内核,是一个常见的策略。但是,使用最新的高端CPU内核会带来较高的成本,这可能比中档内核高出5到10倍。
  • 重塑处理器设计的开放力量 尽管在生态系统建设、软件支持和安全性问题等方面,RISC-V仍需不断努力和完善,但凭借简洁高效、灵活多样的特点,RISC-V目前已经在嵌入式系统、云计算与大数据、人工智能与机器学习、物联网与边缘计算等领域展现出了强大的生命力和广阔的发展前景。
  • 解码未来,安谋科技全新“玲珑”处理器重塑多媒体“芯”视界 作为安谋科技自研异构计算矩阵中的一员,尽管围绕“玲珑”系列构建的多媒体生态系统日趋完善,但面对不同行业客户复杂多变的需求,持续推动产品技术的演进迭代,不断优化产品间的高效协同,并与本土芯片设计企业深化合作,已经成为当务之急。为此,安谋科技于日前最新推出了旗下首款本土自研的图像显示处理器——“玲珑”D8/D6/D2 DPU,以及新一代高效视频处理器——“玲珑”V510/V710 VPU。
  • EDA企业眼中:未来5年市场热点、行业逻辑剖析 半导体行业似乎还在复苏的路上,但EDA企业这两年似乎都挺赚钱的。来听听Mike Ellow是怎么解释EDA企业眼中的市场逻辑的...
相关推荐
    广告
    近期热点
    广告
    广告
    可能感兴趣的话题
    广告
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了