3D FPGA技术:延续摩尔定律的黑科技,上篇

SSDFans 2020-07-02 00:00


点击蓝字
关注我们



目 录

  1. 写作背景

  2. 前言

  3. Xilinx 堆叠硅片互联SSI技术 - 产生背景

  4. Xilinx SSI技术详解及主要优点

  5. Xilinx SSI技术的主要缺点

  6. 小结


1

写作背景

在英特尔正式发布并开始出货的Stratix10系列FPGA中,引入了一些全新的、且部分来自于英特尔半导体制造部门的“黑科技”,如EMIB、SiP等。这些技术使得Stratix10的架构与之前英特尔/Altera其他任何FPGA架构相比,都有着极大的区别,并随之带来各种优势和性能提升。


对于很多人而言,这些用于制造“3D FPGA”,或更广义可以称之为“3D IC”的技术,会显得相对比较陌生。于是产生了想法对业界主流的3D FPGA的制造和系统集成技术做一个简单的综述和介绍。全部内容打算写成两篇博文,本文写Xilinx的技术,下篇写英特尔的技术。正文如下。


2


前言

FPGA的发展一直完美的遵从摩尔定律。如Xilinx院士Steve Trimberger在其文章《FPGA的三个时代》中所述(见下图),自1984年FPGA面世以来至今,FPGA的容量增长超过一万倍、速度增长超过一百倍,同时其成本和功耗均降低了超过一千倍


虽然这些发展很大程度上归功于半导体工艺的不断进步,但实际上作为FPGA设计本身,也必须提出一系列新颖的系统和架构级创新,以不断延续这样的发展轨迹。


我们知道,FPGA从最初的简单的可编程结构,逐渐发展到大型的逻辑门阵列,再发展到片上集成各类资源和IP,如存储器、收发器、DSP等,逐步形成当前丰富的FPGA产品门类。然而,随着半导体工艺的进一步发展到10nm以下,继续使用传统的设计方法得到的FPGA芯片的性能指标已经渐渐不能满足摩尔定律的表述。那么,问题来了:


  • 究竟FPGA发展的第四个阶段在何处?

  • FPGA能否继续跟随摩尔定律的发展脚步?

  • 需要何种技术才能继续支撑摩尔定律的延续?



在本篇和下篇博文中,我将尝试回答这些问题。


目前看来,一个可能的答案是使用更先进的3D芯片封装和系统集成技术,有趣的是当前的FPGA厂家使用了截然不同的技术设计和生产3D FPGA。在本篇博文中,我会详细介绍Xilinx的堆叠硅片互联技术- SSI。在下篇博文中,我将介绍Intel的3D系统级封装-SiP,和嵌入式多芯片互联桥接技术-EMIB。



3


Xilinx 堆叠硅片互联SSI技术 

-- 产生背景

在每一代生产工艺早期,由于工艺和生产技术尚未成熟,因此很难达到较高的良品率,尤其对于面积较大的芯片而言更是如此。


研究表明,对于高端FPGA(如Virtex7系列等),如果裸片面积为6平方厘米,使用泊松良率模型推断后,其在工艺早期的良品率仅为0.25%;然而如果裸片面积只有1.5平方厘米,则良品率高达22%。换句话说,在一个12英寸的晶圆上仅能产出0.3个能正常工作的6平方厘米的裸片;相比之下,却能产出1.5平方厘米裸片的数量则为107个!由此可见在工艺早期,不同裸片面积大小所带来的巨大良品率落差。


在上述例子中,如果可以将四枚1.5cm2的裸片“组合”为一枚6cm2芯片,那么同样的晶圆可以产出平均26.75枚芯片(如下图),随之带来超过一百倍的产能提升。



这便是Xilinx 堆叠硅片互联技术(Stacked Silicon Interconnect – SSI)产生的主要背景。


4


Xilinx SSI技术详解及主要优点

SSI技术示意图如下图所示。


和传统封装技术相比,SSI技术在封装基板(Package Substrate)和FPGA裸片之间加入了一层无源硅中介层(Silicon Interposer),同时在硅中介层上可以放置多枚FPGA裸片。这些裸片通过在中介层里的硅通孔(Through Silicon Vias – TSV)、微凸块(Microbumps)以及大量连线进行相互连接。其中,各部分的作用简述如下:


  • 微凸块:连接FPGA裸片上的各类引脚。

  • 硅通孔TSV:将裸片的电源、接地以及IO通过C4凸块连接到封装基板。TSV是SSI技术的核心创新点与技术难点。值得注意的是TSV通过蚀刻工艺制造,而非激光钻孔,因此对制造工艺有着严格要求。

  • 芯片连线:中介层可以提供上万条连线将相邻的两枚FPGA裸片进行互连。


通常而言,中介层会使用已较为成熟的工艺进行加工,比如本例中使用了65nm工艺,并且在硅中介层中不含晶体管等有源器件,这样可以保证较高的良率、降低制造风险,以及降低系统静态功耗。


综上所述,使用SSI这种基于硅中介层的FPGA封装集成技术的主要优点有


  1. 能在每代半导体制造工艺早期生产出良率高的大型FPGA器件,加快了产品面世周期,从而能快速抢占市场(尤其是高端市场)。这也是其最主要的优点。

  2. 即使制造工艺成熟到可以生产良率较高的大型单芯片FPGA器件,使用基于硅中介层技术也能通过组合多枚裸片集成更多的可编程逻辑单元。

  3. 自从2012年SSI技术发布至今,该制作工艺已较为成熟。



在2017年的Hot Chips大会上,Xilinx发布了Virtex UltraScale+ HBM系列FPGA,其中仍然使用基于第四代硅中介层的技术来组合3枚16nm FPGA,以及2枚32GB的存储芯片(High Bandwidth Memory - HBM), 如下图所示。


5


Xilinx SSI技术的主要缺点

然而,SSI技术的缺点也同样明显,主要有以下四点。


首先,SSI技术特别适用于每代半导体工艺制造工艺早期,即制造大型裸片工艺不成熟导致良率极低时。然而,当工艺成熟后,良率会明显上升,此时再使用SSI技术并不会明显提升良率。


在本章开始的例子中,据研究表明,使用成熟的工艺制造6cm2裸片的良率会从一开始的0.25%猛增至55%,相比之下制造1.5cm2裸片的良率会从22%上升至86% 。这样以来,一块12英尺的晶圆可以产出66.9片6cm2的裸片,以及104.6片4x1.5cm2的裸片,产量差别已然不大。


同时,制造硅中介层、TSV以及在同一封装内组装多枚裸片的成本就会在此时逐步显现,导致整体的成本优势进一步减弱。


第二,和一片完整的大型FPGA裸片相比,将多枚FPGA裸片通过硅中间层组合可能会带来明显的性能降低。


这里对性能的影响来自于很多方面,比如在垂直方向上,由于硅中间层的引入,使得裸片引脚到封装引脚要先后经过硅通孔TSV,额外的C4凸块,以及封装基底内的导线。相比之下单芯片系统只需经过封装基底内的导线即可。


在水平方向上,硅中介层中的导线和微凸块会带来额外的延迟开销。研究表明,对于一个7x12mm的裸片而言,其微凸块可能分布在距离芯片边界2.25mm的“远方”,这样将两个裸片进行互连时,在中介层中的导线长度会非常可观,从而可能带来1ns左右的线路延时。相比之下,FPGA片上的延时才不过几百ps。


下图展示了Andre Pereira和Vaughn Betz在2014年的FPGA国际会议发表的文章中的结果,从中可见裸片间延时对系统性能的消极影响,其中蓝色线为使用单一硅片的对比组,即没有片间延时的情况。例如,当互连使得关键路径增加0.5ns,1ns或1.5ns时,系统性能会分别下降约20%,35%和50%。


此外,硅通孔TSV也可能会对性能造成负面影响。对于一个大型FPGA,可能存在成千上万个I/O引脚,而每个都需要有TSV与之对应,这样大大增加了制造难度。同时,高密度TSV也可能对信号一致性造成干扰,引发串扰和耦合,这增加了尤其对于高速模拟信号的设计和控制的难度和复杂性。


第三,该技术对FPGA配置的灵活性也可能会造成很大影响。采用多枚FPGA裸片相当于人为的划分了多个设计区域和边界,为了设计的优化实现,可能需要人为进行设计划分,增加了设计成本和周期。另一方面,这些无法改动的设计区域和边界也可能会造成额外的芯片使用,从而导致功耗的增加和性能的降低。


如下图所示,假设原本有一个设计包含模块A到F,其中F为内存控制器并连接了大量并行I/O。在单芯片系统中,该设计只使用2/3的芯片面积即可实现(见下图左)。然而在SSI器件中,由于两个裸片间的互连延时增加,将模块F分布于两个裸片已无法满足时序要求,因此只能将其放于单个裸片中。这样一来,模块ABCD要重新布局到整个芯片,造成不必要的资源使用(见右下图)。


第四,FPGA设计工具需要进行一定程度的改动和优化,以适应这种新的FPGA架构,从而可能会增加设计难度、延长了设计周期。


对于时序优化工具而言,片间延时的增加使得时序收敛的难度增加。对于布局布线工具而言,由于片间只存在相对有限的布局布线资源,因此增加了布局拥堵的可能性。和传统FPGA设计流程相比,在布局映射(Mapping)和布线(Routing)两步之间,可能会需要加入额外的人为或自动的设计区域划分,以协调各个裸片的资源使用和时序收敛。另外,全局的时序和布局布线的协同优化可能会变得更加复杂。


理论上Xilinx的Vivado设计工具会解决(或尝试解决)上述问题,但不清楚用户有多大的灵活性对设计工具进行控制和进行人为优化。由于没有找到相关文档,因此也不清楚和在单一FPGA硅片上使用传统设计流程进行开发相比,这种新的流程对系统性能和资源使用的影响。


然而,对于学术研究而言,诸如VPR这种在学术中广泛使用的设计工具需要进行架构层面的调整,以适应这种新的FPGA结构。这对于学术发展不一定是坏处。


6


小结

本文主要介绍了Xilinx的SSI技术在制造3D FPGA上的主要原理及其主要优缺点。下篇博文将介绍业界另一个主流方案,即英特尔的EMIB技术。


参考文献


  1. Three Ages of FPGAs: A Retrospective on the First Thirty Years of FPGA Technology, Steve Trimberger, 2015.

  2. CAD and routing architecture for interposer-based Multi-FPGA Systems, Andre Pereira and Vaughn Betz, FPGA 2014.

  3. Xilinx whitepaper: Xilinx Large FPGA Methodolody Guide, 2012.

  4. Xilinx whitepaper: Xilinx Stacked Silicon Interconnect Technology Delivers Breakthrough FPGA Capacity, Bandwidth, and Power Efficiency, 2012.

  5. Assembly and Reliability Challenges in 3D Integration of 28nm FPGA Die on a Large
    High Density 65nm Passive Interposer, Raghunandan Chaware, Kumar Nagarajan, Suresh Ramalingam, 2012.

  6. Xilinx 16nm Datacenter Device Family with In-Package HBM and CCIX Interconnect, Gaurav Singh et al. Hot Chips 2017.



高端微信群介绍

创业投资群


AI、IOT、芯片创始人、投资人、分析师、券商

闪存群


覆盖5000多位全球华人闪存、存储芯片精英

云计算群


全闪存、软件定义存储SDS、超融合等公有云和私有云讨论

AI芯片群


讨论AI芯片和GPU、FPGA、CPU异构计算

5G群


物联网、5G芯片讨论

第三代半导体群

氮化镓、碳化硅等化合物半导体讨论

储芯片群

DRAM、NAND、3D XPoint等各类存储介质和主控讨论

汽车电子群

MCU、电源、传感器等汽车电子讨论

光电器件群

光通信、激光器、ToF、AR、VCSEL等光电器件讨论

渠道群

存储和芯片产品报价、行情、渠道、供应链




< 长按识别二维码添加好友 >

加入上述群聊




长按并关注

带你走进万物存储、万物智能、

万物互联信息革命新时代

微信号:SSDFans
SSDFans AI+IOT+闪存,万物存储、万物智能、万物互联的闪存2.0时代即将到来,你,准备好了吗?
评论
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 44浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 115浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 47浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 51浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 137浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 160浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 84浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 108浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 195浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 101浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦