爱“拼”才会赢:Multi-Die如何引领后摩尔时代的创新?

新思科技 2023-06-12 17:36

本文转自半导体行业观察

感谢半导体行业观察对新思科技的关注


过去50多年来,半导体行业一直沿着摩尔定律的步伐前行,晶体管的密度不断增加,逐渐来到百亿级别,这就带来了密度和成本上的极大挑战。随着摩尔定律逼近极限,传统的单片半导体器件已不再能够满足某些计算密集型、工作负载重的应用程序的性能或功能需求。如何进一步有效提高芯片性能同时把成本控制在设计公司可承受的范围内,成为了半导体产业链一致的难题。


对此,新思科技提出了一个新的设计理念——“SysMoore”。“Sys”取自System(系统),指的是要在系统层面提升芯片的性能,而不仅仅是在晶圆中集成更多的晶体管数量。在SysMoore的时代,Multi-Die系统正在成为超越摩尔定律和解决系统复杂性挑战的解决方案,它能实现以经济高效的方式更快地扩展系统功能、降低风险、缩短产品上市时间、以更低的功耗实现更高的吞吐量,以及快速打造新的产品类别。而戈登·摩尔本人也预言道,“事实可能证明,用较小的分别封装并相互连接的功能构建大型系统更经济。”


图1:我们正迈入“SysMoore”时代


将多个die(或小芯片)放在一个封装下的Multi-Die系统,有诸多优势:


  • 以具有成本效益的价格加速扩展系统功能(>2X reticle limits)

  • 通过重复使用经过验证的设计/die,降低了风险和上市时间

  • 在降低系统功耗的同时提高吞吐量,最高可达30%

  • 为灵活的投资组合管理快速创建新的产品变体


那么哪些市场会比较青睐于采用Multi-Die系统呢?据新思科技对采用Multi-Die系统设计的调查,从应用领域来看,服务器/AI占主导地位,网卡/交换机也比较常用,智能手机/图形/PC领域上的采用主要是一些专用芯片,再就是一些光电共封和汽车领域正在向Multi-Die发展;从制程节点来看,5nm工艺采用Multi-Die的比例最大,再就是7nm和3nm。


随着2.5D、3D这样先进封装技术的进步,Multi-Die系统的实现也越来越成为可能。目前业内已有多个Multi-Die的商业实例,不仅仅是传统的芯片制造商在向Multi-Die发展,超大规模数据中心厂商、自动驾驶汽车厂商、网络公司等也都在设计自己的芯片,并以多种方式推动Multi-Die架构的转变,譬如AMD 的3D V-Cache、苹果的M2、英特尔Meteor Lake处理器、索尼的CIS、Lightmatter、特斯拉等。这些厂商对性能、安全和可靠性有着特殊的要求,Multi-Die则可以满足他们在特定领域下的这些需求。


但是从单片SoC到Multi-Die系统的迁移也不是易事。从单片SoC向Multi-Die系统迁移带来了必须从整体上解决的独特挑战:例如异构系统集成、功耗和热管理、系统设计规划、Die-to-Die连接、软件开发和建模、系统验证能力/性能、系统签核分析、分层测试和修复、可靠性和安全性、系统良率、内存利用率和一致性等等。在做每一个选择和决定时,都应考虑到方方面面及其对设计总体PPA目标的影响。


图2:从单片SoC迁移到Multi-Die系统过程中的诸多挑战


所以此时就需要EDA和IP产品的介入,来帮助客户从系统规划到实现和固件/硬件/软件联合开发,助力Multi-Die系统更好的实现。


那么,要设计Multi-Die系统,从整个系统的角度来看,有哪些重要的步骤和需要考量的点呢?


首先,在设计之初时,即在早期架构探索阶段,必须采取分析驱动法来考虑各项宏观架构决策,如IP选择、硬件/软件分解、系统级功耗分析和互连/存储尺寸标注。此外,还要考虑与聚合(利用多个裸片组装系统)和分解(将应用分解到多个裸片上)相关的Multi-Die宏观架构决策。


围绕几个关键领域做出的早期架构决策可以从以下方面改进设计过程:一是将系统分成多个裸片,并且要满足扩展、制造和功能的需求;二是需要优化Multi-Die系统,包括优化带宽密度、每比特的能量、成本和延迟,选择芯片的的协议和接口,如UCIe等;最后是使用Multi-Die系统模型,评估不同制造和封装技术对性能的影响,加速架构的实现。


图3:对Multi-Die进行早期架构探索


架构探索做完之后,另一大重要的挑战是散热问题。Multi-Die系统将多个组件集成在一起,密集的晶体管密度产生大量的热量,尤其是Multi-Die System的架构设计几乎没有什么散热的空间,如果热量散不出去,芯片的功能可能会受到机械应力或翘曲的影响。所以就需要进行热分析,对整个系统进行功率分析、电源完整性、电热模拟、力学分析,来满足功耗和散热关键性能指标。


另外很重要的一点是,Multi-Die系统还需要一种统一的方法来进行die和封装的协同设计,包括设计、分析和signoff,以加速这些系统的设计闭环。


同时,考虑到如此复杂的系统所运行的软件也相当复杂,必须尽早开始验证过程,因此需要创建多模系统的虚拟原型来支持软件开发。Multi-Die系统软件开发和系统验证,需要进行一些关键的考虑和解决方法。多抽象系统建模可以利用快速、可伸缩的执行平台,这些平台使用虚拟原型、仿真、混合仿真和原型。一般而言,300亿的门是Multi-Die最佳的扩展系统。通过使用经过验证的模型、处理程序、速度适配器,优化软件的验证周期,包括die-to-die接口的验证、Multi-Die系统验证,以此来将启动时间最小化。


图4:软件开发和系统验证的一些考量和解决方法


值得一提的是,目前工具流程中的自动化已经提高架构探索效率,超越了过去几年基于电子表格的手动预测。展望未来,统一的设计空间探索将进一步提高这个过程的准确性和效率。


由此可以看出,Multi-Die系统的实现需要理解上述所有设计过程之间的相互依赖性。对此,新思科技提供了业界较全面、具有可扩展的Multi-Die解决方案,为Multi-Die的成功实现提供了更快的路径。该解决方案包含全面的EDA工具和IP,不仅支持早期架构探索、快速的软件开发和验证、高效的裸片/封装协同设计,以及稳健和安全的die-to-die连接,而且还能改进芯片的健康状况和可靠性。久经生产考验的设计引擎以及黄金签核和验证技术能够更大限度地降低风险,并加速打造出色的系统。(如下图5所示)。


图5:新思科技Multi-Die系统解决方案


具体来看,在早期架构探索方面,新思科技的Platform Architect™为架构师和系统设计师提供了一个基于SystemC™事务级模型(TLM)的工具和高效方法,可以用于早期分析和优化多核 SoC 架构的性能和功耗。Platform Architect使开发者能够探索和优化SoC基础设施的硬件—软件分区和配置,特别是全局互连和内存子系统,以实现合适的系统性能、功耗和成本。


图6:新思科技的Platform Architect™工作示意图


在软件开发方面,新思科技的Virtualizer可以加速Multi-Die系统虚拟原型的开发和部署,Virtualizer解决方案能提供更高的生产力,使开发者能够以最快的速度获得高质量的软件(如图7所示)。在系统验证仿真方面,新思科技的ZeBu和HAPS则可以用于复杂软件和系统验证(图8)。其中,新思科技ZeBu®EP1是业界首个统一仿真和原型设计系统,它能使用户可以在整个芯片开发生命周期中利用这个单一验证硬件系统。HAPS-100能允许设计人员、软件开发人员和验证工程师通过HAPS Gateway管理multi-design、多用户部署,以实现最大的生产力和成本效率。


图7


图8


在Multi-Die系统设计实现上,新思科技3DIC Compiler平台是一个完整的端到端解决方案,它结合了许多变革的、Multi-Die设计功能,提供了一个完整的从架构到签核的平台,可实现高效的2.5D和3D Multi-Die系统集成,其内部的黄金signoff工具可以保证每个参数都能准确、完整和方便地signoff。


除此之外,新思科技还可以提供一系列经过硅验证的可靠和安全IP,包括用于高带宽、低延迟的die-to-die连接的UCIe、用于高带宽、低功耗内存的HBM和用于防止篡改和物理攻击的安全接口等等。


图9:新思科技可以提供一系列经过硅验证的UCIe IP


为了确保最终制造的良率和产品的可靠性,需要对产品质量进行测试,包括对Multi-Die系统中的各个裸片、内存、互联以及整个系统进行全面的测试、调试、维修,特别是像3DIC这样的多系统设计提出了独特的测试挑战,IEEE Std 1838-2019就是3DIC一个必须要满足的标准。最终保证已知合格裸片(KGD)、封装和系统的可用性。


图10:需要对产品质量进行测试,对芯片全生命周期进行管理


在测试方面,新思科技的TestMAX™系列可以为半导体设备的所有数字、存储和模拟部分提供创新的测试和诊断功能。通过完整的RTL集成支持复杂可测性设计(DFT) 逻辑的早期验证,同时通过与新思科技Fusion Design Platform的直接链接保持物理、时序和功耗感知。这些新功能,再结合对早期可测试性分析和规划、分层ATPG压缩、物理感知诊断、逻辑 BIST、内存自测试和修复以及模拟故障模拟的全面支持。


图11:新思科技的TestMAX™ 系列


另一方面可以通过芯片全生命周期管理(SLM)技术进行评估,SLM将监视器集成到设计的组件中,以便在设备的整个生命周期中提取数据,甚至在设备在现场的时候。从硅到系统收集到的深入的、可操作的见解允许持续的分析和优化。对于Multi-Die这一体系结构,重点将放在系统上,因此监控基础设施应该跨多个系统,在这方面,新思科技的SLM系列产品改进了设备生命周期每个阶段的操作指标,该系列有一整套集成工具、IP和方法,在系统的整个生命周期内智能高效地收集和存储监控数据,并通过使用强大的分析提供可操作的见解。


图12:新思科技的芯片生命周期管理产品(SLM)系列


Multi-Die系统的出现为电子行业指明了一个新的发展方向,人工智能、超大规模数据中心、网络,手机和汽车等技术正在改变硅行业的格局,将Multi-Die设计推向前沿。但是我们需要明确的是,Multi-Die系统也面临着重大的设计挑战,整个行业需要共同努力,一起推动芯片的创新。










新思科技 新思科技(Synopsys, Inc.)以芯片产业的“根技术”推动AI、5G、高性能计算、智能汽车等前沿应用的核心技术发展。
评论
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 173浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 119浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 145浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 127浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 44浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦