(本文编译自Semiconductor Engineering)
即使对于习惯于权衡功耗和性能的设计人员来说,3D-IC仍是一个挑战,但由于人工智能的计算需求和数字逻辑的不断缩小,它们被认为是尖端设计不可避免的迁移路径。
3D-IC被广泛认为是继续突破平面SoC极限的方法,也是将更多使用不同工艺节点开发的异构设备集成到同一封装中的方法。但无论是平面SoC还是chiplet,物理定律都是无法逾越的,工程师能使用的技巧非常有限,否则就会碰壁。
在先进节点中,较细的导线会增加电阻,从而增加热量。而像3D-IC这样更大的的结构则可以扩大热梯度范围。但这种结构中得散热方式有限,这使问题更加严重。负面影响可能从细微影响(如电迁移)到严重情况(如芯片起火)不等。此外,随着制造工艺节点降至个位数纳米级,甚至埃米级,控制或考虑变化变得更加困难,这可能会导致噪声增加和可靠性降低等严重问题。所有这些都要求设计师在最佳性能规格和不配合的物理现实之间找到越来越脆弱的平衡。
3D-IC的复杂性增加了曾经是理论上的热问题的风险,例如DRAM自发刷新和可能导致设备关闭的热失控。在光子学应用中,热量会通过改变光的波长来干扰通信。
图 1:芯片和封装组件的温度分布
(来源:Ansys)
Ansys首席产品经理Lang Lin表示:“热也会导致时序问题。高温会导致线路延迟过高,从而降低电路速度。我们从代工厂那里听说,热是焦点。”
热量和工艺变化可能是独立的问题,也可能是相互放大问题。无论如何,它们都可能产生连锁反应,需要有远见才能解决。西门子EDA公司Calibre设计解决方案物理验证产品管理高级总监Michael White表示:“这些问题在一定程度上是正交的。解决热量问题必须在更宏观的层面上进行。如果我遇到热量问题,最简单的第一步就是改变布局。如果这还不够,我可以开始考虑在我的有源设计中放置热柱,以将热量从热区吸走。之后,我需要开始考虑芯片在封装中的位置。在最坏的情况下,如果我开始没有选择,我必须更改封装。我必须在上面放散热器等等。这些都是在创建整体组件的整个生命周期中从最简单到成本最低的选项。如果我可以左移,我就能尽早弄清楚这些问题。”
翘曲是首要问题
目前,3D-IC面临的最大挑战是热致翘曲。随着异构材料高度密集的配置导致温度升高,并且需要复杂的热系数建模来避免良率损失,翘曲问题已经从偶尔出现的问题变成了持续存在的问题。除此之外,基板变得更薄,这降低了其将热量从设备中排出的能力。
“大约一年前,没人谈论热致翘曲和应力分析,”Cadence产品管理总监Melika Roshandell说道,“由于3D-IC,这方面的问题开始出现。设计对热的影响越来越大,尺寸也越来越小、越来越薄,这对翘曲产生了很大的影响。以前一些会议上的热门话题是热管理,但现在变成了热致翘曲。”
Lin表示,中介层尺寸的增大也加剧了这一问题。“如今的3D IC中介层已经变得更大,可能从2,000到5,000平方毫米不等。因此,翘曲变得如此之大,以至于无法再被忽略。之前翘曲大约为5nm左右,对于大型中介层来说,翘曲甚至可能更高。两种材料之间的距离变化也可能导致机械故障,导致芯片之间的连接破裂。”
机械应力是先进设计的另一个不可避免的问题,它增加了3D-IC多物理场的担忧。西门子EDA公司Calibre nmDRC应用产品管理总监John Ferguson表示:“机械应力问题与热问题也密切相关。随着温度升高,导线会变形,从而改变机械应力。特别是,人们主要担心的是凸块。我们是否获得了良好的粘附性和凸块清晰度,从而能够正确且充分地形成欧姆接触?晶圆开裂是另一个值得关注的问题,一般来说翘曲也是如此。如果将东西堆叠在一起,那么你必须保证两面都是平面的,否则就有出现气隙或其他形式的间隙。这些问题都不能被忽视。”
添加TSV也成为一个问题。“你制造了大洞,然后用其他材料填充它们,”Ferguson解释道,“如何在不引起某种形式的翘曲的情况下做到这一点并不容易。这一切都取决于你在开始时如何控制芯片工艺,以确保它们尽可能平坦。下一步是小心堆叠。例如,如果我们谈论的是将一个芯片堆叠在另一个芯片上,或者将第二个芯片堆叠在晶圆上,第一步是确保你有良好的平面度。这取决于你如何填充,以及制造、化学机械抛光工艺,以及它们的可调谐性。当我们谈论非常薄的芯片时,这可能会变得更具挑战性。如果你谈论的是将单个芯片与其它芯片放在一起,那么在有些情况下,一个芯片会故意悬在另一个芯片之上。这就像是一块跳水板,一边是陆地,另一边是悬在水池里。这绝对是可能出现翘曲的地方。”
这种情况已经变得如此糟糕,以至于影响到了基本优先级。Cadence的Roshandell表示:“SoC设计师只关心三件事——功耗、性能和面积——但热问题正在成为第四个问题。过去所有的PPA都在向PPA-T转变。你的性能越来越高,这意味着功耗也越来越高,而你还想要减小面积,所以热管理问题会变得更糟。在所有这些方面,热管理问题总是与你作对。对于封装和PCB,你还必须关心信号完整性、电源完整性、翘曲和其他热管理问题带来的全局问题。你不能只看你芯片的一角,再看你封装和PCB的另一角,然后说,“我的封装没问题,所以我不用担心其他事情。”你在进行热分析时必须考虑整个设计。这就是为什么任何工程师都必须着眼于整体问题,然后再进行热分析。为此,尤其是在3D-IC中,您的工具需要具有很大的容量,以便能够在不进行简化的情况下读取整个设计。如果您对其进行简化,您将失去访问权限,而许多工程师不知道从哪里进行简化。作为一名工程师,您需要记住这是一个全局问题,您需要一个能够在设计的最早阶段进行分析的工具。”
如果热分析不够早,可能会出现问题。许多设备使用PVT传感器来检测过热,然后根据需要采用热节流。西门子的White表示:“芯片上分散的热传感器可以监测局部温度。如果顶部局部温度过高,它们就有能力减慢局部时钟。”
然而,这种解决方案是以牺牲性能为代价的,从而使得设备缺乏竞争力。“热节流”并不能解决问题,”Ansys半导体部门产品营销总监Marc Swinnen表示,“它检测到问题,然后付出代价来修复。这在名义上无法达到额定性能,因为芯片会不断升温并自我节流,所以成本非常高,而且这也表明我们未能预测到这个问题。问题出现后,我们现在需要付出代价来降低功耗,但这不是你想要的结果。你想要的是能够预测它。”
左移
EDA专家一直强调,预测并减少问题的答案是左移。尽早了解和修复潜在问题要好得多。
“以前,设计师设计IC,在一切完成后,再将其发送给分析工程师。但现在这种方式已经行不通了,尤其是在3D-IC领域,”Roshandell表示,“你必须从第一天就开始进行设计和分析,这样如果需要更改设计中的任何内容,就可以立即解决。我们之前的一些权宜之计,例如增加风扇和散热器,现在都不再有效,因为热传递速度太快,等到到达散热器或液体冷却时,已经处于热失控状态。你必须制定风险缓解计划。最好的情况是从最开始就知道风险是什么,这样你就可以找到解决方案。”
不应低估改变传统工作流程的挑战性。鉴于人的本性,改变往往很困难。设计师和公司可能没有意识到改变长期存在的工作流程的成本和时间优势。可能需要进行一些艰难的经济分析才能说服怀疑论者,尽管向左转移最初会带来颠覆性影响,但从长远来看将更具成本效益。
“左移就是为了让设计师更有效率,”White说道,“我们说服人们采用这种做法的方式是向他们展示,虽然今天做某件事需要几个小时,但只需几分钟就可以完成。而且在几分钟内完成之后,它会比使用传统方法干净利落。‘看看你能提高多少速度,以及你需要调试的错误减少了多少?这听起来是不是更好?’”
左移可以帮助创建更稳健、更可靠的设计,而且使用正确的工具,它还可以通过减少迭代次数来帮助加快整个设计过程的速度。“如果你尽早开始进行热可行性分析,它会让你知道你的布局问题会在哪里,”White表示,“所以你甚至可以在正确布局之前更改你的布局。如果你在最终封装之前不考虑热问题,并且你已经完成了每个IC的物理布局,那就太迟了。”
可靠性
热量和变化引起的问题不再只是短期问题。在多个市场中,芯片被用于关键应用且预期寿命更长,可靠性已成为主要问题。提高可靠性的最佳选择是提前规划,并尽可能构建冗余和弹性。
“很多可靠性只是基本的统计数据,”Synopsys EDA集团杰出架构师Rob Aitken表示,“假设某个特定事件有发生的可能性。当我们进入较低的节点时,使用的设备会更多,这意味着某些事情发生的概率也会增加。如果你有一个有500亿个晶体管的芯片,那么就有50个地方可能发生十亿分之一的事件。”
依赖TSV来帮助进行热管理也可能会增加可靠性问题。“芯片中最大的可靠性故障点之一就是通孔,”Swinnen说道,“这些传统上都是故障点。”
简而言之,曾经可以被忽视的问题现在已成为突出的问题,而提高认识是预防的最佳手段之一。
结论
尝试解决热问题最终可能会推动行业向左转移并重新思考活动孤岛。
Ansys首席产品经理Suhail Saif表示:“当我们拜访客户时,我们最终会与许多各自为政的不同团队进行交谈。我们建议他们,为了更高效、更早、以最低成本成功签发芯片,他们需要携手合作。从他们的角度来看,这很难做到,但这些先进效应正迫使他们比以前更加努力地进行尝试。我们确实需要一个跨领域的统一解决方案,让他们相互交流,并意识到他们在一方所做的事情会对另一方产生连锁反应,反之亦然。热问题并不是唯一促使大家一起协同工作的原因,但它可能是最严重的。从成本和发布延迟角度来看,它可能对芯片设计整体影响最大。从这个角度来看,热问题是公司想要赢得市场份额时不能忽视的最重要、最关键的问题。”
最终,这些问题的答案最有可能来自人类的合作,以及材料科学或物理学。Cadence的Roshandell 指出:“从芯片设计师一直到最终产品,各自为政的现象正在发生显著变化。人们使用相同的数据库进行分析,而提供数据库的是芯片设计师。我们看到行业中发生了许多变化,人们开始在同一个数据库中一起工作。”
END