Intel说“拆分”fab每年节约几十亿美元，怎么节约的？-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

在最近的投资者webinar上，Intel表示包括Intel Foundry Services在内的制造业务，将单独汇报盈亏/核算。据说这样每年能给Intel节约几十亿美元？

有关Intel的IDM 2.0计划，过去一年我们也谈得挺多的了。大部分关注Intel的同学应该都知道，IDM 2.0的核心思路涵盖更积极地对外提供foundry服务、部分芯片的制造交给第三方foundry进行，以及坚持Intel的IDM模式不变。

去年3月份，我们也大致谈论过Intel 的 foundry 业务能够给 Intel 带来的价值，包括旧工艺的资源转化和复用、原有制造资产的寿命更久、尽早实现较高的产能输出和工厂利用率等。

不过IDM 2.0大框架还是很抽象，比如说foundry尤其是先进工艺对外代工与否，除了更赚钱，还有什么价值；以及foundry一定程度的“独立”对Intel的芯片设计又有什么实际作用。前不久在面向投资者的 webinar 上，Intel更多地谈到了把foundry制造，与设计一定程度“解耦”的逻辑，在我们看来对理解Intel的未来发展很有价值。

在这次的投资者webinar上，Intel表示包括Intel Foundry Services在内的制造业务，将单独汇报盈亏；也就是单独核算，并不是真正的“拆分”。Intel不是直接把设计业务和foundry业务简单地切分开。Intel方面表示，产品和制造业务的融合还是有很大价值，比如说内部团队合作，且内部团队作为新工艺的“0号客户”，能够为外部合作方降低工艺节点的潜在风险，也有利于快速提量，所以没有必要将业务单纯地一分为二。

那么这样的“解耦”或者叫“内部foundry模型”，真正产生的价值又有哪些呢？

从IDM 1.0到2.0

仿佛在HPC领域坚持IDM的主要市场参与者已经十分罕见了，连三星的LSI设计和foundry业务都剥离得很开。尤其HPC方向的IDM，会构成巨大的风险，毕竟尖端制造工艺无论是难度还是投入，都不是过去可比的。

不过IDM也有自身的一些优势，比如对于fabless + foundry的模型来看，fabless和foundry毕竟还是不同的公司，则数据共享等问题会存在限制；另外如Intel作为IDM，从直觉来看，芯片产品的最终价格有成本优化的空间，利润也能做得更高。

但是，Intel给出了一份预期数据，即假定现行foundry+fabless双方构成同一家企业，则相比于Intel，可达成的毛利率（gross margin）差异。前者到2022年会有>20%的领先，这跟我们的“直觉”判断是很不一样的。

从Intel的数据来看，在14nm以前，Intel还的确在毛利率上有优势，但后续剪刀叉形成，大约是在2017年，尖端制造工艺往10nm/7nm转向之际。Intel在制造工艺上落后于台积电这样的竞争对手以后，Intel的更多问题也暴露了出来，包括各种低效的资源配给方式。制造工艺的落后在此仿佛成为IDM模式优势变弱势的转折点。

SemiAnalysis在最近的分析文章中说，由于更低的工具利用率和更糟的良率，若要达成相同的产能输出，Intel是要用上更多的fab空间的。这就很大程度地表现出了低效。而且Intel的设计团队实际也某种程度上存在效率低下问题：相比于AMD处理器，达成相似的性能，需要更多的晶体管——而且在新架构量产前，还总是浪费更多的fab资源，和更高的设计成本。这些后文会提及。

从表象上来看，首先需要解决的问题，当然就是尖端制造工艺技术得跟上。所以Intel提出了4年完成5个工艺节点的目标：就前不久PowerVia 技术的阶段性汇报来看，我们认为Intel要按计划在2025年赶上台积电，应该是可以做到的。但光解决尖端制造工艺的技术问题，实际上是不够的——要不然也不需要提什么IDM 2.0。

这样的大环境下，包括尖端制造工艺的资本密集度显著提升，chiplet时代到来导致不少旧工艺价值的提升，以及Intel在尖端制造工艺上开始落后于竞争对手，于是Intel开始寻求IDM 2.0的改变——着力于解决IDM低效的问题。

从IDM 2.0的大框架来看，更积极地对外提供foundry服务本来就是提升资源利用率的方案，而芯片设计部分给到外部foundry厂亦如是。但这还不是全部。

IDM的一些低效轶事

似乎在我们的理想臆测里，IDM是设计、制造两个团队的和谐搭配，工艺还能根据设计来做适配，一切都应该挺美好的。但实际情况却经常不是这样。举个例子，关注Intel CPU各项参数的读者应该知道stepping步进这个概念。不过这里所说的步进是量产之前的stepping。

在芯片设计完成之后，将设计发给fab，设计转为光掩模（photomask），并通过一大堆的工艺步骤来造测试芯片......设计方拿到返回的测试芯片以后，还需要去检查、发现问题，并对设计再做调整。Stepping是指每次迭代：每次迭代后的版本设计发往fab，都需要对测试芯片重新构建光掩模。

据Intel CFO（首席财务官）David Zinsner所说，以前Intel的设计团队想做多少次迭代，就做多少次迭代。比如面向数据中心的Sapphaire Rapids芯片据说经过了12次stepping——相比较来看，AMD这边类似定位的Bergamo、Genoa就只需要2-3次stepping。那么像这样一个过程，就存在成本的大量增加，同时time-to-market也延迟了。这可能就是IDM的“任性”表现之一吧。

SemiAnalysis说他们听过一个传言，有一次Intel某设计团队还没先做好完整的仿真验证，就很任性地把设计发给fab，然后跑hot lot来测试bug——当然这只是个传言，真假未知，大约是为了体现原本IDM 1.0运营模式中的低效的。

Intel期望减少出样和stepping的次数，方案是要给钱——设计和产品业务部门需要为这样的操作支出费用，这样就能节制他们的stepping行为。不过据说Intel的设计团队多年前就开始转向更加行业标准的设计技术方法了，虽然可能这个过程转变仍然需要时间。

Intel方面表示，这个改变每年能够节约5-10亿美金。

同类改变再比如hot lot相关的。一般同批次处理wafer就叫lot，这些wafer依次由某个生产工具处理过之后，再发往下一个工具。所谓的hot lot可以理解为“插队”的批次，就是给某批wafer以优先级，更快地做处理。

对于某些新工艺步骤或工具做验证，或者是以新的设计与技术做测试芯片，搞hot lot也很正常。但据说此前设计团队也是想怎么安排hot lot，就怎么安排，不考虑工具利用率和成本的问题。

很容易想见，随便跑hot lot就是会降低整体的生产利用率。那么很自然地，Intel现如今的方案是，芯片设计若要跑hot lot，需要和常规模式一样付钱，自然也就能更好地解决这个问题。Intel认为，这样的举措同样能够每年节约5-10亿美金。

还有个典型的成本节约环节体现在测试、sort、bin上。此前我们也撰文谈过所谓的“binning”流程。除了常规的可靠性、耐久性测试，还像“binning process”这样的测试需求，是基于芯片制造总有良率差异，对于CPU、GPU这种设计和制造难度、成本都比较高的芯片而言，即便最终造出来的某些芯片存在问题，如某个区块不可用或者电特性并不理想，也仍然可以通过测试分组、binning的方式，来划归成不同的产品SKU出售。

Intel在测试、sort、binning方面有着高度定制的工具和流程，原本在技术上可能是存在优势的。但这次Intel特别提到，相比于竞争对手，Intel的测试时间会显著更久，甚至会长2-3倍的时间。从最终成果来看，起码近代的Intel处理器，相比竞品在产品可靠性上也并未因此表现出多大的优势。

那么直接针对测试、sort、binning收费，也能让对应的业务团队在测试策略上有所收敛，每年再节约大约5亿美元。感觉这些举措也的确是对设计与制造某种程度的解耦，显著提高资源利用率。

甩锅更有难度

HPC领域做IDM模式还有个客观缺陷，就是产品的某些问题，很难去追溯到底是谁的“锅”，权责很难做到明晰，起码无法把问题追究到个别团队和业务单位。比如最典型的CPU的性能、效率、成本，如果数字不够理想，那么究竟是谁的问题，在业务结合紧密的情况下，就会很难真正搞清楚。

换句话说，比如原本是设计团队的锅，架构层面就低效，那么这个关键问题在原本IDM 1.0模式下，极有可能被全局隐藏。IDM 2.0模式是在同时有外部设计客户做比照，以及“内部foundry模式”和权责进一步分清以后，将最终的问题更清晰地摆到台面上的。起码设计团队要把锅甩给制造业务，难度就大很多了。

其实在这一例中，上述举措在节约成本的同时，也某种程度扭转了设计团队的任性作风：因为如果“甩锅”更难，且无法随意跑hot lot、任意stepping和测试，则必然要在架构、成本之类的问题上，在前期设计阶段就多下功夫。Intel认为，这能带来每年10亿美元的节约，因为设计团队会更谨慎地去审视某些特性是否值得花在die size上。

SemiAnalysis说此前Intel设计团队会无视各种限制，比如说制造吞吐量，还有reticle尺寸等问题。而这些在台积电这种专职foundry业务的制造厂这边是不会发生的，这对客户都属于常规。

最后值得一提的是作为foundry的良率和产能问题——这和过去尖端制造工艺都面向内部的情况就很不一样。据说台积电的7nm、5nm工艺都是在6个月的时间里就从0WPM达到50000WPM（晶圆/月）的。而Intel以前的历史看起来就没有这么顺利，Ice Lake和Sapphaire Rapids的起量速度就很慢。

这次Intel表示会在工艺节点的生命周期内，收取内部的"flat wafer price"，以期加速新产品的产能爬坡速度。虽然我们不知道具体在财务上，这笔账是怎么算的，不过Intel也表示这么做既能每年节约10亿美元，而且能提升产品上市的速度。

还有就是作为面向内部的foundry服务，也需要收取产能占用、锁订单的费用——Intel表示在此之前设计团队想改forecast都是随时随地的...这么看来，设计与制造的部分解耦，略有点儿内部市场化的意思。制造业务不会再像过去那样各种迁就设计团队了。这么做自然也增加了制造业务的工具利用率，因为面向内部和外部都能做更好的生产规划了。

基于我们对Intel产品路线图的观察，先进制造工艺、先进封装技术悉数抛出，CPU之外的产品也开始全面布局，前沿技术研究也在持续，势头还是相当好的。只不过我们预计今明两年对Intel而言，仍然会是难熬的两年。

先进制造工艺的追赶，以及以酷睿Ultra CPU为代表的处理器，开始全面采用chiplet与先进封装技术，技术布局水平也全面优于AMD这样的竞争对手，固然对长期发展非常有益；但我们认为这些很难在短期内造成昔日绝对优势的局面，则在强敌环饲的现在，也就做不到轻易破局。

不过规划和方向都已全面到位，不再是2年前阴霾密布的窘境。IDM 2.0在我们看来，的确是Intel中长期内“重回王座”的关键。Meteor Lake、Sapphaire Rapids破不了局没关系，因为这些产品都是为下一代技术打头阵做准备的。

责编：Illumi

阅读全文，请先

制造/封装处理器/DSP

Intel说“拆分”fab每年节约几十亿美元，怎么节约的？

从IDM 1.0到2.0

IDM的一些低效轶事

甩锅更有难度

杂志声明