CPU为什么很少会坏？CPU出厂如何测试？

EETOP 2022-03-13 17:38 1675浏览 0评论 0点赞

汽车照明系统的“智慧大脑”，竟然是它？》 2D→3D测试难？Tessent DFT一招搞

在计算机的一生中，CPU坏的概率极小。正常使用的情况下，就算其他主要的电脑配件都坏了，CPU都不会坏。

CPU出现损坏的情况，多数都是外界原因。最主要的就是长期在超频下工作，且散热性差，引起电子热迁移导致的损坏。

现在的个人电脑的更新换代基本不是由于CPU损坏才换的，主要是因为软件不断的升级、越来越大，造作系统的垃圾越来越多导致卡顿，让你无法忍受，才换电脑的。

CPU在出厂之前，是经过非常严格的测试的，甚至在设计之初，就要考虑测试的问题。可以从pre-silicon、post-silicon和硅的物理性质等方面来解释这个问题。

1、CPU被做成产品之前被检出缺陷

这一个阶段也就是芯片tape out之后，应用到系统或者产品之前。

事实上，在现在的芯片设计中，在设计之初就已经为芯片的制造，测试，以及良率做考虑了。保证这一步能检测出芯片的缺陷，主要是DFT+ATE来保证。当然也有一些公司会做DFD和DFM。

DFT = Design For Test

DFD = Design For Debug

DFM = Design for Manufacture

DFT指的是在芯片的设计阶段即插入各种用于提高芯片可测试性（包括可控制性和可观测性）的硬件电路，通过这部分逻辑，生成测试向量，使测试大规模芯片变得容易的同时，尽量减少时间以节约成本。

DFT--可测性设计，按流程划分，依然属于设计阶段（pre-silicon），只不过是为测试服务的。

而ATE（Auto Test Equipment ）则是在流片之后，也就是post-silicon阶段。

ATE测试就是为了检查制造缺陷过程中的缺陷。芯片测试分两个阶段，一个是CP（Chip Probing）测试，也就是晶圆（Wafer）测试。另外一个是FT（Final Test）测试，也就是把芯片封装好再进行的测试。

CP测试的目的就是在封装前就把坏的芯片筛选出来，以节省封装的成本。同时可以更直接的知道Wafer 的良率。CP测试可检查fab厂制造的工艺水平。现在对于一般的wafer成熟工艺，很多公司多把CP给省了，以减少CP测试成本。具体做不做CP测试，就是封装成本和CP测试成本综合考量的结果。

一片晶圆越靠近边缘，die（一个小方格，也就是一个未封装的芯片）出问题的概率越大。测出坏的芯片根据不同坏的情况不同，也会分bin，最终用作不同的用途。

所以在芯片被做成成品之前，每一片芯片都是经过量产测试才发货给客户的。

2、做成成品出厂以后，在使用过程中坏掉了

就单个晶体管来看，在正常使用过程中，真的那么容易坏掉吗？其实不然。

硅由于物理性质稳定，禁带宽度高（1.12ev）,而且用作芯片的硅是单晶硅，也很难发生化学反应，在非外力因素下，晶体管出问题的概率几乎为零。

即使如此，芯片在出场前，还要经过一项测试，叫“老化测试”，是在高/低温的炉里经过 135/25/-45摄氏度不同温度以及时间的测试，以保证其稳定性和可靠性。

根据芯片的使用寿命根据浴盆曲线（Bathtub Curve），分为三个阶段，第一阶段是初期失效：一个高的失效率。由制造，设计等原因造成。第二阶段是本征失效：非常低的失效率，由器件的本征失效机制产生。第三个阶段：击穿失效，一个高的失效率。而在计算机正常使用的时候，是处在第二阶段，失效的概率非常小。