高功率ASIC,处理器的测试挑战及解决方案

芯片的制程工艺一直在不断演进,如今,这个以纳米为单位的数字已进入到一位数时代。这一端“缩小”的同时也引发着另一端的“提升“,即集成度以及与之而来更加复杂的功耗方案和供电系统,先进制程工艺芯片的测试成本也在节节攀升。如何在这“一减一增”的矛盾中寻找平衡和突破点,从而对芯片进行有效的测试以保证产品良率,成为了当下的工程师所面临的重大挑战之一。

芯片功耗的发展趋势


晶体管是构成芯片的基本单元,它们可以视作为一个个微小的开关,控制着芯片内部电流的通断。这些开关打开和闭合的速度越快,在宏观层面上则表现为芯片运算频率,即性能的提升。因此,为了提高芯片的性能,就需要不断加强对于晶体管的控制能力,以加快其开关的速度,这也正是先进制程工艺所带来的优势。

然而伴随着性能提升,芯片的功耗问题也日益凸显,并且由于晶体管在纳米尺度下的漏电现象愈发明显,所导致的能量浪费也进一步加剧了功耗的攀升。


近年来随着半导体工艺节点的不断提升,实际芯片供电电压的核心电压(VDD)和芯片外围的I/O电压呈现不断降低的趋势,分别从从3.3V一路下降至0.6V甚至更低,以及从5V降低到1V左右。对于功耗的贡献,电压的“此消”却无法中和电流的“彼长”,随着芯片性能的提升,单位面积的电流消耗也在迅速增长,同时,大电流导致漏电所产生的静态功耗也是功耗激增的主要原因之一。

于是从宏观的应用层面来看,芯片的功耗正在变得越来越高,尤其是应用于数据中心、服务器上的高性能处理器及FPGA,比如一些training及inference芯片的实际工作功耗已经高至450w。在实际的量产测试中这已经成为了一个非常棘手的问题,较高的Toggle rate甚至会增加数倍的峰值功耗,引起的抖动电流对电源的稳压能力提出了非常大的挑战。另外一个挑战则是,先进制程的处理器需要配备非常复杂的供电系统,一些典型的FPGA产品需要非常多的相位来供电,而每一个相位的电压不同、上电顺序较为复杂且每一个power rail需要非常大的电流(高至几百安培)。

从另一个角度来看,不单单是待测试的芯片,承载这颗芯片的socket、loadboard以及针卡等设施也变得越来越复杂、越来越昂贵。通过泰瑞达关于测试应用处理器的复杂程度的统计中可以看出,早些年的应用处理器上的探针卡只需要2000根针左右,最近几年一些应用处理器的探针卡上甚至有高达7000根针,10000多个components,PCB高达70层,可想而知,这将会带来多么昂贵的测试成本。

随着整个系统的复杂度增加且造价不断升高,如何兼顾功能、精度、成本与鲁棒性等要素成为测试机厂商面临的巨大挑战。


实际测试中的挑战

应用处理器的测试机里有两个非常重要的单元,其一是数字芯片测试的数字I/O,数字I/O承担了相对复杂的工作,可以抓取失效;另一个就是电源,虽然DC电源看起来比较简单,但在实际的大功率处理器的测试中,电源起到非常重要的作用,因为它决定了测试质量,最终测试的良率也与电源的实际性能息息相关。

展开来看,应对不同的挑战,不同测试环节的测试参数和应用场景稍有区别,就需要采取不同的解决方案。

对于复杂的供电问题,利用模块化的供电策略可以降低多相位复杂供电的困扰。通过灵活地分配测试资源,将电源拆解成一个个小的电源模块,任意组合成小的单元模块给不同的电源轨供电,同时还可以利用冗余的电源模块来帮助已经预设好的模块降低供电电源轨的稳压压力。

简单举例,一个需要30安培的VDD引脚,如果每个通道支持5安培的输出能力,可以组合6个这样的单元来供电,同时利用冗余的通道组合单元与前面的6个单元组合在一起降低供电压力。

此外,还可以利用软件编程的方式设定上电次序、软启动等,以减少外围供电电路。

对于大多数应用处理器来说,工作频率与VDD一般呈现正相关性。在前期的设计验证中,厂商会尝试寻找sweet point使得芯片在有限的功耗下表现出更好的性能,在实际的生产测试中,可能会直接地设定一个指定的VDD,看其能否在这个特定的VDD下达到预期的频率。


然而,在实际的测试中,没有一款测试机是完美的。实际操作中,芯片会经常性产生误差,一种方式是尝试编程稍高于芯片预设值的电压,由于考虑芯片的误差及所有的损耗,需要保证芯片引脚上的电压依然高于预期值。通过这种测试方法,即使仪表波动到最低的电压情况下,质量好的器件仍然可以pass,从而获得更高的良率。

另一种方式,直接将测试仪表的输出编程等于预期值,由于实际上一些测试机并不能达到良好的精准度,在一些情况下略低于输出,导致这部分的芯片实际测试电压低于预期值。

这两种方式会造成不同的负面效果。在第一种的情况下,VDD的预期值需要制定得更高一些,这样的话实际的电压会高于预期值,实际测试中的热损耗也会更大,在测试中就需要低速的向量帮助降温。

第二种情况下,虽然实际出货的产品都能够pass预期值,但是对于一些误差比较大的机器,会造成额外的良率损失。对于7nm、5nm的先进制程产品来说,良率是极其重要的一个因素,由于先进制程产品尤其是晶圆面积较大时的良率本身非常低,在此基础上如果又额外损失一部分良率,这对于器件制造成本是难以接受的。

面对种种挑战,我们该如何测试?测试机应该具备怎样的特性满足以上的诸多挑战需求呢?


不同测试挑战的对症下药


 “Millivolts Matter”,每一个毫伏的精度都非常重要。越来越低的核心电压对电源的输出精度,以及动态响应提出了越来越高的要求。泰瑞达一直把电源仪表的输出电压能力作为仪表设计最重要的参数之一,这也是泰瑞达区分于众多ATE厂商的特征之一。

在实际测试过程中电源的供电不是完全平坦的,实际的电源功耗与实际工况有很大关系,甚至会导致芯片丢失状态,从而导致器件失效。这样的问题既难预测又很难排查。

通过不断改变输出的VDD与Scan Shift频率来查看所有测试向量的输出结果,当VDD越低频率越高时,越容易发生失效。在实际的Shmoo测试案例中,泰瑞达的UltraFLEXplus具有更稳定的供电电源,这意味着可获得更高的边界良率,使得芯片更加贴近于真实的本征。这样一来,在实际产品中,我们对于芯片的实际工况便能够得到一个更加准确的推断,知道哪些情况是可以工作的,哪些情况是不能工作。总的来说,更好更稳定电源不仅能够提升良率,还能够认识芯片在真正工况下的工作状态。


目前,很多芯片需要非常大的电流供电能力,输出一个非常大的电流能力对测试机来说已经不是一个难题了,很多测试机已经能够轻松供给1000A的输出能力。然而多工位测试的时候每个芯片的单个电源轨上电都要达到800 -1000A,测试机虽然能够满足1000A的静态供电,它是否能够满足0A到1000A的单步上电过程,成为了一个难题。在多工位测试的时候,泰瑞达所提供的解决方案就能够满足单步上电的大电源供给。


除了关注电源静态、动态的部分,在电源的外围电路设计上,socket、探针卡、loadboard等与电源的性能也是息息相关。

测试仪表的动态响应对直流电源的表现影响非常大,优秀的电源方案可以帮助减少外围电源电路的复杂度。传统的ATE解决方案首先需要板卡提供能量供给,大多供给从直流部分到100kHz的频域范围,针对低频、中频、高频等其他频段也需要增加不一样的外围电路,致使整体电路比较复杂。

泰瑞达侧重于简化电路设计,通过ATE本身就能提供从低频到中频的输出能力,不需要增加额外的外围电路,尽可能减少电容数量。在实际操作中,只需加入较少种类的低ESR/ESL陶瓷电容来帮助改变高频特性,令单个型号就可满足输出的动态性能。

这样的好处在于:1)降低电容值以加速恢复时间;2)电容少意味着充放电时间更快,也就意味着充放电的能量会变少,这样可以加速测试时间并降低socket被能量损伤的概率;3)降低电容使用种类,在使用单一电容的情况下,可以降低电路发生谐振、慢恢复等的可能性。


另一个比较大的挑战在于测试单元,大功率的先进制程芯片功率耗散非常大,多数输出的能量最终都会转化为热量。我们在测试时要避免芯片无限制地升温导致芯片“被烧坏”,而是希望在测试参数的时候做到可重复、可重现,使芯片维持在稳定的情况下测试,保证所有收取数据的一致性。最直接的办法可采用在测试单元的时候使用ATC(Automatic Temperature Control),常见的办法有三种:方案一)DUT Power Monitor;方案二)Die Temperature monitor;方案三)Package Temperature Monitor。



三种方式各有利弊,在时间上的效益也不同(如上图),泰瑞达更加倾向于使用方案一,其优点在于可以更早预判芯片接下来可能发生的状态并提前介入;其次,泰瑞达测试机原身也能够支持这种方式,输出每一个DPS当下负载的百分比以及输出电压的大小。

在很多实际量产的案例中,泰瑞达已经使用了这种监控方式,对比方案二、三可以更早预知芯片的实际工况。

芯片功率不断加大的情况下电路变得更加复杂,我们希望在测试的过程中所有的socket、探针卡、loadboard等都能得到比较好的监控,保证在短路、接触不良等异常情况发生时不会因此而损坏测试部件。

为避免这种情况发生,泰瑞达在设计大部分测试板卡的过程中会添加实时的报警机制,一旦任何异常发生,能够在不影响其他设备生产和中断生产的情况下,通过测试机作出实时警告,提前筛查避免异常情况的出现,减少测试漏测、质量事故等情况的发生。


总结


半导体测试就是通过测量半导体的输出响应、预期输出、并进行比较以确定或评估集成电路功能和性能的过程,贯穿设计、制造、封装、应用全过程。随着半导体制造工艺要求的提升,测试环节在半导体制造过程中的地位随之不断提升。

半导体测试机的技术核心在于功能集成、精度与速度、降低成本与可扩展性。在泰瑞达看来,测试解决方案要有足够好的静态精度及稳压能力,同时在边界情况下获得更好的鲁棒性来帮助降低失效的概率;尽可能简化外围电路的设计,降低运营方面的损失,侧面降低测试成本;最后加入警报机制来提前预判,避免发生异常情况。

备注:文章来源于网络信息仅供参考,不代表此公众号观点,如有侵权请联系删除

往期精彩回顾




大规模停电!英飞凌、博世德国工厂停摆?

iPhone 13系列5199起售,你还会买降价的iPhone 12吗?

台积电两座新厂规划:7nm和28nm

3名员工染疫身亡!又一半导体厂停工,客户包含英飞凌、ST等





皇华电子元器件IC供应商 上海皇华信息科技有限公司研发方案部门,由多名实力雄厚的硬件、软件工程师组成,提供基于飞思卡尔(freescale)、安霸(Ambarella)、瑞芯微、NXP等最新ARM平台的产品级解决方案。同时我们也为客户提供完全定制化服务
评论
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 293浏览
  • 项目展示①正面、反面②左侧、右侧项目源码:https://mbb.eet-china.com/download/316656.html前言为什么想到要做这个小玩意呢,作为一个死宅,懒得看手机,但又想要抬头就能看见时间和天气信息,于是就做个这么个小东西,放在示波器上面正好(示波器外壳有个小槽,刚好可以卡住)功能主要有,获取国家气象局的天气信息,还有实时的温湿度,主控采用ESP32,所以后续还可以开放更多奇奇怪怪的功能,比如油价信息、股票信息之类的,反正能联网可操作性就大多了原理图、PCB、面板设计
    小恶魔owo 2025-01-25 22:09 615浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 465浏览
  • 不让汽车专美于前,近年来哈雷(Harley-Davidson)和本田(Honda)等大型重型机车大厂的旗下车款皆已陆续配备车载娱乐系统与语音助理,在路上也有越来越多的普通机车车主开始使用安全帽麦克风,在骑车时透过蓝牙连线执行语音搜寻地点导航、音乐播放控制或免持拨打接听电话等各种「机车语音助理」功能。客户背景与面临的挑战以本次分享的客户个案为例,该客户是一个跨国车用语音软件供货商,过往是与车厂合作开发前装车机为主,且有着多年的「汽车语音助理」产品经验。由于客户这次是首度跨足「机车语音助理」产品,因
    百佳泰测试实验室 2025-01-24 17:00 194浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 494浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 241浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 323浏览
  • 前篇文章中『服务器散热效能不佳有解吗?』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。AI服务器的散热架构三大重点:GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。
    百佳泰测试实验室 2025-01-24 16:58 189浏览
  • 随着AI大模型训练和推理对计算能力的需求呈指数级增长,AI数据中心的网络带宽需求大幅提升,推动了高速光模块的发展。光模块作为数据中心和高性能计算系统中的关键器件,主要用于提供高速和大容量的数据传输服务。 光模块提升带宽的方法有两种:1)提高每个通道的比特速率,如直接提升波特率,或者保持波特率不变,使用复杂的调制解调方式(如PAM4);2)增加通道数,如提升并行光纤数量,或采用波分复用(CWDM、LWDM)。按照传输模式,光模块可分为并行和波分两种类型,其中并行方案主要应用在中短距传输场景中成本
    hycsystembella 2025-01-25 17:24 473浏览
  • 书接上回:【2022年终总结】阳光总在风雨后,启航2023-面包板社区  https://mbb.eet-china.com/blog/468701-438244.html 总结2019,松山湖有个欧洲小镇-面包板社区  https://mbb.eet-china.com/blog/468701-413397.html        2025年该是总结下2024年的喜怒哀乐,有个好的开始,才能更好的面对2025年即将
    liweicheng 2025-01-24 23:18 350浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦