前年的ISSCC 2017大会上,意法半导体做过一个题为“针对智能嵌入式系统、采用28nm FD-SOI工艺的2.9TOPS/W深度卷积神经网络SoC”(A 2.9 TOPS/W Deep Convolutional Neural Network SoC in FD-SOI 28nm for Intelligent Embedded Systems)的演讲。演讲中的这颗SoC应用,当然如其名就是卷积神经网络(CNN),而宣传重点在高效的存储层级,适用于不同深度卷积神经网络拓扑的弹性,输入输出能力,还有与主流的深度学习工具做整合。
不过其真正的亮点在2.9TOPS/W,宣传词汇常规一套就是高能效、低功耗,毕竟这是用在嵌入式与IoT应用中的。应用于AlexNet网络的峰值效率在2.9TOPS/W。这个数字放到今年来看也依然是十分出色的,翻看今年国内外厂商最新推出的AI芯片,有大把不如这个成绩的产品。这颗芯片能够达到如此能效比的一个重要原因就是采用FD-SOI结构,具备超广DVFS调节能力,通过体偏置(body bias)来实现DVFS的效率提升,多偏置(poly-biasing)降低漏电流等。
上周的上海FD-SOI论坛上,Leti-CEA首席执行官Emmanuel Sabonnadiere再次提到了这颗神经加速器,“这是我们和意法半导体一起做的”。后续,Leti-CEA还和苏黎世大学一起做了Dyanps-SL,这是现在很流行的脉冲神经网络(spike-coding NN)芯片,其能效水平是每个突触事件(synaptic event)小于2pJ。
上面这两个例子都是FD-SOI在边缘AI方面的应用,当然我们很难断言这样的能效红利主要来自意法半导体的28 FDSOI。不过当我们将FD-SOI和FinFET两者做对比时,现在说得最多的就是功耗和能效(energy efficient或power efficient,本文将不会严格区分energy能耗与power功耗),也是我们在FD-SOI论坛上听到最多的。
但即便我们知道,像数据中心、IoT这些应用,随着登纳德缩放定律失效,开发者需要把越来越多的成本和注意力花在功耗方面,做对比时的能效和功耗数字,似乎依然很难引发共鸣。加上FinFET的主流地位,FD-SOI的能效优势好像并不被人重视:但能效优势实际产生的作用,远比我们想象得丰富和有趣。这里我们列举几个在FD-SOI论坛上听到的实例。
恩智浦副总裁兼总经理Ron Martino
低功耗带来的价值
“100pJ可以做什么?”恩智浦副总裁兼总经理Ron Martino说,“100pJ可以存储1000bit SRAM数据,100bit e-MRAM数据,5bit LPDDR4数据;而在计算上,DSP/GPU可以执行10-100次浮点乘法运算,MCU可以执行1-20次;对存储而言,100pJ可以传输0.1bit Zigbee数据,0.02bit BLE数据,0.004bit WiFi数据.,0.0002bit LTE数据......”
这是对能量的具象化。除了数十亿计采用MCU的IoT设备要求绝对的低功耗,以及数年的持续运转时间;更重要的是随着AI以及边缘计算的兴起,更多能耗正往某些边缘设备转移——在恩智浦的定义中,这些采用"crossover processor"的设备一方面要求出色性能,另一方面也要求低功耗,也就是能效比,比如智能手表、部分智能家居设备。所以像恩智浦之类的厂商在提供MCU或者应用处理器时,从过往单个计算/功耗域,到双计算、单功耗域,最终发展到出现独立的域进行电源管理。
Martino表示针对下一代应用,势必要采用偏置技术(biasing)来实现能效比的优化。上面这张图所列出的这些属于FD-SOI带来的机会,采用back gate biasing带来多种优化。“理解这些内容,能够带来出色的设计解决方案。”典型的像是恩智浦的i.MX RT1100 MCU,针对汽车和工业领域,实现CoreMark > 5000的同时,还用上了低功耗28 FD-SOI。
这类所谓crossover的MCU有不同的功耗域(heterogenous power domains),需要一个专门的电源管理系统——这是架构层面的,也能够表现“功耗”在这个时代的重要性。搭配FD-SOI也是理所应当的,在28nm这个层面,相较传统的体硅工艺,可以实现更高的性能但保持相同的能耗。
不过这个例子并不具有很强的代表性,我们来看一些在功耗层面,更依赖SOI的例子,比如5G毫米波:SOI在模拟与RF方面的优势是众所周知的,FD-SOI结构中沟道的介质隔离产生更低的栅电容,减少了泄漏电流;隔离还能产生latch-up抗扰,就可以使用更小、更简单的模拟电路。而且相比体硅技术,没有沟道掺杂和口袋型离子注入(channel doping and pocket implants),可提供更低的噪声和更高的增益——这是模拟系统中的一个关键。FD-SOI针对RF和模拟设计,可通过fT, fMax, gM调节来实现RF模块特性加强。
Soitec FD-SOI业务部门总经理Michael Reiha
Soitec FD-SOI业务部门总经理Michael Reiha在发言中提到了美国规划5G毫米波的一些特点,比如说超高的频率,占用带宽400MHz(瞬时带宽可以超过1GHz)、AP到终端的距离大约是500米,传输/接收SNR是24/28dB,EIPR(等效全向辐射功率)+54dBm等。
其特点在于毫米波是噪声限制系统,噪声数值与频率相对;毫米波采用宽带载波,要求较低程度的I/O失配(low I/Q mismatch required);毫米波BTS(基站收发台)下行链路EVM(误差向量幅度)低相位噪声;毫米波ACLR(Adjacent Channel Leakage Ratio,邻道泄露比)无DPD(数字预失真),以及低压电源;还有宽频带的数据转换、传感和校准。
上面这张图主要展示的是20-50GHz PA(功率放大器)不同材料、工艺在随Psat(饱和功率)增加时的峰值PAE(功率增加效率,是射频输出功率与消耗的直流功率之比)变化,Reiha认为能够改变这个PAE趋势快速下降的技术就是FD-SOI,“SOI还没有饱和,还有很大的成长空间”。为此他特别举了两个例子,分别是射频系统中的Transmitter和Synthesizer(合成器),都采用28nm FD-SOI时的设计方案——这两个例子都来自Ericsson Research去年的数据研究。其中就transimitter而言,FD-SOI针对各方面的效率,在设计上的要求会比较低(原话是FD-SOI requires less neutralization)。
而对synthesizer而言,FD-SOI能够实现无干扰的相位多路复用(glitch-free phase multiplexing),以FD-SOI制造的高速CML电路能够减少功耗,提升正交LO分辨率。Ericsson Research在JSSC 2018呈现的数据是,这个采用28nm FD-SOI的synthesizer,其相位噪声(Integrated Phase Noise,来自RMS Jitter值)满足传输链路SNR。
相关无线通讯的这些内容比较晦涩,不过在5G毫米波的问题上,按照Reiha所说,总结一下也就是5G毫米波(5G mmW Access)现有架构在功耗、性能方面是比较低效的。而FD-SOI在模拟和混合beamformer方面都已经做好了准备(Soitech针对模拟波束成形有RF-SOI方案);大规模MIMO RF前端模组(FEM,以及transceiver)都将全部采用FD-SOI;集成感应、校准、控制,能够实现混合beamformer和多用户的支持;自适应的体偏置(body-biasing)可以减少FEM混合信号电路的功耗。
Secure-IC的Securyzr
除了模拟和射频,会上我们还听到一个很有趣的例子,是来自芯片安全相关的——就我们的常识来判断,除了侧信道攻击,攻防对抗始终是软件栈层面的话题,和工艺会有什么关联?Secure-IC首席执行官Hassan Triqui提到了,Secure-IC有个产品叫Securyzr,可应用于AIoT和嵌入式安全。安全防护的一些常规手段,比如说针对处理器的加密服务(cryptographic)、密钥管理,以及安全固件更新的安全启动(secure boot):听起来好像跟FD-SOI还是没什么关系,不过Triqui认为,在这些防护环节里,FD-SOI制造都是关键,主要原因就是“低功耗”。
“FD-SOI是优化安全的完美技术。首先是FD-SOI较小的静态泄漏,针对secure boot时,低功耗确保了sleep mode休眠模式下的数据存储;其次是FD-SOI的体偏置,可以实现相对完美的加密方案(tunable cryptographic),在性能和功耗之间达成平衡:比如说汽车领域可实现低延迟、低功耗的高性能加密;最后,采用数字与物理参数的平衡,FD-SOI针对安全密钥生成(TRNG),还能实现高效的Entropy管理。”
说得通俗些,安全和功耗(以及性能)本身就是一对矛盾体,而FD-SOI能够缓解这种矛盾,尤其在对功耗越来越敏感的IoT领域。这其中有一个很有意思的提法,Triqui说,FD-SOI体偏置能够实现加密防护,比如说针对侧信道攻击,进行功耗控制,以避免侧信道分析造成的威胁。这种防护,我们猜测是建立在动态调节偏压的基础上——这原本是FD-SOI表现高效管理电源的一个特性,虽然未知实际效果如何,听起来的确是对FD-SOI技术低功耗特点的一种典型应用。
ST汽车市场及应用资深市场经理刘山林提到FD-SOI的另一个益处,对辐射具有超低敏感性,热中子软错误率(Neutron SER)相比体硅工艺的巨大优势
天然适配AIoT
针对FD-SOI带来的低功耗、高能效以及体偏置,上面我们分享了3个例子,加上文首引子部分的例子一共是四个。这里做个小结,它们主体上代表了FD-SOI格外适用的几个应用领域:(1)AIoT(Leti-CEA与恩智浦的例子),(2)射频与模拟(Soitec的例子),(3)芯片安全(Secure-IC的例子);其中最后一个可能是有待商榷的,而且这么分类可能在维度切分上不太科学。
圆桌环节“基于FD-SOI技术的智慧物联网”,从左到右依次是:芯原创始人、董事长兼总裁戴伟民,芯原物联网互联平台总监曾毅,Secure-IC首席执行官Hassan Triqui,Cadence副总裁、南京凯鼎电子总经理王琦,Greenwaves首席执行官Loic Lietar,长电科技首席执行官郑力,Dolphin中国区销售总监Ying Zhao
不过在FD-SOI圆桌的观众投票环节,有个问题是“你认为2020年,FD-SOI将实现量产的三大应用领域是什么?”备选答案包括了5G、汽车电子、图像传感器、NB-IoT与其他LPWAN、可穿戴设备、60GHz/45GHz(802.11aj)WiFi与其他毫米波设备、边缘机器学习。无关乎所有人的意见如何,这些选项实际总结一下也就是AIoT和射频模拟。
当然FD-SOI论坛分享的具体应用不止我们提到的这几个,比如还有索尼分享的GNSS解决方案(应用于智能手表、无人机、智能农场等场景),在包括eMRAM、GNSS Receiver在内的芯片上采用FD-SOI技术,实现超低功耗——这是相对典型的IoT应用场景,而且它也能表现FD-SOI对RF设计的友好(以及解决方案中的存储部分,搭配了三星28nm FD-SOI的STT-MRAM)。
不过实际上,索尼的这个IoT应用最能体现的,是FD-SOI另一个更偏向市场层面的优势:更低的成本,即便这个优势,在FinFET大规模生产成本得以摊薄后显得没有那么显著,不过结合前述FD-SOI的技术优势,在非最尖端工艺方面,FD-SOI仍然是个优选。
我们曾在过去的文章中不止一次地提到,半导体最新工艺的制造成本指数级攀升,这里的最新工艺至少现在还是在说7nm FinFET,要确保足够的芯片出货量才能盈利,几乎已经没有几个行业能够承担这样的成本攀升,手机、PC是其中为数不多的巨型市场。就市场现状来看,即便是相当一线的汽车制造商,就其年出货量实际也难以带动这样的规模。
索尼GNSS解决方案中eMRAM的良率情况
瑞芯微电子高级副总裁陈锋在论坛上说:“要有足够规模、足够量才能动得起来,7nm EUV FinFET的确好,但要是企业产品没有1个亿的量,自然不可能选择最新的工艺。”“AIoT市场是很热闹,但看这个市场现在的规模:Intel一家公司600亿美金的生意,IoT就50亿美金,属于others的市场。”这个市场当然还在攀升,但“IoT市场本身就是分化、碎片的,没有一颗芯片可以cover一大片市场的情况会发生。所以在IoT市场,做一颗芯片要达到一定规模,难度本身就更大了。”陈锋说。
另外,“芯片总是在PPA方面做均衡,FinFET晶体管的摩尔定律当然还在前进,但这条曲线已经开始放平,已经比较费力了。所以FD-SOI给了一个很好的选择。28/22nm FD-SOI是可以达到AIoT市场中深度学习的算力要求的。”另外,“FD-SOI的NRE(一次性工程)和die 费用都比较低。FD-SOI对AIoT非常适用。”这其实体现的主要是FD-SOI在成本方面的优势。
陈锋所说FD-SOI适用于AIoT的四个原因加起来(1)更低的成本,(2)功耗优势,(3)对RF和模拟设计更友好,(4)28/22nm工艺性能可以满足AIoT的算力要求。这些大概就是索尼在GNSS解决方案方面会选择FD-SOI的原因,尤其是其中的成本优势,可能会成为FD-SOI在接下来大热门的AIoT领域发光发热的主因。
健全中的FD-SOI生态
IBS首席执行官Handel Jones说:“FD-SOI为什么一直没有取得很大的成功?为何市场选择FD-SOI的周期这么久?主要是因为IP生态问题。但如今这个情况正在发生变化。”
每年FD-SOI论坛为我们重点呈现的,是这个生态的发展状况。从整个生态的角度来看,IP、制造和应用是三个大环节,前面我们在谈的主体上都是FD-SOI偏应用的部分。能够聊到这些应用场景,下层自然就有IP设计和制造的支持。
正如Jones所说,FD-SOI的生态正在发生变化。而改善这一现状起到牵头作用的自然就是属于FD-SOI生态的IP了。格芯在会上列举了其FDX生产线现有的“丰富模拟、Interface与RF IP组合”。
就中国国内部分,芯原(VeriSilicon)作为SOI技术的长期支持者,是生态中IP搭建的组成部分。“芯原是这个领域内比较少有的一家企业。芯原也让中国在SOI技术上取得了优势,这些优势是FinFET无法实现的。”Jones评价说。
芯原物联网互联平台总监曾毅分享了芯原的部分低功耗射频IP,这里我们列举低功耗蓝牙RF IP——顺带也能在这个特例中,发现如何让IoT的RF IP和FD-SOI本身的低功耗特性相辅相成。
芯原NB-IoT数字BB IP
芯原的BLE RF IP(低功耗蓝牙射频IP)除了包含相对齐全的transceiver+数字解调器、时钟/POR(电复位)/ADC等辅助模块、集成BALUN之外,还有针对大范围电源电压的专用PMU IP(电源管理单元);针对低功耗优化的核心电压低至0.8V,包含针对TX/RX的单独电源管理的节电模式,针对深度睡眠模式的专用LPLDO(应该是指Always-On Low Dropout)。
而22nm FDSOI本身的特点相较传统前代体硅技术,在芯片尺寸、功耗、性能方面就能获得长足提升。例如,在PLL(phase locked loop)中对大部分子模块,逻辑区域尺寸得到较大程度的缩减,数字逻辑电路电压下降以及针对干扰的鲁棒性;借由back gate biasing充分利用FDSOI22工艺优势来减少工作电压;提升数字PA的效率,缩减PA尺寸等。
当然除了BLE RF IP以外,曾毅还介绍了不少IP,比如说芯原的NB-IoT RF IP,其中包括有NB-IoT数字BB IP(body-biasing体偏置IP),ZSPNano子系统IP(这是来自芯原的一个节能通用MCU+DSP核心,用于进行各类IoT无线连接应用的信号处理和控制任务);基于格芯22FDX的GNSS RF IP等等。
就FD-SOI的IP搭建,Dolphin中国区销售总监Ying Zhao表示:“22nm FD-SOI节点,正有越来越多的IP加入进来,我们Dolphin也在努力促成体偏置IP的发展——从生态系统的角度,FD-SOI很有潜力。但只有一两个IP是不能实现价值的,我们还需要更多有价值的IP,进一步丰富IP组合,将其集成在一起。”
格芯高级副总裁Americo Lemos
而在FD-SOI的制造部分,电子技术设计(EDN)的分析师在会上获悉FD-SOI的“5倍产能爬坡”——这一环实际也能够表现包括IP在内的生态持续完善。先前格芯和Soitec就已经联合宣布达成多个长期SOI晶圆供应协议,以满足5G、IoT和数据中心市场的加速发展,包括了FD-SOI、RF-SOI和硅光(silicon photonics)。格芯预计到今年年底,22FDX芯片出货量可以达到1亿颗。
三星电子高级副总裁Gitae Jeong给出的数字显示,2019年28FDS工艺达到较高产量,这一年规划中的产品超过20种,D0级别的生产达到完全饱和状态(这里的D0应该是指有比较出色的良率水平)。今年已经出货了首个28FDS eMRAM产品,先前也实现了5G毫米波射频的产品验证。FD-SOI+RF+eMRAM,提供了相对完整的IoT工艺平台。
而三星已经开始规划下一阶段的18FDS——可以获得极大程度的进一步节能(性能相比28FDS攀升17%,同性能水平下的能耗下降55%,芯片面积下降25%),而且BEOL后端工艺的改进,也能产生更好的成本效益。Gitae Jeong特别提到,对IoT的低漏电支持会格外有帮助。
FD-SOI的生态正在一步步完善。最后值得一提的是,Americo Lemos给出的数据显示,格芯22FDX给中国企业的流片数量占比超过50%,所以Lemos始终在强调中国市场对FD-SOI生态的重要性。不难想见,索尼在论坛上提到,自家的FD-SOI产品(GNSS解决方案)是2016年率先开启于中国市场的。
一方面FD-SOI是中国半导体制造的一个机遇,另一方面中国也是FD-SOI可得以前行的重要市场——尤其Handel Jones大量列举的中国电子设备企业消费全球将近一半的半导体市场,AI、边缘计算、IoT、5G、电动汽车等因素还在推动中国半导体消费全球占比的进一步攀升。“中国是FD-SOI最重要的市场”,“FD-SOI也是中国最关键技术之一”。
责编:Yvonne Geng