电源管理需要新方法

TechSugar 2024-06-25 08:01

(本文编译自Semiconductor Engineering)


随着处理的数据量不断增长,功耗正成为一个更大的问题,这迫使芯片制造商和系统公司需要重新考虑从端点到数据中心的计算架构。


这个问题没有简单的解决办法。越来越多的数据被收集、移动和处理,每一步都需要更多的电力,并且需要更多地关注物理效应,例如热量、加速老化和信号干扰等。晶体管密度越大,利用率越高,控制这些影响所需的努力就越大,需要的权衡也就越多。这在AI/ML应用中尤其明显,这些应用的主要关注度是性能和最大程度地利用具有极快数据吞吐量的处理单元。


除此之外,还有其他与功耗相关的问题在不断累积,这些问题自至少40nm工艺节点以来一直存在,从这一节点开始即使是在“关闭”状态下,栅极也开始漏电。在16/14nm时,通过在晶体管栅极上添加鳍片来控制静态漏电,这一问题得到了短暂解决,并且效果非常显著,直到大约7nm时,电流漏电开始重新出现。这导致了环绕栅极FET(GAA FET)的出现,其正在从3nm开始实施,并计划在埃范围内的某个地方实现互补FET。而所有这些问题都因每个新节点的动态密度增加而加剧,这导致在逐渐缩小的区域内产生更多的热量,并迫使芯片制造商将其关键指标从处理器频率转移到每瓦性能。


“现在必须在小空间内引入和消耗更多的功率,这可能会发生各种有趣的事情,”Rambus杰出发明家Steven Woo表示,“随着时间的推移,散发的热量会对芯片产生影响,这可能需要担心热循环。当芯片做大量工作时,芯片的一部分会停止工作,然后继续执行更多工作。这些快速循环——先耗散大量功率,然后又不耗散——会导致局部加热、冷却和热应力,所有芯片都会经历这些。有时还会担心封装上的焊球会随着时间的推移而开裂,或者PCB发生翘曲,以及其他机械应力。可以想象,当有一个非常大的芯片时,芯片边缘的膨胀会比小芯片更大。这也会增加压力。这意味着必须非常小心地对这些部件进行冷却。内存也不例外。对于内存来说,需要担心一些非常具体的事情,比如保留数据的能力取决于芯片的温度。”


这就是为什么许多最先进的芯片设计都配有大型散热器,并且越来越多地采用某种类型的液体冷却。这也解释了为什么一些最先进的设计将处理推向边缘,在传感器和/或内存中,以限制需要移动的数据量。这本质上是纳米级的先进负载平衡。它更加高效,尤其适用于由电池供电的边缘设备。


Alphawave Semi首席技术 Tony Chan Carusone表示:“在边缘设备中,降低成本和降低功耗非常重要。在这些领域中,定制芯片变得更加重要。计算机视觉的下一步发展方向之一就是开发有助于降低功耗和成本的边缘AI芯片解决方案。”


这当然有帮助,但仍然不能解决所有问题。例如,对于图像传感器,可能需要处理大量以流视频或图像形式呈现的数据。但这些传感器对温度非常敏感——与其说是器件特性,不如说是极性。


Ansys半导体部门产品营销总监Marc Swinnen解释说:“如果你想要一个图像传感器,你就得有一个大芯片,而且你希望以非常高的分辨率忠实地呈现图像。你不能让图像传感器因为温度而弯曲和变形。即使图像传感器轻微弯曲也会导致图像失真。问题是,大多数配置都是将图像传感器堆叠在电子芯片上,以便立即处理图像。但这些电子设备会变热,如果你一不小心,就会导致图像传感器变形。你需要进行非常精确和灵敏的热分析,以确保图像传感器保持平坦,不会因为热机械应力而变形或弯曲。”


图 1:显卡热模拟

来源:Ansys


多芯粒(chiplet)问题


如果再加上异质性,尤其是芯粒,情况就会变得更加复杂。


Cadence产品管理总监Dan Lee表示:“尤其在谈论异构集成时,无法获得简单如单片设计中的热导率。这需要更多的思考和规划,因为老化和加热是相关的,热量会影响芯片的老化。在其他条件相同的情况下,如果在非常热的环境中进行操作,芯片寿命就会缩短。”


所有这些因素都给设计师带来了挑战,因为有时必须平衡相互冲突的要求。例如,对于汽车芯片而言,热量可能来自芯片或封装的内部或外部。


Ansys首席产品经理Suhail Saif表示:“对于我们的汽车客户来说,功耗优化非常重要,因为环境温度范围差异很大。由于安全等级,他们必须针对最坏情况进行设计分析,这可能与正常情况大不相同。他们设计的范围非常大,因此必须在功耗和性能方面做出很多妥协。他们在每个阶段都部署了功耗优化。例如,他们加入了额外的逻辑。即使需要更多的电池电量,也没关系。在汽车中,您可以轻松供电,因此他们在这方面做出了妥协,但随后他们在芯片中内置了比其他地方更多的电源控制器,以便以后管理电源。每个阶段都会做出此类设计妥协,以确保功耗得到控制,并且始终满足功耗限制。”


更多数据,更多类型的芯片


除了使用现有器件精心平衡设计外,业界还在探索采用新型芯片。这在图像传感器领域尤其明显,图像传感器是数据增加的来源之一。例如,在汽车中,来自道路的流式图像迫使汽车工程师考虑各种替代方案,从整体系统架构到新型芯片。特别是在电动汽车中,计算效率被认为是最大限度延长行驶里程的关键,而热量在很大程度上是浪费的能源。


随着基于事件的视觉传感器(EVS)(也称为神经形态传感器)的推出,这一点显而易见。据Yole Research预测,到2034年,该市场规模将达到29亿美元。EVS基于“硅视网膜”的神经形态理念,为视觉传感提供了一种低功耗解决方案。它们可以处理许多与传统计算机视觉传感器相同的功能,但从根本上重新思考了基于大脑处理视觉的方式(而不是数字芯片的便利方式)的操作方法。


神经形态传感器广泛应用的最大障碍是不确定它们何时会摆脱小众地位,而不是学术理念是否能够扩大规模。大多数神经形态传感器使用一种较新的神经网络,称为脉冲神经网络(SNN),这与当前使用卷积或变压器神经网络的计算机视觉设备不同。


Quadric首席营销官Steve Roddy表示:“利用神经形态技术发表的研究成果或可用于生产的神经网络非常少。对于传统的神经网络模型,有成千上万种物体检测器、场景分割器、物体分类器、姿势检测器和更多经过验证的有效神经网络。甚至还有记分牌跟踪数百种按准确度、参数大小和计算强度排序的变体。因此,如果选择传统的图像传感器和传统的NPU或GPNPU在传感器输出上运行ML推理,那么在构建成功的产品时,有很多解决方案可供选择。”


相比之下,在神经形态计算领域,有十几个甚至更多的研究工具集可用于探索SNN。但Roddy表示,有用的模型库很少,甚至没有。他表示:“人们发现最突出的是一堆工具,它们可以将传统的神经网络转换成神经形态形式,以便进一步研究和改进。如果你是一名研究人员,这很好,但如果你想制造产品,那就不好了。”


尽管如此,研究机构和初创企业对神经形态传感器的兴趣仍然很浓厚,因为它具有低功耗优势,而这种优势是基于对图像处理的重新思考。传统CMOS视觉处理的根源可以追溯到19世纪末迈布里奇对运动中的马的研究。他的工作引入了将连续运动解析为以特定速率拍摄的离散静止“帧”的想法。这一原理仍然是最常见的计算机视觉方法的基础,这意味着视觉传感器会记录场景中的所有内容,而不会选择显著性。


这种冗余方法也会影响能耗。Christian Brändli,现任索尼高级视觉传感公司首席执行官,该公司正在开发一种神经形态传感器,他在博士论文中总结了这种对比:“虽然这种在空间和时间上均匀采样场景的方式允许采用统一且易于开发的处理程序,但效率低下。只要时间和能源不是应用程序的关键,这并不重要……但在与现实世界交互的系统中,延迟会成为一个问题,如果系统仅靠电池供电,功耗也会成为一个关键方面。”


为了解决这个问题,神经形态视觉系统从视神经处理信息的方式中汲取灵感,即通过亮度变化确定显著性,从而丢弃重复输入。有一个较为熟悉的比较(理论上,而不是执行上)是JPEG图像压缩,其中通过压缩冗余数据(例如,每一帧都不会变化的蓝天)来减小图像文件的大小。


虽然JPEG图像处理是在图像采集之后进行的,并且通常会导致一些信息丢失,但Prophesee首席执行管Luca Verre表示,神经形态传感器更像是一个“在沉积层面上的高级冗余抑制设备”。Prophesee有一个使用SNN的研究传感器,以及一个不使用SNN的商业EVS传感器。“就像生物视网膜一样,我们的传感器不是在固定的时间点捕获图像。相比之下,常规传感器会捕获一系列帧。这种采集原理的问题在于,最终会捕获大量冗余信息,因为场景的一部分通常完全是静态的,因此会不断获取具有大量冗余的图像。而生物视网膜,尤其是人眼中的视网膜,并不是以固定的帧速率捕获图像并将图像发送到大脑,而是只捕获随时间连续变化的内容。”他补充道。


像素会捕捉光线对比度的变化,但不提供强度值。Luca Verre表示:“它不提供灰度或颜色信息。它只告诉你光线是否增加了或减少了一定的相对量。这通常与场景中的一些动态或场景中的一些运动有关。当没有任何事情发生时,我们的传感器将完全保持静音,同时仍然获取场景中的光线。但只要光线不超过某个相对灵敏度阈值,它就不会发送任何信息。这使该传感器的功耗非常低。一旦场景发生变化,传感器就会被唤醒,然后以极高的速度处理这种变化,因为我们能够以微秒的时间精度捕捉这些变化。”


在神经形态工程和神经生物学中,信息范围的缩小被称为“稀疏性”。在神经形态工程中,稀疏设计模拟生物神经元选择显著性的方式,通过一系列神经元“脉冲”(放电)减少从视网膜传递到大脑中高阶神经元的信息量。这些原理导致了脉冲神经网络的发展,脉冲神经网络是大多数基于事件的传感器的基础,而不是基于帧的传感器的基础——较旧的卷积神经网络。


正如imec所描述的那样,“SNN模仿生物神经元群的运作方式——随着时间的推移稀疏地发射电脉冲,而对于生物感觉神经元来说,仅当感觉输入发生变化时才会发射电脉冲。”


从长远来看,这是工程师降低功耗和发热量的又一个工具,并有可能减少处理更多数据所需的计算元素数量。而且这些数据可以在本地处理,从而进一步降低整体功耗预算。


Prophessee已经在市场上推出了基于SNN的研究项目和非SNN传感器。与此同时,imec正在研究基于事件的神经形态启发处理架构,用于处理和融合各种传感器,如摄像头、雷达、激光雷达等,同时努力确保它们能够与当前的半导体工艺技术和符合行业要求的设计方法配合使用。


imec无线传感和边缘AI项目总监Christian Bachmann表示:“我们受到大脑和生物神经元的启发,但我们也希望制造出适合客户在半导体芯片中使用的实用设备。我们所谓的数字神经形态模仿神经形态设计,但使用标准芯片设计工具和技术来实现。我们在基于事件的神经网络方面的工作利用了时间稀疏性,也利用了输入数据或神经网络权重的稀疏性。我们在算法方面和硬件方面都利用了这些特性,在芯片上的电路和架构实现中,使我们的工业合作伙伴能够轻松使用神经形态设计。我们的设计并非基于特殊材料或技术,这些材料或技术距离实际制造还需要几十年的时间。而我们的技术今天就可以使用。”


虽然它不是对生物神经元的完美模仿,但却是一种启发,但最重要的是利用基于事件的处理,Bachmann表示,“与大脑类似,只有在发生某些事情时,你才会处理神经网络的部分。例如,稀疏性意味着数据或神经网络权重中存在不需要计算的间隙。”


这种稀疏方法应该可以带来低功耗优势。Imec声称其SNN原型比传统芯片的功耗降低了100倍,延迟减少了10倍。


结语


从初始发电、移动数据所需的电量、处理量增加所产生的热量以及这些热量对电路老化和整体性能的影响等方面来看,电力成本高昂。然而,解决这些问题不仅仅需要一个巨大的散热器,它还需要重新考虑芯片设计的各个方面,包括处理发生的位置以及实际处理的内容。


芯片市场的发展可能会因应用和工作负载的不同而有很大差异。但整个芯片行业都致力于解决这些问题以及新的问题,这几乎肯定会在未来十年内导致低功耗、高性能设计发生一些根本性变化。


END

TechSugar 做你身边值得信赖的科技新媒体
评论
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 100浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 186浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 390浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 41浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 122浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 182浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 52浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 150浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 112浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦