(本文翻译自Semiconductor Engineering)
随着芯片设计变得越来越复杂,并开始采用异构集成结构,以及芯片制造商存储和使用越来越多数据进行其他设计,数据泄漏变得越来越难以阻止甚至追踪。
与网络攻击通常是出于特定目的(如收集私人信息或要求系统赎金)不同,数据泄露可能在任何地方爆发。而且随着数据价值的增加,它们本身的价格也可能同步上升。但数据泄露更难被确定和阻止,因为造成数据泄露的原因多种多样,又不可预测,且往往是无意的。这些原因包括:
制造缺陷和电路老化——电迁移、时间相关介电击穿和热相关损伤等——这些都可以在不实际侵入芯片的情况下提供侧沟道攻击等开口。它们还可以让攻击者更容易地获取重要数据。
为设计芯片建立的知识库本身只为内部学习,但也使跟踪专有第三方IP变得更加困难。
从设计到制造,各个层面的人才持续短缺,这通常意味着在一家公司培养的熟练技能和竞争力会随着该员工服务其它新公司。
物理原因
从硬件角度来看,泄漏可能是芯片或封装复杂性造成的,也可能是由于设计或制造中的缺陷而造成的。这可以让其他人在不接触芯片的情况下就能提取数据。
“也许这甚至不是一个缺陷,而是一个可以以非常巧妙的方式利用的弱点,”MITRE Engenuity首席技术专家和半导体联盟执行董事Raj Jammy表示,“当集成多个芯片时,漏洞就会增加。所以必须以不同的方式来考虑这个问题。这不仅仅局限于芯片级的安全性。还必须担心,当把所有东西都放置在一个衬底上时,封装层会发生什么。有时人们称之为泄漏,但这可能是弱点之一,可以感知给定芯片的时间设置。一旦知道了时间,并开始读出传输的内容,那么就可以预测通过数据链的比特是什么。这可能就是泄漏,是非侵入性的,和拦截类似。在其他部分,可能会由于老化而出现弱连接,甚至可能导致无法正确操作芯片。更大的风险是,可能会向封装中的相邻芯片或小芯片(chiplet)发送虚假信号。”
异构设计加剧了这一问题,不同的芯片、小芯片或材料具有不同的预期寿命。与过去不同,当时所有芯片都是在同一个流程节点上开发的,并由一家公司集成到处理器或SoC中,现在这些芯片是从全球供应链中分解和获取的。各种工艺元件、存储器和其他零部件是使用不同的制造工艺开发的,有时是由不同的代工厂制造。这使得将这些零部件融合在一起时变得更加困难,且可能会产生弱点,这些弱点可以在不接触设备的情况下被利用。通常情况下,这并不能访问所有的数据,但可能也不需要访问所有数据。根据泄漏的数据以及从哪里泄漏的数据,这些数据也可能非常有价值。
英飞凌互联安全系统部门的杰出工程师Peter Laackmann表示:“如果你有一块基于小芯片,或者多芯片封装的产品,那么所有这些芯片都必须协同工作,才能保证必要的安全性。例如,曾发生过对内部有安全芯片的攻击,该安全芯片经过认证,并性能良好,它与标准微控制器封装在一起。问题是标准微控制器完全控制着安全芯片。在微控制器受到几次攻击后,密钥被获取。这意味着安全控制器无法保护整个系统系统。这同样适用于各种小芯片和多芯片封装。”
Laackmann表示,对于安全芯片/小芯片来说,这可能不是一个问题,因为这些芯片通常不会像处理元器件那样受到攻击。但对于其他元件来说,老化可能会导致电路表现异常,这种变化可以用来收集重要数据。“有些芯片有引脚,用于提供内部核心电压。如果能够访问它们,就可以访问内部核心电压,内部核心电压通常用外部电容进行平滑。如果这些电容器件被破坏了,就可以创建一个好的侧通道分析仪。而这是无法预料的。此外,也可以在芯片的内部核心电压上添加一些故障或尖峰电压,造成一些误操作,以跳过指令或密码输入等操作。”
小芯片也有其自身问题。Intrinsic-ID首席执行官Pim Tuyls表示:“小芯片未来处理数据时,所有计算都必须能防止侧通道攻击,并防止故障注入等。最重要的是,目前必须确保所有不同小芯片之间的通信通道也是安全的。这本身就是一个挑战。”
AI/ML和IP复用
当大量数据从系统中流出时,通常会引起注意。然后安装安全补丁,或大规模更换芯片/封装/系统。Rambus安全IP业务副总裁兼总经理Neeraj Paliwal表示:“如果有800 Gbps的以太网流量,那么就可以有大量数据通过。通常这么多的未加密数据通过的用例不多,而且数据传输速度还那么快。”
相比之下,数据泄露往往更隐秘,更难发现,在许多情况下,数据泄露都是无意的。但是,通过AI/ML进行系统优化后,几乎还是不可能追踪,更不用说建立法律保护了。
Quadric首席营销官Steve Roddy表示:“在我们的业务中,从制造到标准单元再到更高级别的构建块,一层又一层的技术相互堆叠。再用这些技术来构建其他IP。你可以从之前的设计中发现有效模式,然后将其应用到下一个设计中。你从RTL结构中总结经验,然后表示‘有了这种结构,我应该以某种方式放置它。’你实际上并没有复制任何东西。但因为你的输入是其他人的RTL,你将其与其他类似的产品进行比较。而这是基于别人的IP。掩模组也是基于别人的IP。有了AI,你会使用客户的设计数据来准备培训集吗?如果是,谁是该客户数据的拥有者呢?”
在设计过程中跟踪IP是另一个挑战。Cliosoft营销副总裁Simon Rance表示:“通过强化学习,将IP转化为项目IP。然后,你可以针对新版本和下一版本的小芯片或其他IP对其进行优化,并获取所有实时数据。IP由一家公司提供,而实时数据来自现场,你应该根据谁拥有哪些IP来划分。它可能来自全球不同地区,因此IP的一部分归他们所有,一部分归客户所有。所以必须要检查元数据,以找出该IP项目中的参与者。而多数时候是无法找到明确答案的,也没有标准。要真正解决这个问题,则需要对谁见过这个IP进行全面追踪,但这是很难执行的。”
这使得公司必须比过去更加努力地保护自己的IP。Expedera营销副总裁Paul Karazuba表示:“我们提供了很多关于我们公司所做事情的细节,比我以往工作过的公司都多,但我们仍然保留了一部分,而且这一点将持续下去,因为我们的所作所为与其他人大为不同。我们尽可能多的申请专利以保护自己。我们仍然不想透露我们公司涉及的一些国家机密。”
目前行业合作越来越多,使得对IP的保护更难,而生成式AI的日益普及使这一问题变得更复杂。Arteris IP营销副总裁Frank Schirrmeister表示:“你所处理的都是最佳的知识数据,到目前为止,这些知识是不断增加的,因为你不想把一切都分享给客户。人工智能是一种推动优化的解决方案,如果有一个大客户,他们会想有自己的一套解决方案。但有了生成式AI,你在处理非常具体的市场需求时,他们可以生成大量数据供自己使用。这增加了各种新的版权和IP问题。”
人为因素
自半导体问世以来,芯片公司的数据一直在泄露。当人们换工作或换公司时,他们会带来他们在前一份工作中学到的知识。在全球范围内,人才流失率正在增加,其影响可以从知识产权侵权诉讼中看出。根据LexMachina的数据显示,2012年至2021年间,美国的专利诉讼申请案略多于4.6万件,即平均每年4600件。相比之下,根据《The Law Reviews》的数据,2021年,中国有近3.2万件专利侵权诉讼,高于2010年的约5800件。
美国与中国和俄罗斯之间正在进行的诉讼争议大多涉及知识产权或专利侵权。美国贸易代表办公室2022年发布的一份报告列举了在商业秘密保护和执法方面存在的差异,尤其是和中国与俄罗斯之间。该报告称:“非法侵占可能发生在各种情况下,包括离职员工携带含有商业秘密的便携式存储设备、合资企业倒闭、网络入侵和黑客攻击,以及商业秘密所有者为履行监管义务而滥用向政府实体提交信息等。”
根据正开发设备的复杂性,员工的访问权限往往有限,而且设备的研发改进速度也很快,这通常也属于数据泄露的范畴。但泄露的数量和泄露数据的价值已经上升到各国政府寻求协议或实施制裁的地步。对于芯片行业来说,产业链过去仅限于一家公司或有限的供应商,现在正被分解为遍布全球的许多不同部分。
尽管如此,对人才的需求非常多,对拥有工作经验的工程师的需求也很多。据行业消息人士透露,企业目前面临的挑战是为工程师创建架构,以便将项目分解给不同团队,各团队都无法看到项目的全貌,一些公司已经与来自不同国家的设计团队进行合作。尽管这可能很难管理,但也能限制泄露数据的价值。
展望未来
展望未来,芯片制造商和IP开发商将不得不更加努力地对员工进行分而治之的策略,并尽可能保持警惕,监控数据流。
“在安全方面没有什么是万无一失的,”Rambus的Paliwal表示,“你购买安全性是为了让它变得更难突破,而不是变得万无一失。可度量的安全性变得非常重要。这就是为什么在行业中可以看到西门子收购了UltraSoC,proteanTecs和Synopsys也都大力投入其中。现在,已经开始在IP中设置有助于可度量的结构。硬件上需要安装非常智能的传感器,这样可以知道何时发生了变化,或何处有潜在数据泄露的情况,这些地方大多存储着机密数据。”
更困难的部分是跟踪数据,因为这些数据需要在芯片公司内移动,这些数据被用来生成其他设计,而这些设计则可能无法确定IP的来源。这对机器学习和生成式人工智能来说尤其具有挑战性,机器学习可以存储优化的数据以供未来使用,而生成式人工智能是科技界刚刚开始面对的问题。最终,行为标准和法律将被制定,但数据将继续在保护水平差异很大的国际间不受限制地移动。
数据泄露无法完全防止,但可以加以限制,并进行更好管理。尽管如此,这仍需要整个行业的共同努力,目前尚不清楚谁将主导这一方面,也不清楚何时会发生。
END