据悉,Trail of Bits研究人员只用了不到10行代码,就通过创建的攻击程序,在几秒内对GPU内存进行LeftoverLocals攻击,来收集大语言模型提供的大部分响应。该公司的研究人员证明,该漏洞可以用于窃听——跨容器或进程边界——基于提示的聊天会话。

2023年,生成式AI爆火,让GPU市场一时风光无两。然而,在AI持续爆火的同时,GPU存在的安全风险竟相伴相生。近日,来自美国纽约安全顾问公司Trail of Bits的研究人员发现了一种从同一服务器上托管的GPU读取另一GPU内存值的方式,即这个漏洞有可能从GPU内存中窃取“关键数据”。

如今,越来越多的企业开始在其服务和产品中结合大语言模型的AI,而信息和数据安全是其不得不关注的问题。据悉,英伟达、苹果、AMD和高通等多个型号的消费性GPU受到影响。研究人员还警告称,如果不对GPU内存隐私进行重大改革,这些转换可能会为攻击者创造肥沃的土壤,让他们在一次攻击中轻松从众多目标中获取大量数据。

GPU漏洞日益紧迫

实际上,关键问题就出在GPU架构设计上。多年来,GPU设计的第一要务是优化图形处理能力,并没有把数据隐私放在更优先的位置。而生成式AI等AI应用的日益普及,促使GPU得到更广泛的应用,也使得解决GPU漏洞问题越来越紧迫。

该漏洞被命名为“LeftoverLocals”,这个漏洞不只是针对消费者应用程序,而是通过侵入大语言模型(LLM)和机器学习(ML)模型中使用的GPU来完成任务。由于模型训练涉及敏感数据使用,因此提取数据更危险。

据悉,Trail of Bits研究人员只用了不到10行代码,就通过创建的攻击程序,在几秒内对GPU内存进行LeftoverLocals攻击,来收集大语言模型提供的大部分响应。该公司的研究人员证明,该漏洞可以用于窃听——跨容器或进程边界——基于提示的聊天会话。

该漏洞(CVE-2023-4969)据传适用于苹果、高通、AMD和Imagination的GPU。其中,在AMD Radeon RX 7900 XT上运行70亿参数量模型时,LeftoverLocals漏洞在GPU每一次调用数据时可能会泄漏约5.5MB数据,在llama.cpp上运行7B模型时,每次LLM查询总共会泄漏约181MB数据。

Trail of Bits的研究人员Heidy Khlaaf和Tyler Sorensen透露,早在2023年9月他们就发现了该漏洞。他们同时指出,这比“以高精度重构 LLM 响应”所需的要多得多。也就是说,这些信息足以高精度地重建大语言模型响应。

LeftoverLocals相当依赖GPU如何隔离其内存,而这与CPU框架不同,因此通过可编程接口获得对GPU共享访问权限的攻击者可以窃取GPU内的内存数据,这将带来多种安全后果。对于普通消费者来说,LeftoverLocals可能不值得担心,但对于云端运算或推理等产业的相关人员来说,会使LLM和ML框架的安全性存在疑虑。

在现代电脑和服务器中,多个用户可以共享相同的处理资源,无需访问彼此的数据。但漏洞LeftoverLocals的袭击打破了这些墙。黑客在目标设备上构建一定数量的操作系统访问权限后,即可利用该漏洞,从易受攻击的GPU的本地内存中泄露他们不应该访问的数据,暴露任何碰巧在那里的数据。

多家科技巨头受影响

2023年夏天,Trail of Bits的研究人员就测试了来自7家GPU制造商的11款芯片和多个相应的编程框架,发现苹果、AMD和高通的GPU均存在LeleftoverLocals漏洞,并联合启动了对该漏洞的协调披露。而苹果、高通和AMD都证实了它们受到影响。

此前,有人曝光了这个问题,但苹果一直没有公开回应。直到2024年1月13日才给予回复。经重新测试,一些设备的漏洞似乎已被修补,如第三代iPad Air(A12),但该问题仍存在于苹果MacBook Air(M2)上。新发布的苹果iPhone 15似乎没像以前版本那样受影响,苹果已确认A17和M3芯片包含修复程序,但尚未收到在其设备上部署特定补丁的通知。

然而,这并不是苹果第一次面临此类问题,此前M1芯片也被曝出存在安全漏洞。由此可见,苹果需要加强其产品的安全性,以确保用户的数据安全。

而AMD也受到该漏洞的影响,在继续调查潜在的缓解计划。AMD已经就此漏洞问题发表一份安全公告声明,详细列出受影响的产品清单,并说明其为LeftoverLocals提供修复的计划。

尽管高通固件v2.07有一个补丁,可以针对某些设备的LeleftoverLocals,但目前可能还有其他设备受到影响。

据了解,研究人员未发现英伟达、英特尔或Arm GPU包含LeftoverLocals漏洞的证据,也没在他们测试的Imagination GPU中发现相关漏洞。但谷歌已确认一些来自该公司的GPU确实受到影响。Imagination在其最新DDK版本23.3中发布了一个修复程序,于2023年12月提供给客户。

至于作为GPU市场领导者的英伟达确认其设备目前没有受到影响,有人分析,一个可能的原因是研究人员之前在英伟达GPU上探索过各种内存漏洞,是他们早先意识到这类问题。

目前,卡内基梅隆大学(Carnegie Mellon University)的专家正在对LeftoverLocals进行跟踪,据称该信息已经被受其影响的主要GPU供应商共享,其中包括英伟达、苹果、AMD、Arm、英特尔、高通和Imagination等。

值得一提的是,此漏洞不适用于浏览器GPU框架,例如Google的WebGPU,因为它们会向GPU内核插入动态内存检查。

如何解决漏洞问题?

尽管这种安全漏洞仍然存在于许多流行的消费类设备上,如iPhone和Android手机,但到目前为止,还没有关于漏洞利用的消息。而AMD本身仅将风险评估为具有中等威胁级别。

尽管如此,LeftoverLocals指出了保护LLM及其支持MLops的新兴做法。Trail of Bits也指出,“该漏洞凸显了ML开发栈的许多部分存在未知的安全风险,并且没有经过安全专家的严格审查。”

同时,值得关注的是,未来,随着GPU虚拟化在公共云基础设施中变得越来越普遍,以及越来越多的AI应用程序从本地实施转向在共享云环境中运行,GPU内存安全问题和漏洞将变得更加严重。

对此,Trail of Bits研究人员警告说,让这些各种修复方法激增并不容易。即便GPU制造商发布可用的补丁,将其芯片整合到PC和其他设备的制造商也必须打包并将保护传递给最终用户。而全球科技生态系统有如此多的参与者,很难协调各方。

Trail of Bits研究人员认为,社区必须尽力加强GPU系统堆栈和相应的规格,严格测试这些规格,满足不同应用领域的安全要求,并对各种新式AI芯片进行严格的安全分析。

此外,鉴于GPU的多样性及其在实现AI应用方面的关键作用,研究人员认为,相关设备及其生态系统需要做到以下几点:一是创建一个详细的威胁模型,考虑到GPU上处理的各类数据以及这些数据可能如何被破坏;二是探索GPU执行堆栈,以确定应在何处以及如何指定和实现GPU安全属性;三是进行重要的测试和审计,以加强GPU生态系统。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
点击蓝字 关注我们安森美(onsemi)在2024年先后推出两款超强功率半导体模块新贵,IGBT模块系列——SPM31 IPM,QDual 3。值得注意的是,背后都提到采用了最新的FS7技术,主要性能
今日,长飞先进武汉基地建设再次迎来新进展——项目首批设备搬入仪式于光谷科学岛成功举办,长飞先进总裁陈重国及公司主要领导、嘉宾共同出席见证。对于半导体行业而言,厂房建设一般主要分为四个阶段:设备选型、设
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A