分析丨存储巨头正推进SOCAMM模块,距离爆火还差一把火?

原创 AI芯天下 2025-03-28 20:31

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
AI技术的发展正引领着计算领域的范式变革,而内存技术则成为这一变革的关键所在。

HBM与LPDDR内存解决方案,对于释放GPU的计算潜能起到了至关重要的作用。



作者 | 方文三
图片来源 |  网 络 


SOCAMM解决现阶段痛点,与HBM互补存在


AI领域,尤其是在训练和推理大型模型时,内存扮演着至关重要的角色。


训练过程中,数据需要在计算芯片与内存之间频繁传输,而当前大型AI模型的参数规模已达到数百亿甚至数万亿级别,这导致了对大量内存的需求。


例如,DeepSeek R1(671B版本)的全量模型文件大小达到720GB,需要超过512GB的DDR4内存支持。


随着内存需求的不断增长,如何在有限的设备体积和成本内容纳更高容量的内存,已成为一个挑战。


同时,服务器的内存消耗占据了相当大的功耗比例。


在配备每插槽TB级DDR5内存的服务器中,DRAM的功耗甚至超过了CPU。


为了应对这一挑战,英伟达设计了基于LPDDR5X内存的Grace CPU,其功耗低于DDR5,同时通过借鉴AMD和英特尔数据中心级处理器的宽内存总线设计,实现了高内存带宽。


但迄今为止,LPDDR DRAM主要采用[板载(On-Board)]方式,直接焊接在设备主板上,而非模块化设计。


而板载方式的缺点在于一是成本高昂,更换时必须整块主板一起更换。二是缺乏灵活性,不支持升级,更换难度大。


然而,对于基于GB200 Grace Blackwell的系统,英伟达不得不采用焊接式的LPDDR5X内存封装,因为缺乏能够满足其容量需求的标准LPDDR5X内存模块。


据韩国媒体SEDaily报道,英伟达与存储器制造商SK海力士、美光和三星合作,共同打造了一种体积小但效能高的新存储器标准,名为[SOCAMM]。


SOCAMM,全称为Small Outline Compression Attached Memory Module,即小型化压缩附加内存模组。


目前的SOCAMM模组基于LPDDR5X DRAM芯片。与先前的LPCAMM2模组相似,SOCAMM同样采用单面四芯片焊盘、三固定螺丝孔的设计。


然而,与LPCAMM2不同的是,SOCAMM的顶部没有凸出的梯形结构,这降低了其整体高度,使其更适合服务器安装环境和液体冷却系统。


SOCAMM是一种由低功耗DRAM(LPDDR DRAM)制成的存储模块。


其尺寸仅为行业标准DDR5 RDIMM的约1/3,而得益于高速的LPDDR5X和更宽的位宽,SOCAMM在相同容量下带宽可达到2.5倍,功耗仅为传统方案的1/3。


英伟达首席执行官黄仁勋在CES 2025上发布了AI PC [Digits],下一代Digits可能会采用SOCAMM,使其进入AI PC领域。


这也表明,SOCAMM可能成为横跨数据中心和AI PC的存储器,具备比HBM更广泛的应用场景。


需要指出的是,SOCAMM与HBM二者并非直接竞争关系,而是互补存在,SoCAMM解决灵活性问题,而HBM通过与GPU的先进封装集成解决极致性能需求。


尽管SOCAMM在速度上不及HBM,但它具备更强的扩展性和灵活性,预计将在英伟达未来的Rubin和Feynman GPU服务器中继续采用。



存储巨头推进SOCAMM模块亮相


在英伟达的GB200服务器中,Grace CPU两侧各配备16颗低功耗双倍数据速率动态随机存取存储器(LPDDR DRAM),这些DRAM此前是直接板载焊接的。


但在下一代GB300服务器中,英伟达采用了SOCAMM设计,采用4颗LPDDR组成的SOCAMM模块,共4组。


美光近日表示,SOCAMM解决方案已实现量产,通过使用4颗16-die堆叠的16Gb LPDDR5X颗粒,实现了128GB容量;


结合128-bit位宽和8533MT/s速率,为更快的AI模型训练和更高的推理并发用户量提供了关键支持。


作为率先宣布量产SOCAMM的美光,在3月20日的财报会上表示:[我们是第一家与英伟达合作,并率先大规模生产SOCAMM的企业。]


该内存条将被应用于英伟达GB300 Grace Blackwell Ultra超级芯片,并预期将作为Grace CPU的可更换内存使用。



SK海力士也在英伟达GTC大会上展示了SOCAMM,并在新闻稿中表示,[SOCAMM已成为AI服务器存储器的新标准,SK海力士将通过该产品展示AI存储器技术的领先地位。]


SOCAMM的核心参数:单模块容量128GB,由容量为32GB的4颗芯片组成;


采用16颗16Gb LPDDR5X记忆体芯片封装,并采用线键合(Wire Bonding)工艺,而非HBM所使用的TSV(硅通孔)工艺。


数据传输带宽为120GB/s,尽管比传统服务器DRAM快2.5倍,但仍远低于HBM3E的1.2TB/s。


三星也不甘落后,其采用LPDDR5X DRAM的可拆卸模块功耗仅9.2W,比DDR5 RDIMM服务器模块节能45%以上。


有传言称,英伟达可能将50%的SOCAMM订单交给美光,剩下的由三星和SK海力士平分。


其中,三星电子率先开发的LPCAMM可将内存占用面积减少60%以上,提高PC或笔记本的内部组件设计自由度,为增加电池容量等腾出更多空间,使内部布局更加高效。


EBN的报告指出,英伟达与内存制造商正在交换SOCAMM原型进行测试,并预计在2025年底开始大规模生产。


CES 2025上,英伟达推出了GB10 Grace Blackwell超级芯片和Project DIGITS,旨在普及个人AI超级计算机。



SOCAMM的出现将在整个行业产生连锁反应


EBN称,SOCAMM被视为[下一代]HBM,在小型PC和笔记本电脑中具有优于传统DRAM的性能和能效,这可能是关键所在。


预计SOCAMM的出现将在整个半导体行业产生连锁反应,影响到三星电子、SK海力士等内存厂商,以及Simmtech和TLB等基板公司。


目前,SOCAMM内存技术适用于需要高性能内存支持的场景,如AI计算、高性能计算、数据中心等。


由于其可拆卸升级的特点,SOCAMM内存技术还适用于需要频繁更新硬件设备的领域,如游戏、图形设计、虚拟现实等。


随着AI、大数据、云计算等技术的快速发展,对高性能内存的需求日益增加。


SOCAMM以其卓越的性能和能效比,正好满足了这些领域对内存的高要求。


因此,SOCAMM的市场需求将持续增长,特别是在B2B服务器市场和快速发展的终端设备AI领域。


尽管SOCAMM的发展前景广阔,但仍面临一些挑战。


例如,随着半导体行业的快速发展,市场上存在多种不同的内存技术和标准。


SOCAMM作为新一代内存技术,需要与其他硬件和软件系统保持良好的兼容性,以确保其能够顺利应用于各种设备和场景中。


然而,市场碎片化可能导致不同技术标准之间的兼容性挑战,增加了SOCAMM推广和应用的难度。


此外,内存技术的标准化是推动其广泛应用的关键。


SOCAMM需要经历一个标准化的过程,以确保不同厂商生产的SOCAMM模块之间能够互换使用,降低用户的更换和升级成本。


然而,标准化进程可能需要时间和多方协商,这可能对SOCAMM的推广速度产生影响。


与此同时,随着内存技术的不断发展,市场上涌现出多种新型内存技术,如DDR5、GDDR6等。


这些技术各具优势,与SOCAMM形成了一定的竞争关系。


在激烈的市场竞争中,SOCAMM需要不断提升其性能、降低成本并拓展应用场景,以保持竞争优势。


SOCAMM的生产涉及多个环节和供应链节点,包括原材料供应、生产制造、封装测试等。


任何环节的供应链中断或不稳定都可能对SOCAMM的生产和供应产生影响,进而威胁到其市场应用前景。



结尾:


目前SOCAMM尚未大规模应用,但前期部署工作已经启动。


随着AI产业的快速发展,AI设备逐步渗透至日常生活,SOCAMM、LPCAMM、LLW等技术有望成为下一代主流内存方案。


AI计算对内存的要求可归纳为:高带宽、大容量、低延迟、高能效。


传统DRAM技术已接近物理极限,而HBM、SOCAMM等新型内存技术通过3D集成和接口优化,正逐步成为AI硬件的核心。


部分资料参考:印科技:《三大存储巨头围攻[第二增长曲线]》,电子发烧友网:《英伟达力推SOCAMM内存量产:可插拔、带宽比肩HBM》,AI FPGA 之恋:《英伟达 新标准 SOCAMM 另辟蹊径,解锁 AI PC 内存自由》



本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:
18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  • 在智能家居领域,无线门铃正朝着高集成度、低功耗、强抗干扰的方向发展。 WTN6040F 和 WT588F02B 两款语音芯片,凭借其 内置EV1527编解码协议 和 免MCU设计 的独特优势,为无线门铃开发提供了革命性解决方案。本文将深入解析这两款芯片的技术特性、应用场景及落地价值。一、无线门铃市场痛点与芯片方案优势1.1 行业核心痛点系统复杂:传统方案需MCU+射频模块+语音芯片组合,BOM成本高功耗瓶颈:待机电流
    广州唯创电子 2025-03-31 09:06 56浏览
  • Shinco音响拆解 一年一次的面包板社区的拆解活动拉开帷幕了。板友们开始大显身手了,拆解各种闲置的宝贝。把各自的设计原理和拆解的感悟一一向电子爱好者展示。产品使用了什么方案,用了什么芯片,能否有更优的方案等等。不仅让拆解的人员了解和深入探索在其中。还可以让网友们学习电子方面的相关知识。今天我也向各位拆解一个产品--- Shinco音响(如下图)。 当产品连接上电脑的耳机孔和USB孔时,它会发出“开机,音频输入模式”的语音播报,。告诉用户它已经进入音响外放模式。3.5mm耳机扣接收电脑音频信号。
    zhusx123 2025-03-30 15:42 65浏览
  • 真空容器内部并非wan全没有压强,而是压强极低,接近于零。真空状态下的压强与容器内外气体的分子数量、温度以及容器本身的性质有关。一、真空与压强的基本概念真空指的是一个空间内不存在物质或物质极少的状态,通常用于描述容器或系统中气体的稀薄程度。压强则是单位面积上所受正压力的大小,常用于描述气体、液体等流体对容器壁的作用力。二、真空状态下的压强特点在真空状态下,容器内部的气体分子数量极少,因此它们对容器壁的作用力也相应减小。这导致真空容器内部的压强远低于大气压强,甚至接近于零。然而,由于技术限制和物理
    锦正茂科技 2025-03-29 10:16 109浏览
  • 真空容器的材料选择取决于其应用场景(如科研、工业、医疗)、真空等级(低真空、高真空、超高真空)以及环境条件(温度、压力、化学腐蚀等)。以下是常见材料及其优缺点分析:1. 不锈钢(如304、316L)优点:耐腐蚀性强:316L含钼,耐酸碱和高温氧化,适合高真空和腐蚀性环境。高强度:机械性能稳定,可承受高压差和外部冲击。低放气率:经电解抛光或镀镍处理后,表面放气率极低,适合超高真空系统(如粒子加速器、半导体镀膜设备)。易加工:可焊接、铸造,适合复杂结构设计。缺点:重量大:大型容器运输和安装成本高。磁
    锦正茂科技 2025-03-29 10:52 44浏览
  • 一、真空容器的定义与工作原理真空容器是一种能够创造并保持一定真空度的密闭容器。其工作原理通常涉及抽气系统,该系统能够逐渐抽出容器内部的气体分子,从而降低容器内的气压,形成真空环境。在这个过程中,容器的体积并不会因抽气而改变,但容器内的压力会随着气体的抽出而逐渐降低。二、真空容器并非恒压系统真空容器并非一个恒压系统。恒压系统指的是在外部环境变化时,系统内部压力能够保持相对稳定。然而,在真空容器中,随着气体的不断抽出,内部压力会持续降低,直至达到所需的真空度。因此,真空容器内部的压力是变化的,而非恒
    锦正茂科技 2025-03-29 10:23 102浏览
  • 在工业控制与数据采集领域,高精度的AD采集和实时显示至关重要。今天,我们就来基于瑞芯微RK3568J + FPGA国产平台深入探讨以下,它是如何实现该功能的。适用开发环境如下:Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:Ubuntu18.04.4 64bit、VMware15.5.5U-Boot:U-Boot-2017.09Kernel:Linux-4.19.232、Linux-RT-4.19.232LinuxSDK:LinuxSD
    Tronlong 2025-03-28 10:14 121浏览
  •        随着智能驾驶向L3级及以上迈进,系统对实时性的要求已逼近极限。例如,自动紧急制动(AEB)需在50毫秒内完成感知、决策到执行的全链路响应,多传感器数据同步误差需小于10微秒。然而,传统基于Linux-RT的方案在混合任务处理中存在天然缺陷——其最大中断延迟高达200微秒,且多任务并发时易引发优先级反转问题。据《2024年智能汽车电子架构白皮书》统计,超60%的车企因实时性不足被迫推迟舱驾一体化项目落地。为旌电子给出的破局之道,是采用R5F(实
    中科领创 2025-03-29 11:55 161浏览
  • 在智能语音交互设备开发中,系统响应速度直接影响用户体验。WT588F系列语音芯片凭借其灵活的架构设计,在响应效率方面表现出色。本文将深入解析该芯片从接收指令到音频输出的全过程,并揭示不同工作模式下的时间性能差异。一、核心处理流程与时序分解1.1 典型指令执行路径指令接收 → 协议解析 → 存储寻址 → 数据读取 → 数模转换 → 音频输出1.2 关键阶段时间分布(典型值)处理阶段PWM模式耗时DAC模式耗时外挂Flash模式耗时指令解析2-3ms2-3ms3-5ms存储寻址1ms1ms5-10m
    广州唯创电子 2025-03-31 09:26 82浏览
  • 本文介绍OpenHarmony5.0 DevEco Studio开发工具安装与配置,鸿蒙北向开发入门必备!鸿蒙北向开发主要侧重于应用层的开发,如APP开发、用户界面设计等,更多地关注用户体验、应用性能优化、上层业务逻辑的实现,需要开发者具备基本的编程知识、对操作系统原理的简单理解,以及一定的UI设计感。由触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,支持开源鸿蒙OpenHarmony3.2至5.0系统,适合鸿蒙开发入门学习。下载与安装开发工具点下面链接下载:
    Industio_触觉智能 2025-03-28 18:16 143浏览
  • 文/杜杰编辑/cc孙聪颖‍3月11日,美国总统特朗普,将自费8万美元购买的特斯拉Model S,开进了白宫。特朗普此举,绝非偶然随性,而是有着鲜明的主观意图,处处彰显出一种刻意托举的姿态 。特朗普也毫不讳言,希望他的购买能推动特斯拉的发展。作为全球电动车鼻祖,特斯拉曾凭借创新理念与先进技术,开辟电动汽车新时代,引领行业发展潮流。然而当下,这家行业先驱正深陷困境,面临着前所未有的挑战。就连“钢铁侠”马斯克自己都在采访时表示“非常困难”,的确是需要美国总统伸手拉一把了。马斯克踏入白宫的那一刻,特斯拉
    华尔街科技眼 2025-03-28 20:44 159浏览
  • 本文介绍瑞芯微RK356X系列复用接口配置的方法,基于触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。复用接口介绍由下图可知,红圈内容当前引脚可配置为SPI0或者PWM0功能。由标准系统固件以及相关系统手册可得,当前接口默认配置为SPI0功能:console:/ # ls dev/spidev0.0dev/spidev0.0再由原理图可知当前GPIO为GPIO0_C3
    Industio_触觉智能 2025-03-28 18:14 92浏览
  • 3月27日,长虹中玖闪光超高剂量率电子射线放射治疗系统(e-Flash)临床试验项目在四川大学华西医院正式启动,标志着该项目正式进入临床试验阶段。这不仅是我国医学技术领域的一项重大突破,更是我国在高端医疗设备研发和应用方面的重要里程碑。e-Flash放射治疗系统适用于哪些病症,治疗周期为多久?会不会产生副作用?治疗费用高不高……随着超高剂量率电子射线放射治疗系统(e-Flash)正式进入临床试验阶段,社会各界对该项目的实施情况尤为关注。对此,中国工程院院士范国滨,以及四川大学华西医院、四川省肿瘤
    华尔街科技眼 2025-03-28 20:26 184浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦