揭秘！海力士的推理和端侧大模型加速卡

原创 SSDFans 2025-01-09 08:09 775浏览 0评论 0点赞

如何通过半导体技术提升光伏与储能系统的效率？ AI数据中心过热？ST 10kW压缩机方案让液冷系统效能翻倍

点击蓝字

关注我们

在Hot Chips 2024上，海力士专注于AI加速器的标准DRAM之外的产品。该公司展示了其在内存计算方面的最新进展，这次是用其AiMX-xPU和LPDDR-AiM进行LLM推理。其理念是，无需将数据从内存移动到计算以执行与内存相关的转换，这些转换可以直接在内存中完成，而无需遍历互连。这使得它更节能，而且可能更快。

海力士在Hot Chips 2024上展示AI专用计算内存解决方案AiMX-xPU

海力士表示，由于LLM的存储空间有限，因此对LLM非常有用。

该公司展示了采用Xilinx Virtex FPGA和特殊GDDR6 AiM封装的GDDR6内存加速器卡。

看下AiMX card：

下面是GDDR6芯片的外观。

另外，海力士提到了OCP 2023的现场演示。

这是LLM的全连接层、Multi-Head Attention以及计算绑定部分。

下图展示压力如何根据批量大小变化。

海力士将Multi-Head Attention映射到了AiM。

该公司还将内存容量增加了一倍，使用32个AIM软件包，从16GB增加到32GB。32GB对于一款产品来说可能不够，但对于一个原型机来说就足够了。尽管如此，该公司还是展示了这项技术的性能。

下一代演示将展示像Llama-3这样的东西，该公司也在考虑将每张卡的容量从32GB扩展到256GB。

除了关注数据中心的AI，该公司还在关注设备上的AI。我们已经看到苹果、英特尔、AMD和高通等公司在为人工智能推出NPU。

设备上的AI通常会降低批处理大小，因为这些工作负载受到内存限制。将计算移出SoC意味着它可以更节能，并且不会占用SoC上的计算芯片面积。

目标是在未来针对LPDDR5-AiM的产品中优化AiM。我们的目标是不更改现有的LPDDR命令，也不产生负面的性能影响。下表上的规格是预估的。

通过LPDDR5，它可以集成到移动设备的SoC上。

可能需要针对不同的应用程序进行不同的权衡。

其中一个挑战是在LPDDR内存的正常使用和计算需求之间进行仲裁。此外，还有可能改变芯片的热/功率要求。

另一个挑战是如何对AiM进行编程。

海力士似乎正在扩大AiM/ AiMX的使用范围和种类。

海力士表示，在GDDR6中，AiM占据了约20%的芯片面积。

总结

内存计算在成为主流之前。仍然是一个主要的SoC/芯片供应商必须选择和集成的东西。在许多方面，内存计算可能是有意义的。我们将拭目以待，看看这款产品能否从原型变成产品。

原文链接：

https://www.servethehome.com/sk-hynix-ai-specific-computing-memory-solution-aimx-xpu-at-hot-chips-2024/

高端微信群介绍
创业投资群	AI、IOT、芯片创始人、投资人、分析师、券商
闪存群	覆盖5000多位全球华人闪存、存储芯片精英
云计算群	全闪存、软件定义存储SDS、超融合等公有云和私有云讨论
AI芯片群	讨论AI芯片和GPU、FPGA、CPU异构计算
5G群	物联网、5G芯片讨论
第三代半导体群	氮化镓、碳化硅等化合物半导体讨论
存储芯片群	DRAM、NAND、3D XPoint等各类存储介质和主控讨论
汽车电子群	MCU、电源、传感器等汽车电子讨论
光电器件群	光通信、激光器、ToF、AR、VCSEL等光电器件讨论
渠道群	存储和芯片产品报价、行情、渠道、供应链

< 长按识别二维码添加好友 >

加入上述群聊

长按并关注

带你走进万物存储、万物智能、

万物互联信息革命新时代

微信号：SSDFans

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

SSDFans AI+IOT+闪存，万物存储、万物智能、万物互联的闪存2.0时代即将到来，你，准备好了吗？

进入专栏

SSDFans AI+IOT+闪存，万物存储、万物智能、万物互联的闪存2.0时代即将到来，你，准备好了吗？

文章：1002篇粉丝：29人

关注  私信

揭秘！海力士的推理和端侧大模型加速卡

最近文章

热门文章

推荐

最新资讯