存算一体：GPU大型计算系统

智能计算芯世界 2024-02-02 08:08 952浏览 0评论 0点赞

汽车照明的秘密武器，竟然是…… 热管理技术新标杆：ST维也纳PFC与FOC控制方案深度解析

陈巍谈芯：产业巨头已经打通存算一体技术的落地通道，存算一体技术加快应用部署。与未使用HBM-PIM（HBM-PIM GPU v.s. HBM GPU）相比，仅用20nm工艺就使7nm集群计算性能提升了2.5倍。

下载链接：

CPU技术及产业技术：分类与产业篇

GPU：AI服务器关键技术及核心

《自动驾驶芯片研究专题》

1、自动驾驶芯片研究框架（2023） 2、车载计算平台标准化需求研究报告 3、智驾芯片群雄并起，自动驾驶方兴未艾 4、智能驾驶之芯片和软件领域梳理 5、自动驾驶芯片行业研究报告

大话处理器：处理器基础知识深度读本

微架构：处理器的内心世界

MIPS指令与汇编

CPU架构与故障维修

《六大国产CPU架构分析报告》

1、开启国产CPU和AI芯片的腾飞之路

2、CPU生态价值与机遇研究

3、国产基础软硬件，重塑IT产业生态

4、中流击水：六大国产CPU厂商分析

5、聚力突破核心技术，信创产业扬帆起航

服务器研究框架

服务器系列技术（4本）

《RISC-V技术介绍及报告》

《飞腾CPU专题报告》

1、飞腾：国产CPU巨头，充分受益国产化浪潮

2、国产CPU全对比，飞腾有望异军突起

《国产CPU及研究框架》

1、国产CPU正从可用向好用转变，自主可控前景可期

2、国产CPU全对比，飞腾有望异军突起

3、专题报告：国产CPU研究框架

4、深度报告：CPU研究框架

《龙芯/海光CPU厂商专题报告》

1、龙芯：国产CPU引领者，构建自主可控生态体系（2022）

2、海光：进击的国产化CPU GPU领航者（2022）

3、海光：安全、性能、生态铸造国产高端处理器龙头

4、龙芯：深耕CPU行业20余年，国产化替代大有可为

算力大时代，处理器SoC厂商综合对比

AI领强算力时代，GPU启新场景落地

信创专题（数据库）：信创的关键环节（2022）

《2023年半导体技术策略报告》

1、2023半导体：聚焦自主可控，国产化替代

2、2023半导体行业：设备零部件国产化加速，开启千亿蓝海

3、2023半导体策略报告：国产化替代推进，IC需求复苏可期

4、2023年半导体设计：复苏与换挡

5、光刻胶：半导体产业核心卡脖子环节，国内蓄势待发

三星电子于 12 月 12 日宣布，他们开发了世界上第一个基于数字存内处理 (PIM，也可称存内计算或存算一体) 芯片（HBM-PIM）的GPU的大规模计算系统。

三星电子高等技术研究院人工智能研究中心副主任崔昌圭（Choi Chang-kyu）在由三星电子主办的2022人工智能（AI）半导体未来技术大会上通过主题演讲披露了新计算技术的发展。他们通过组合来自AMD的96个GPU（MI100）构建了一个大型计算系统，每个GPU都加载了一个HBM-PIM芯片，并成功展示了存内处理 (PIM) 芯片的性能。这是一种存算一体技术，可以显著减少数据在CPU 和 DRAM 之间移动的频度并提升性能。

PIM 是指将计算单元与随机存取存储器 (DRAM) 集成在单个芯片上。这项技术有望有助于提高庞大的人工智能 (AI) 的性能。三星使了严格意义上的芯片内数字近存计算来提升AI计算性能。三星 HBM-PIM 芯片与其他公司 HBM 实现的不同之处在于，PIM 芯片上的每个存储块内都包含一个内部处理单元。

根据三星去年在ISSCC发布的学术文章信息披露，该HBM-PIM使用的是三星的20nm DRAM工艺。负责计算的PCU与DRAM 阵列在同一个晶圆平面内，显著性能提升主要来自存算一体技术而非3D 堆叠封装。仅用20nm工艺的PCU进行简单的逻辑计算（DRAM工艺做逻辑计算其实不划算，外周的逻辑晶体管的实际栅长在32nm附近），就使得7nm工艺GPU集群的性能提升到2.5倍。

三星电子使用该系统训练语言模型算法T5（Text-to-Test Transfer Transformer）时，与未使用PIM时相比，性能提升了2.5倍，功耗降低了2.67倍。与仅配备 HBM 的 GPU 加速器相比，配备 HBM-PIM 的 GPU 加速器一年的能耗下降了约 2,100 GWh。三星表示，其 PIM 技术将对能源消耗和环境具有重大影响，可将集群的年能源使用量减少，相当于减少 960,000 吨碳排放。

三星开发的另一个方向是使用 CXL（Compute Express Link）开放标准，用于高速处理器到设备和处理器到内存的接口，从而可以更有效地使用与处理器一起使用的内存和加速器。

CXL 可以与其他技术结合使用，例如 Processing-near-Memory (PNM)，以帮助促进内存容量扩展。

与 PIM 一样，它通过使用内存进行数据计算来减少 CPU 和内存之间的数据移动。在 PNM 的情况下，计算功能在更靠近内存的地方执行，以减少 CPU 和内存数据传输之间发生的瓶颈。

三星本月早些时候推出了带有 CXL 的 PNM 技术，用于高容量 AI 模型处理。在测试中，基于 CXL 接口的 PNM 系统在推荐系统或需要高内存带宽的内存数据库等应用中性能翻倍。

报告下载：

信创产业链全梳理（2022）

2022中国超算行业概览：超算芯片国产化，行业加速内卷

信创进程全面提速，看好国产操作系统机会（2022）

《拐点将至：服务器市场快速发展(2022)》

《服务器分析：部分服务器先行指标出现拐点（2022）》

CPU技术与产业白皮书

2023年半导体策略：但行“芯”路，不问“硅”期

2023年半导体设备：聚焦自主可控和国产化替代

2021年国内服务器产品手册

2022年国产操作系统发展研究报告

中国IT基础设施行业研究报告

边缘计算最佳实施白皮书（2022）

SOC芯片研究框架（2022）

信创研究专题框架

1、2020信创发展研究报告

2、中国信创产业发展白皮书（2021）

3、信创研究框架

4、云计算行业：新基建和信创云计算进阶

5、深度研究：云计算与信创产业持续快速发展

6、深度：信创产业系列专题（总篇）

7、计算机研究：信创和鲲鹏计算产业链

本号资料全部上传至知识星球，更多内容请登录智能计算芯知识（知识星球）星球下载全部资料。

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

温馨提示：

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享，点击“阅读原文”获取更多原创技术干货。

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

进入专栏

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

文章：1671篇粉丝：207人

关注  私信

存算一体：GPU大型计算系统

最近文章

热门文章

推荐

最新资讯