GDDR7规范重磅发布!深度解读

原创 EETOP 2024-03-10 11:09

半导体封装和测试中的多物理场仿真|行业专家技术直播(免费)


JEDEC 上周二(3月5日))发布了 GDDR7 DRAM 的官方规范,这是显卡和其他 GPU 驱动设备的长期内存标准的最新版本。最新一代 GDDR 带来了内存容量和内存带宽增益的组合,后者主要由内存总线上切换到 PAM3 信号驱动。最新的GDDR 标准还增加了每个 DRAM 芯片的通道数量,添加了新的接口训练模式,并引入了片上 ECC 以保持内存的有效可靠性。

JEDEC 董事会主席 Mian Quddus 表示:“JESD239 GDDR7 标志着高速内存设计的重大进步。随着向 PAM3 信号的转变,内存行业有了一条新的途径来扩展 GDDR 设备的性能并推动图形和各种高性能应用的不断发展。”

GDDR7 最大的技术变化是内存总线上的两位不归零 (NRZ) 编码转换为三位脉冲幅度调制 (PAM3) 编码。这一变化允许 GDDR7 在两个周期内传输 3 位数据,比在相同时钟速度下运行的 GDDR6 多传输 50% 的数据。因此,GDDR7 可以支持更高的总体数据传输速率,这是使每一代 GDDR 连续比其前身更快的关键组件。

一代 GDDR7 的数据传输速率预计约为 32 Gbps/pin,而内存制造商此前曾表示,最高可达 36 Gbps/pin。然而,GDDR7 标准本身为更高的数据传输速率(高达 48 Gbps/pin)留出了空间,JEDEC 甚至在其新闻稿中宣称 GDDR7 内存芯片“每台设备的速率高达 192 GB/s [32b @ 48Gbps]” 。值得注意的是,这比 PAM3 信号本身带来的带宽增长要高得多,这意味着GDDR7的设计中有多个级别的增强。

深入研究规范,JEDEC还再次将单个32位GDDR内存芯片细分为更多的通道。GDDR6提供了两个16位通道,而GDDR7将其扩展到四个8位通道。从终端用户的角度来看,这种区别有些武断——它仍然是一个32位芯片,运行速度为32Gbps/pin——但它对芯片内部的工作方式有很大的影响。特别是JEDEC保留了GDDR5和GDDR6每通道256位预取,使GDDR7成为32n预取设计。

GDDR 通道架构

所有这些的最终影响是,通过将通道宽度减半但保持预取大小相同,JEDEC 有效地将 DRAM 单元每个周期预取的数据量增加了一倍。这是扩展 DRAM 内存带宽的非常标准的技巧,本质上与 JEDEC 在 2018 年对 GDDR6 所做的事情相同。但它提醒我们,DRAM 单元的速度仍然非常慢(在数百兆赫的数量级上)并且速度并没有变得更快。因此,提供更快内存总线的唯一方法是一次性获取越来越多的数据。

每个内存芯片通道数量的变化也对多通道“clamshell”模式如何适用于更高容量的内存配置有轻微影响。虽然GDDR6在clamshell配置中从每个芯片访问单个内存通道,但GDDR7将访问两个通道- JEDEC称之为双通道模式。具体来说,这种模式从每个芯片读取通道A和C。它实际上与GDDR6的clamshell模式完全相同,这意味着尽管最新一代内存仍然支持clamshell配置,但除了不断增加的内存芯片密度之外,没有任何其他技巧可以用来提高内存容量。

在这方面,GDDR7 标准正式增加了对 64Gbit DRAM 设备的支持,是 GDDR6/GDDR6X 32Gbit 最大容量的两倍。此外,还继续支持非双功率容量,允许使用 24Gbit 和 48Gbit 芯片。对更大内存芯片的支持进一步将理论上采用 384 位内存总线的高端显卡的最大内存容量推高到 192GB 内存,在大型语言人工智能模型时代,这一发展无疑会受到数据中心运营商的欢迎。不过,尽管如此,我们仍然经常看到当今的存储卡使用 16Gbit 内存芯片,尽管 GDDR6 支持 32Gbit 芯片。再加上三星和美光已经透露,它们的第一代 GDDR7 芯片也将分别以 16Gbit/24Gbit 为上限,可以肯定地说,64Gbit 芯片现在还很遥远。

对于其最新一代的内存技术,JEDEC还包括一些新的GDDR内存可靠性功能。最值得注意的是,片上ECC功能,类似于我们在引入DDR5时所看到的。虽然我们还没有从JEDEC那里得到官方评论,说明为什么他们现在选择包括ECC支持,但考虑到DDR5的可靠性要求,它的包含并不奇怪。简而言之,随着存储芯片密度的增加,越来越难以生产出没有缺陷的“完美”芯片;因此,添加片上ECC使内存制造商能够在面对不可避免的错误时保持其芯片的可靠运行。

在内部,GDDR7 规范要求每 256 位用户数据至少 16 位奇偶校验数据 (6.25%),JEDEC 给出了 9 位单纠错码 (SEC) 和 7 位循环冗余校验 (CRC) 的示例实现。总体而言,GDDR7 片上 ECC 应该能够纠正 100% 的 1 位错误,并检测 100% 的 2 位错误——在极少数 3 位错误的情况下,检测率降至 99.3%。有关内存错误的信息也通过JEDEC所说的片上ECC透明协议提供给内存控制器。虽然在技术上与ECC本身是分开的,但GDDR7还引入了另一个内存可靠性功能,即命令地址与命令阻塞(CAPARBLK)的奇偶校验,旨在提高命令地址总线的完整性。

此外,虽然加入片上 ECC 对消费类显卡的影响不会超过对 DDR5 内存和消费类平台的影响,但这对工作站和服务器显卡意味着什么还有待观察。工作站和服务器显卡供应商在无保护内存上使用软 ECC 已经有好几代了;GDDR7 显卡大概也会如此,但与 CPU 领域相比,软 ECC 的常规使用会让事情变得更加灵活。

最后,GDDR7 还引入了一系列其他与可靠性相关的功能,主要与帮助 PAM3 运行有关。这包括具有眼图掩蔽和错误计数器的核心独立 LFSR(线性反馈移位寄存器)训练模式。LFSR 训练模式用于测试和调整接口(以确保效率),眼图掩蔽评估信号质量,错误计数器跟踪训练期间的错误数量。

撇开技术问题不谈,此次发布公告包括了来自多方所有常规参与者的支持声明,其中包括 AMD 和 NVIDA,以及美光/三星/SKhynix 三巨头。不言而喻,鉴于 GDDR7 将带来的内存容量和带宽提升,各方都热衷于使用或销售 GDDR7--尤其是在这个任何针对 AI 市场的产品都热销的时代。

目前尚未公布具体产品,但由于三星和美光此前已宣布打算在今年推出 GDDR7 内存,因此我们应该会在今年晚些时候看到新的内存,以及与其配对的新 GPU。

来源:EETOP编译自anandtech

参考链接:

https://www.anandtech.com/show/21287/jedec-publishes-gddr7-specifications-pam3-ecc-higher-density



IC设计专属培训 

(北京、西安、成都、南京、苏州、上海、合肥、杭州、深圳)

(五星级酒店、小规模特邀免费培训,提供免费餐饮)

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论
  • 高精度,抗干扰,设计灵活……一句话总结:打铁还需自身硬!2040年,人形机器人的数量或将超过人类,达到100亿个。 10月29日,沙特投资倡议论坛,在谈及AI和人形机器人赛道时,马斯克再一次大胆预测,描绘出上述令人震撼的未来景象,且预估每台机器人的价格将稳定在2万-2.5万美元之间。当下,技术飞速发展,众多机器人公司如雨后春笋般涌现。余建华,艾迈斯欧司朗资深应用工程师,深感对这个市场的期待,他表示每一个机器人关节的背后,都离不开位置传感器的精准掌控。这片市场的潜力,让人憧憬不已。在工业及消费中
    艾迈斯欧司朗 2024-12-30 17:25 52浏览
  • 产品概述MG600Q2YMS3 是一款基于硅基碳化物(SiC)技术的高功率N沟道MOSFET模块,适用于高功率开关和电机控制应用,如轨道牵引系统。其设计旨在满足高效能和快速切换需求,为工业和能源领域提供可靠解决方案。主要特性1. 高电压和电流能力   耐压 (VDSS):1200 V   漏极电流 (ID):600 A2. 高效率与低损耗   碳化硅材料降低导通损耗和开关损耗,实现更高的转换效率。3. 快速切换性能 支持高频操作,适用于
    东芝铠侠代理 2024-12-31 10:33 70浏览
  • 感光百科:4000万片出货量背后的“技术经”目前,仅单点dToF,艾迈斯欧司朗的累积出货量就已超过了4000万片。大量采用的背后必然代表无数用户对这一技术的认可和信赖。究竟是什么魔力,让dToF传感器拥有如此强大的吸引力?又是怎样的know-how积累让艾迈斯欧司朗的dToF产品如此受到青睐?让我们再次回到底层原理来探究dToF 4000万片出货量背后的“技术经”。01、底层原理决定应用上限dToF传感器,顾名思义,直接飞行时间测量,基于光速不变,测量光子从发射端到接收端的光程差,从而直接计算二
    艾迈斯欧司朗 2024-12-30 18:21 87浏览
  •         在之前的文章中,我们介绍了IEEE 802.3cz[1]协议,MultiGABSE-AU物理层中XMII、PCS子层以及两个可选功能的相关内容,本篇将介绍MultiGABSE-AU物理层PMA子层及PMD子层的相关机制。PMA子层        PMA子层位于PCS子层和PMD子层之间,规范中定义了PMA子层的三个功能:PMA Transmit、PMA Receive及PHY Control。&nbs
    经纬恒润 2024-12-30 18:16 96浏览
  • 在当今数字化时代,嵌入式系统无处不在,从我们手中的智能手机、智能手表,到汽车中的电子控制系统、工业自动化设备,嵌入式开发技术的发展历程宛如一部波澜壮阔的科技史诗,深刻地改变了我们的生活和社会的运作方式。萌芽阶段(20 世纪 60 - 70 年代)嵌入式开发的起源可以追溯到 20 世纪 60 年代。当时,计算机技术刚刚兴起,体积庞大且价格昂贵。为了满足特定设备的控制需求,工程师们开始尝试将计算机技术应用于一些专用系统中。这一时期,嵌入式系统的概念逐渐萌芽。1965 年,美国数字设备公司(DEC)推
    Jeffreyzhang123 2024-12-31 10:08 113浏览
  • 近日,紫光展锐正式推出高性能4G 智能穿戴平台W377E。该产品面向不同的应用场景,拥有丰富特性和超低功耗,进一步壮大紫光展锐的智能穿戴产品组合。紫光展锐面向中高端和海量的智能穿戴市场,持续提供技术先进、高效安全、高质可靠的解决方案。 紫光展锐W377E采用四核A53架构,支持13M摄像头,video 1080P 30fps,集成了Wi-Fi、蓝牙和GPS功能。W377E搭载Android 8.1系统,提供更加丰富多样的APP体验,支持在线好友聊天、支付宝等功能,且支持64位系统的AP
    紫光展锐 2024-12-31 16:26 109浏览
  • “新时代,共享未来”2024年11月5日-10日,第七届中国国际进口博览会在上海圆满落幕。其中,3万平方米的汽车展区展览面积,也让观众笑谈进博会再次进入“车展”时间。全球15大整车品牌,40多家企业参展,其中不乏耳熟能详,七届进博会“全勤生”的国际知名OEM,也会有首次参加的“新面孔”,它们共同构成了今年汽车展区的“全家福”。近年来,中国汽车进口均超百万辆。因此,对跨国车企来说,中国市场的重要性不言而喻。同时,在电动化和智能化赛道中弯道超车的中国汽车市场,也是全球汽车行业竞争最为激烈的市场,在这
    艾迈斯欧司朗 2024-12-30 17:05 55浏览
  • 本文介绍Linux系统查看硬件配置及常用调试命令,方便开发者快速了解开发板硬件信息及进行相关调试。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。查看DDR获取内存信息下面数字以MB为单位。root@ido:/# free -mtotalused free shared buff/cache availableMem:
    Industio_触觉智能 2024-12-31 10:01 63浏览
  • 时源芯微EMC(电磁兼容)领域,充斥着众多专业术语,令人眼花缭乱。1 电磁兼容(EMC)定义:指电气装置或系统在共同的电磁环境条件下,既能保持正常功能,又不会对周围环境产生不良影响。2  电磁环境Electromagnetic Environment定义:指存在于某一特定场所的所有电磁现象的总和。3半电波暗室Semi-anechoic Chamber定义:一种屏蔽室,除地面安装反射接地平板外,其余内表面均覆盖有吸波材料。4 远场Far Field定义:在天线辐射的场域中,功率密度与距离
    时源芯微 2024-12-31 10:52 101浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球CAN-Bus总线电缆产值达到2287百万美元,2024-2030年期间年复合增长率CAGR为3.6%。一、行业概述CAN-Bus总线电缆是一种专门用于CAN总线(Controller Area Network,控制器局域网络)通信系统中的电缆。CAN总线是一种广泛应用于汽车、工业自动化、机器人等领域的串行通信协议,主要用于微控制器和设备之间的数据交换。CAN-Bus电缆负责在多个设备间传输数据,保证信息的稳定传输和
    GIRtina 2024-12-31 11:00 95浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦