随着电脑游戏发展日趋成熟复杂,当今的游戏玩家越来越重视先进显卡带来的至高性能—流畅的动画效果、清晰的视觉体验、8K分辨率和实时光线追踪,美光日前与英伟达携手,通过在NVIDIA GeForce RTX 3090/3080 GPU中搭载GDDR6X显存,将系统带宽提升为之前无法想象的 1TB/s。

今年9月,美光科技(Micron)发布了全球速度最快的独立显卡内存解决方案GDDR6X,率先助力系统带宽实现1TB/秒,并成功搭载于全新的NVIDIA GeForce RTX 3090 和GeForce RTX 3080 GPU中,以实现更快速度,满足沉浸式、高性能的游戏应用需求。

GeForce RTX 30系列GPU是第二代NVIDIA RTX电脑游戏平台,采用NVIDIA Ampere架构,配备全新的光线追踪核、张量计算核心(Tensor Core)和多重流处理器。与上一代产品相比,实现了高达1.9倍的性能—功耗比提升,可轻松支持高达8K的各种图形分辨率,被认为是 NVIDIA迄今为止进步最大的一代GPU产品。

1TB/s!令人无法想象的带宽

GDDR6X实现突破性带宽的秘密,来自美光所采用的新的多级信号传输技术—四电平脉冲幅度调制(PAM4)。

虽然PAM4信号技术此前已被用于其他应用领域(例如网络和数据中心),但美光计算和网络产品事业部显存业务总监Ralf Ebert日前在接受《电子工程专辑》独家专访时表示,

其实自2006年起,美光工程师和研究人员就开始探索在内存接口中应用多级信号技术的可能性,在申请了45项专利后,美光成为第一家将GDDR6X上的PAM4 PHY在DRAM中实现的DRAM供应商,美光的GDDR6X成为唯一一款已设计应用并量产的采用PAM4的内存芯片,并且正在大批量生产。

美光计算和网络产品事业部显存业务总监Ralf Ebert

总体来看,在采用PAM4多级信号技术之后,GDDR6X实现了更快的数据传输,输入/输出(I/O)数据速率提升了一倍。此前,显存带宽最高可达64GB/s,传统二进制标准依赖两级信号传输编码为1s或0s的数据,每周期可传输一位数据。而PAM4技术采用四个不同层级,同时向内存输入及输出2个比特,在给定的时钟频率下将数据速率提升了一倍,这样既可以提高信号完整性,又能够降低每传输一个比特的功耗。由此,GDDR6X成功将单颗粒的内存带宽提升至84GB/s,从而使系统带宽提升为之前无法想象的1TB/s。

而根据规划,美光将在2021年为GDDR6X引入16Gb密度,目标性能也将超过21Gbps。

深度揭秘PAM4技术

美光的GDDR6体系结构得益于GDDR5X中首次引入的几个增强特性。除此之外,通过将数据预取量增加一倍,缓解了与DRAM阵列时序相关的挑战。在GDDR6每针数据速率(例如16Gb/s)基础上,用于可靠传输和采集数据的可用时序窗口减少到62.5ps(皮秒),甚至更小。因此,在这些频率下运行需要进一步提高电路精度,电路也会非常复杂,更不用说更高的触发率,所有这些都会导致功耗的增加。考虑到复杂度和功耗因素会使得每针可实现的数据速率迅速下降,所以目前GDDR6的最高速度为16Gbps,超过这一上限非常具有挑战性,并且是以降低边际系统性能作为代价。

为了解决与GDDR6相关的时序挑战,GDDR6X内存用支持PAM4的方案取代了GDDR6现有二进制信令接口(PAM2,通常也称为不归零,即NRZ)。在给定工作频率下,将2比特数据编码至每个传输的数据符号中,可以使有效带宽增加一倍。换言之,当支持普通的每针数据速率时,GDDR6电路的运行速度必须是GDDR6X电路的两倍。结果,为GDDR6开发的高速电路技术足以使GDDR6X远远超过目前GDDR6 16Gb/s的目标,同时还降低了I/O功耗。

图1描述了与GDDR6(上图)相比,怎样以一半的频率通过GDDR6X接口(下图)传输相同数量的数据。

图1:GDDR6(上图)和GDDR6X(下图)之间的数据眼图对比,显示了以16Gb/s传输2比特数据的时序

采用PAM4信号技术,通道使用4个不同的信号电平每周期传输2个数据比特(图2)。其中的每一个电平都被称为一个符号,因此数据传输速率用符号/秒,即波特率来表示。每单位间隔(UI)2比特采用灰色编码,以确保任何传输错误仅影响符号内2比特中的一个。

图2:PAM4的四个物理电平,即符号中的每一个都代表2比特数据

图3显示了与NRZ相比,使用PAM4编码传输相同数量的数据只需要一半的接口周期。由于GDDR6突发长度为16,为了保持数据粒度兼容,GDDR6X等效突发长度被设置为8。

图3:NRZ和PAM4接口相同数据量(一个突发)的编码和传输示例

但提升带宽并不是GDD6X的唯一优势,电源效率也得到了显著提高。图4显示,运行在21Gb/s的GDDR6X比以14Gb/s运行的GDDR6传输每比特所需的功耗低15%—GDDR6X的带宽甚至还要高出50%。请注意,显示的数据表示在整个DRAM器件功耗基础上计算得出效率提高了多少。如果比较仅限于数据接口,将显示PAM4信号技术能够实现更高的功率/比特效率。

图4:GDDR6和GDDR6X之间的功耗比较,归一化为GDDR6

并非GPU独享

一款新的内存输入/输出(I/O)只能在SoC芯片上有相应内存控制器的情况下才可以开始量产。Ralf Ebert说为了向业界证明DRAM中的PAM4信号技术目前可以成功地实现量产,美光决定在标准化之前首先设计并推广GDDR6X,并强调称,“我们并没有将其作为独家产品”。相反,美光希望GDDR6X能够解决非GPU市场上的很多问题,例如:

  • HPC(高性能计算):GDDR6X可用于高性能计算,其特点是高度并行计算,能够高效、可靠并且尽可能快地执行高级应用程序。科学研究人员、工程师和学术机构依靠这类超级计算机来解决复杂的问题。
  • 专业可视化:高性能工作站是GDDR6X的一类关键应用场景。医疗健康、专业视频后期处理、天气预报、金融模拟以及石油和天然气等行业,都依赖于由高端显卡支持的工作站来快速处理大型数据集。
  • 人工智能(AI):GDDR6X 可以支持人工智能应用。为满足计算工作负载不断增长的需求,我们比以往任何时候都更加需要以更快速度传输更多数据的新方法。
  • 汽车与网络:自动驾驶使用大量数据来分析周围环境,并以极快的速度处理这些数据。使用超带宽解决方案的GPU非常适合此类工作场景。自动驾驶继续取得重大进展,并将推动内存行业的大幅增长。在网络方面,高端路由器和交换机需要超带宽解决方案的性能和带宽能力。对于汽车和网络,可靠性和寿命是重点关注的因素。

在此基础上,客户可以自由开发自己的内存控制器/PHY IP,也可以与第三方IP提供商合作开发。但为了支持PAM5信号技术,对PHY IP的修改将是采用GDDR6X所需的关键修改。

都是超带宽,各有各不同

PAM4有潜力推动数据速率的进一步提高。但是,人们在讨论超带宽解决方案时,一定会提及HBM(高带宽内存)。HBM通过与计算紧密集成并进一步降低功耗,提高带宽,从而填补了内存解决方案的空白。该技术利用堆叠内存组件提高了密度,较低时钟速率下极高的I/O数量实现了高带宽,而且所有这些的功耗指标都比较低。HBM是功能强大的超带宽解决方案,但由于产品的复杂性,也是成本相对较高的解决方案,主要面向那些对成本不太敏感的极高带宽应用。

Ralf Ebert从性能、功耗、性价比三方面对不同超宽带方案的选用给出了自己的见解:

  • 性能

正如市场趋势和历史发展所揭示的那样,性能的不断提高需要得到相应的支持。GPU每年都会有升级,这意味着不断有更高的带宽需求。在每一升级周期中,超带宽解决方案都会提高数据速率。要想提升性能,用户就应使用最新的超带宽解决方案。

  • 功耗

随着性能要求的不断提高,电源效率变得越来越重要,用户应该查看其总体解决方案的功耗窗口,是否与所要求的带宽相匹配。 

图5:超带宽内存的功率要求

  • 性价比

很多超带宽解决方案应用都是基于消费类的终端应用,其预算对成本比较敏感。内存既要满足带宽和帧缓冲要求,还要保持合理的成本,根据应用和带宽需求,GDDR等分立的低成本选择将是比较合适的解决方案。如果与成本敏感度相比,带宽需求更为重要,那么可以选择HBM。在考虑性价比时,用户除了器件成本,还要考虑系统实施成本。标准电路板材料和主流的装配工艺都支持实现分立元件解决方案,因此其总拥有成本(TCO)是很有吸引力的。

结语

“虽然到目前为止只有英伟达在应用GDDR6X,不过我们正在向其他需要高性能、超带宽解决方案的业界厂商推广GDDR6X,也希望被JEDEC所采纳。事实上,我们上一次与英伟达合作的GDDR5X在GeForce GTX 1080 Ti GPU上大获成功,以至于促成了下一个纳入JEDEC标准的GDDR6技术规范。”Ralf Ebert说,GDDR6X并不专用于GPU,任何使用GDDR6X的内存控制器都可以发挥其内存性能优势,他看好其前景,相信PAM4 I/O技术除了显存之外还将有机会应用于其他未来DRAM和内存标准。

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
此次收购被视为奥康国际跨界进入半导体行业的重大举措,旨在通过多元化发展来改善公司的财务状况。但交易双方进行了多轮协商和谈判后,在交易方案的细节条款上存在分歧……
CMC清单主要与美国对中国高科技企业的打压以及对抗中国军民融合战略有关。
三星在 HBM3E市场落后于SK Hynix,正计划通过采用先进工艺最大限度地提高 HBM4 的性能。三星电子的存储业务部门成功完成了HBM4内存逻辑芯片的设计,并交由Foundry业务部采用4nm工艺进行试产......
SK海力士将在CES2025,展出HBM、企业级固态硬盘(eSSD)等面向AI的代表性存储器产品,也将展示专为端侧AI优化的解决方案和下一代面向AI的存储器产品。
通过此次扩建,美光不仅能够增强其在美国本土的内存制造能力,还能进一步巩固其在全球特种DRAM市场的地位,满足不同行业对高性能、长寿命存储器的需求。
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
1月7日,据韩媒 sisajournal-e 消息,三星计划 2025 年下半年推出三折叠手机,采用 G 形双内折设计,完全展开后尺寸为 12.4 英寸。据称,有别于华为的 S 形折叠屏方式(In&O
01周价格表02周价格观察硅料环节本周硅料价格:N型复投料主流成交价格为40元/KG,N型致密料的主流成交价格为38元/KG;N型颗粒硅主流成交价格为35元/KG。供给动态头部料企继续推进减产策略,月
今天推荐的视频介绍了单片机(MCU)和数字信号控制器(DSC)之间的差异、Microchip DSC的单核和双核架构、DSC的应用示例以及可将您的设计推向市场的开发资源。更多更全视频尽在Microch
近日,联想在CES 2025展会上展示了全球首款卷轴屏PC——ThinkBook Plus Gen 6。据悉,ThinkBook Plus Gen 6卷轴屏AI PC的核心魅力在于其独有的可卷曲显示屏
随着Mini/Micro LED技术发展和小间距产品成熟,LED显示行业在更多细分场景下的高增长潜力正在加速释放。Mini LED背光市场自2021年进入起量元年后,年复合增长率达50%;Micro
当地时间2025年1月7日,全球备受期待的技术盛宴——国际消费电子展(CES 2025)在美国拉斯维加斯盛大开幕。作为显示领域的领军企业,天马携一系列前沿创新技术和最新智能座舱解决方案惊艳登场,带来手
日前,国家发展改革委等部门介绍了加力扩围实施“两新”政策有关情况,今年第一批消费品以旧换新资金810亿已经预下达。很多网友没有看懂具体政策,下面快科技给大家简单梳理一下,其实一句话来说就是:国四车、家
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
日前,微信安卓版迎来8.0.56正式版更新,这是2025年首次版本更新。关于更新内容,依然是那9个字:“修复了一些已知问题”。虽然官方没有公布具体更新内容,但体验后发现,新版增加了朋友圈视频倍速播放等
近日,由工业和信息化部、国家广播电视总局、国家知识产权局联合评选的“2024年度视听系统典型案例”公示名单正式发布。聚飞光电自主研发的大尺寸 Micro LED 超高清显示屏系统经专家评审及公示程序,