改变智能芯片版图的黑科技-GDDR6/6XComboIP

FPGA开发圈 2022-05-13 08:30






前言




✬ GDDR6/6X Combo IP 赋能风华系列高性能GPU的高带宽技术

不久前芯动科技推出的风华1号GPU引起了市场高度关注,160~320G Pixel/s渲染、5~10T Flops浮点算力、AI算力最高50Tops。对于一款高性能GPU而言,算力是最核心的指标,而实现算力最基础的技术就是高带宽数据交换。如果说把GPU比作智能芯片中的战斗机,那么GDDR内存交互访问技术,就是配套的高速跑道了。

▲GDDR6/6X Combo IP是风华GPU高带宽的核心技术

GDDR6/6X接口技术成为各个大厂旗舰机的标配,这也是风华1号高性能GPU能够在市场上领先竞争对手的重要原因之一!

今天深入探讨一下GDDR内存技术在Soc中的重要性和发展历程,GDDR6/6X接口如何满足高算力GPU对高带宽数据交换的需求。







GDDR和GPU的关系

说起GDDR就必须要先讲GPU的发展历史,图形处理器GPU(Graphics processing unit),作为CPU的协处理器加速卡,早期主要对游戏、视频、图像等应用进行加速。

图像的计算包含了顶点着色、屏幕映射、片元着色、裁剪、三角形遍历等大量数学运算,GPU在大规模、并发计算上对比CPU有着先天的优势。

▲ GPU主要实现的算法结构

GPU基于图形处理的架构上,有成百上千个计算核心,在高性能计算、并行计算、矩阵运算上有巨大优势,所以在需求的推动下,GPU自然成为了当下人工智能、高性能计算的硬件核心平台。

▲ 与CPU相比,GPU的多核心计算架构有利于并行矩阵运算

由于GPU的架构有成百上千个运算核心,因此并行计算的流水线数据流,并不适用传统的CPU+DDR数据访问模型,相应的GDDR技术也就应运而生。







GDDR显存技术是主流先进GPU的标配

先进工艺半导体迅猛发展点亮了人工智能、自动驾驶、神经网络、高性能游戏等五光十色的海量新应用。而GPU作为高性能、高并发的基础算力平台,让黄教主和苏妈成为这个舞台最耀眼的双星!

▲ 英伟达的RTX、titan系列和AMD YES不断轰炸着大家的想象力天花板!

当所有的高性能GPU都在追求极致算力时,内存数据交换逐渐成了整个SoC的瓶颈,高带宽高速率的内存交换技术,成为提升GPU运算效率的关键要点。

▲ GDDR是GPU系统的核心数据交换技术

在需求的刺激和推动下,GDDR技术得到了飞速发展,DDR5 6.4Gbps/pin还没大规模铺开,GDDR早已经迭代到GDDR6X 21Gbps/pin速率了。一般DDR5的位宽为32~64bit,单Chip带宽为72Gbps,而GDDR6的带宽则达到叹为观止的512Gbps。

▲ GDDR的发展迅速超过了DDR

好马配好鞍,GDDR是GPU算力提升最重要的技术环节之一,为GPU高性能引擎铺平了高速赛道。

▲ 法拉利在泥巴里也跑不动!







GDDR主要优势

  • GDDR和传统的DDR做对比

  • 带宽优势

常规的DDR系列,是8、16位的预取,array 32~128bit,而GDDR5/6X是16n的预取,实现单个array 256~512bit的大块内容存取,单次Access granularity 32~64Byte,系统数据宽度能达到384bit,以满足GPU对高带宽的需求。

▲ GDDR5X/GDDR6的预取更大

▲ GDDR的结构和速率有利于更大的总线宽度

由于GDDR的颗粒array大,所以同等密度的情况下,列地址CA的宽度更小,如下图所示:

▲ LPDDR4的列地址为10bit,而GDDDR6X的列地址为6~7bit

以上技术特征表明GDDR的内存单元更大,读取长度大,数据总线宽,与传统DDR呈现出不一样的鲜明特征。

  • 管脚对比

GDDR5~GDDR6X使用管脚170~180 pin,而传统的LPDDR4需要200个pin,当然比起DDR3 80~90pin还是有显著增长,但是获得的带宽收益更大。

GDDR和DDR则各有千秋。

GDDR在带宽、核心速率、管脚少的特点在GPU、NPU、AI等高并发计算等应用上有极大优势。DDR在随机访问、突发读写延时较小、高密度内存颗粒应用上,搭配CPU仍然更有优势。

  • 最新的现存颗粒指标性能

GPU发展一日千里,各种旗舰机层出不穷的同时,GDDR的进步也毫不逊色,甚至大有技高一筹势头。

▲ 美光的GDDR颗粒在GPU旗舰机的搭载对比

美光的主要显存颗粒在各个旗舰GPU上搭配应用,对于超大带宽的应用,美光在3个维度做出了对比。

▲ 主流GDDR性能比较

GDDR6X已经达到21Gbps/pin速率、1TB/S带宽,GPU大厂都表示“这么大的带宽,我要搞多高算力才配用这么大带宽的GDDR颗粒嘛?”真是GDDR有多大胆,GPU有就有多大产!

美光于2020年9月宣布推出基于GDDR6X内存颗粒的超带宽解决方案产品,英伟达在高性能旗舰卡GeForce RTX 3090和GeForce RTX 3080 GPU中首次搭载了该显存颗粒。

GDDR6X与英伟达GeForce RTX 系列GPU的搭配引领了最先进的图形处理设备,榨干了我们的想象力,也榨干了玩家们钱包!

▲ GeForce RTX 3080 Ti + GDDR6X 12GB显存颗粒

▲  醒目的32GB GDDR6X喊着玩家快点打钱!







芯动率先推出商用GDDR6/6X combo IP

为全球智能芯片提供加速服务

作为数据交换基础的GDDR技术对于智能芯片发展重要性不言而喻。自动驾驶、人工智能、游戏引擎等产品需求呈现井喷式增长,而与之配套的GDDR6/6X高带宽接口技术因为太过复杂、工艺先进,在商用IP市场上的选择并不多。

因此,GDDR6/6x显存技术的发展需要颗粒厂商,IP技术公司和智能芯片公司共同的推动。

2021年美光和芯动共同开发推出首个硅验证GDDR6/6X Combo IP,为更多的芯片公司提供了GDDR6/6X的高带宽核心技术!

美光表示这个 IP 改变了人工智能的版图!

芯动科技的GDDR6/6X PHY和Controller IP 基于14纳米工艺,应用PAM4信号技术,单pin速率高达 21 Gbps,256 位宽度,系统带宽超过5Tb/秒,满足了众多高带宽热门应用,如图像处理,游戏引擎、信号分析和人工智能等。

▲ 全球首个商用GDDR6/6X Combo IP量产

▲ 21Gbps GDDR6X PAM4 DQ眼图

▲ GDDR6 WCK眼图 15GHZ

▲ GDDR6 DQ眼图5Gbps

芯动科技也成为实现从GDDR5到GDDR6X全覆盖的IP厂商,GDDR6X这个节点更是成为第一款商用量产IP,为全球广泛高性能芯片公司提供了重要的接口技术!







GDDR6/6X Combo IP技术解读

  • PAM4信号技术

▲ PAM4信号技术框架-有4个相位-单cycle发送2bit信息

▲ QDR技术实现了每个时钟采集4个信号,满足PAM4的信号速率要求

  • GDDR6和GDDR6X架构图对比

▲ GDDR6和GDDR6X的结构对比(请注意时钟和数据采样的倍频关系)

GDDR6X和GDDR6最大不同的地方在于数据通道利用PAM4技术实现4倍的取样速率,实现21Gbps的单端速度。

▲ GDDR6X-时钟频率和PAM4的倍频关系







主要的技术难点

  • PAM4的信号要求高速采样速率

▲ 低电压带来功耗优势,但是对信号提出苛刻的要求

为了满足高带宽要求,GDDR6X将核心频率设定为2.5GHZ,对比传统DDR5(400~800MHZ核心频率),为了实现预取的数据取样要求,换算2.5G x 16预取 ÷ 2 (PAM4) =20Gbps,于是I/O速率必须大于20Gbps才能完成采样。

GDDR6/6X的VDDQ电压1.25/1.35v、速率16~21Gbps高速信号,对内部高速缓存、IO(125~135pins)的设计、走线、封装都提出了极为挑剔的要求,任何微小的噪音在经过衰减路径之后,都将导致信号眼图无法张开。

▲ GDDR6(8Gbps)和GDDR6x PAM4(16Gbps)的DQ眼图对比

  • 超低电压对先进晶圆工艺的要求

▲ FinFet工艺对IP的设计有着极高的要求

GDDR6/6X IP速率高,电压幅值低,必须使用先进FinFet工艺,先进工艺的验证成本高,单次流片要200~300万美元,设计收敛规则复杂,测试设备和成本高昂,对研发团队的经验有极高要求。







芯动提供整套技术打包方案

除了GDDR6/6X Combo PHY+Controller本身,设计企业仍然面临着复杂的布线、封装等问题,在量产之前每一个技术点都有风险,对此,芯动提供打包的一站式方案。

芯动提供IP配套的IO走线、封装设计、PCB板级参考、信号完整性分析等,大大降低了用户的风险和集成时间,真正一站式将全球领先的GDDR6/6X技术部署到SoC中,实现超大带宽的内存访问。

▲ PCB走线参考方案

▲ 信号完整性分析-返回损耗和插入损耗







结语

芯动在先进工艺IP有着大量的量产和验证经验,从DDDR5/4/3/2到LPDDR5/4/3/2,以及领先的GDDR5/5X、GDDR6/6X、HBM3、Innolink Chiplet、32/56G Serders等等,芯动率先投入了巨大的研发力量进行量产验证,为广泛的高性能SoC提供了高速接口方案,为全球高性能芯片提供加速服务!

▲ HBM3 6.4Gbps高速眼图

▲ 全球首个GDDR6/6X Combo IP量产

32/56G SerDes眼图(支持PCIE5/SATA/USB3.0/SGMII/MIPI等高速协议)

▲ 风华1号应用Innolink Chiplet,GDDR6/6X 等先进接口IP

这些先进IP在技术层面互相依赖、相互关联,每一项单独拿出来在市场上都是独步领先的技术,更可贵的是以上的实物图可不是PPT产品,是16年来芯动团队在CEO敖海先生的带领下持续投入、专注研发、长期耕耘的收获,在当下浮躁的资本炒作造芯环境下显得尤为可贵。

▲ 芯动科技CEO敖海先生

芯动的先进IP技术,一方面引领行业技术创新,塑造半导体企业的全球化长远发展视野,另一方面满足高性能芯片的市场需求,助力高端芯片发展,脚踏实地发展创新技术!

▲ 丰富的应用场景

芯动16年来重兵投入全球先进工艺、专注高端IP研发,在高性能计算平台、多媒体终端&汽车电子平台、IoT物联网平台等应用领域打造了核心优势,超过200次的流片记录、逾60亿颗授权量产芯片、10亿颗以上高端定制SoC量产,默默耕耘、脚踏实地,为赋能高端芯片做出重要贡献!


FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论 (0)
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 146浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 39浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 31浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 95浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 124浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 117浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 68浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 88浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 42浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 44浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦