AMD第二代3DV-Cache的技术细节,首次曝光

FPGA开发圈 2023-03-07 12:05

来源:内容由半导体行业观察(ID:icbank)编译自Tomshardware,谢谢。



AMD 的Ryzen 9 7950X3D是地球上最快的游戏 CPU,因为 AMD 决定将其颠覆性的 3D 芯片堆叠技术引入 Zen 4,但奇怪的是在其 Ryzen 7000X3D 简报材料中,该公司没有分享有关其新的第二代 3D V-Cache 的任何细节。我们最初在最近的一次技术会议上发现了一些细节,并将其纳入了我们的评测中。


现在 AMD 终于回答了我们的一些后续问题并分享了重要的新细节,包括 chiplet 仍然采用 7nm 工艺,现在有一个峰值带宽高达 2.5 TB/s,而第一代 3D V-Cache 的峰值带宽为 2 TB/s(还有许多其他新信息)。我们还有 AMD 用于其 Ryzen 7000 处理器的新 6nm I/O 芯片的新图片和图表。


AMD 已经转向其 3D V-Cache 的第二代,而英特尔没有与之竞争的技术。这确保了 AMD 在游戏和某些数据中心应用程序的最佳 CPU方面获胜。


总体而言,AMD 的第二代 3D V-Cache 技术比第一代技术向前迈出了令人印象深刻的一步,因为它允许公司利用现在成熟且成本较低的 7nm 工艺节点来提升其尖端 5nm 计算的性能die。新设计代表 AMD 将基于小芯片的设计方法的关键优势——使用旧的、更便宜的工艺节点与昂贵的新工艺技术相结合——进入三维。


现在,我们详细介绍其细节。



首先,快速进行高级复习。正如您所看到的,AMD 的 3D V-Cache 技术将一个额外的 L3 SRAM 芯片直接堆叠在计算芯片 (CCD) 芯片的中心,以将其与发热核心隔离开来。该缓存将配备 3D V-Cache 的小芯片的容量提高到 96MB,从而提高对延迟敏感的应用程序(如游戏)的性能。



我们直接从 AMD 和 2023 年国际固态电路会议 (ISSCC) 收到了有关第二代实现的新信息,AMD 在会上介绍了 Zen 4 架构。


AMD 的上一代 3D V-Cache 使用堆叠在 7nm Zen 3 CCD 之上的 7nm L3 SRAM 芯片。AMD 坚持为新的 L3 SRAM 芯片(称为“L3D”)采用 7nm 工艺,但现在将其堆叠在更小的 5nm Zen 4 CCD 之上(见下表)。但是,这会造成尺寸不匹配,需要进行一些改动。



首先,AMD 使 7nm SRAM 芯片更小,因此与上一代的 41mm2相比,它现在的尺寸为 36mm2 。然而,晶体管总数保持不变,约为 47 亿,因此新芯片的密度明显高于第一代小芯片。


正如我们在第一代 SRAM 小芯片上看到的那样,7 纳米 L3 SRAM 小芯片具有令人难以置信的晶体管密度——我们看到的密度几乎是第一代 7 纳米计算小芯片的 3 倍,而且令人惊讶的是,7 纳米 SRAM 小芯片的密度明显高于第一代 7 纳米计算小芯片。5nm 计算小芯片。这是因为,和以前一样,小芯片使用专门用于 SRAM 的密度优化版本的 7nm。它还缺少缓存中的典型控制电路——该电路驻留在基础芯片上,这也有助于减少延迟开销。相比之下,5nm 芯片包括几种类型的晶体管以及数据路径和简化的 L3 SRAM 芯片中不存在的其他类型的结构。


和以前一样,额外的 L3 SRAM 缓存带来的额外延迟为 4 个时钟,但 L3 小芯片和基础裸片之间的带宽增加到 2.5 TB/s,比之前的 2 TB/s 峰值提高了 25%。


堆叠的 L3 SRAM 小芯片通过两种类型的硅通孔(TSV——垂直电连接)连接到基础芯片。功率 TSV 在小芯片之间传输电力,而信号 TSV 在单元之间传输数据。


在第一代设计中,两种类型的 TSV 都位于基础小芯片的 L3 区域。然而,由于 5nm 工艺密度的增加,基础芯片上的 L3 缓存现在更小了,即使 7nm L3 SRAM 小芯片更小,它现在也与 L2 缓存重叠(上一代仅与基础上的 L3 重叠死)。因此,AMD 不得不改变基础芯片和 L3 SRAM 芯片中的 TSV 连接。



由于基础芯片上 5nm L3 缓存的尺寸较小(密度增加和其他因素的结果),AMD 不得不将功率 TSV 从 L3 扩展到 L2 区域。对于基础裸片,与旧的 7nm 基础小芯片相比,AMD 在 L3 缓存、数据路径和控制逻辑上实现了 0.68 倍的有效面积扩展,因此 L3 缓存中 TSV 的物理空间更小。


信号 TSV 保留在基础芯片上的 L3 缓存区域内,但 AMD 通过应用从第一代设计中学到的知识以及 DTCO 改进,将 L3 缓存中的 TSV 区域缩小了 50%,以减少新接口设计中的开销电路。



AMD 的 3D 芯片堆叠技术基于 台积电的 SoIC 技术. 台积电的 SoIC 是无凸块的,这意味着它不使用微凸块或焊料来连接两个芯片。AMD 告诉我们,它使用了相同的基本键合工艺,并结合了持续的工艺和 DTCO 改进,但最小 TSV 间距没有改变。


L3 SRAM 小芯片也与 CPU 内核保持在同一电源域,因此无法独立调整。这有助于降低配备缓存的小芯片的频率,因为电压不能超过 ~1.15V。


AMD 的 ISSCC 演示文稿还包括大量有关 Ryzen 7000 和 EPYC Genoa 处理器中使用的 6nm I/O 芯片 (IOD) 的新细节。在上面的相册中,您可以看到放大的图像和来自芯片侦探@Locuza_的带注释的die shot。



我们将规格放在表格中以便于比较,如您所见,与 Ryzen 7000 变体相比,EPYC Genoa I/O Die 非常庞大 — 这是因为 AMD 可以将多达 12 个计算小芯片 (CCD) 连接到 I /O 用于其EPYC Genoa处理器。



相比之下,消费类芯片仅限于两个小芯片,这是一个不可改变的限制,因为正如您在 Locuza 的图表中所见,Ryzen 7000 I/O Die 只有两个全局内存互连 2 (GMI2) 链接,将计算小芯片连接到IOD。真可惜——具有四个 CCD 的较低内核数 Genoa 模型可以具有双 GMI3 链接(宽模式),这是一种新功能,可以在某些内存吞吐量密集型任务中提供优势。将其添加到消费芯片中会很有趣。


附:AMD在ISSCC上的完整PPT






FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论 (0)
  •        传统语音芯片在复杂场景下的高功耗问题长期困扰行业。以某主流智能音箱为例,其待机日均耗电0.05度,年耗电量超18度,相当于一盏5W LED灯全年耗电量的3.6倍。思必驰TH1520芯片通过双核DSP架构与40nm先进制程的协同创新,将典型场景功耗压缩至15-80mW,仅为行业平均值的1/5,成功破解了这一难题,并在美的空调、小鹏P7等产品中实现商用落地。       双核DSP架构的分工与协作是TH15
    中科领创 2025-03-11 15:07 157浏览
  • J599系列光纤连接器的特点标准J599 III系列光纤连接器、J599 A8系列光纤连接器和J599 A6系列光纤连接器均具有相同的符合GJB599B标准规定的插座法兰尺寸。其中,J599 A8系列光纤连接器和J599 A6系列光纤连接器可提供APC的端面类型,其插入损耗和回损损耗性能更优。J599系列光纤连接器的未来发展方向随着国内光纤通信技术的日趋成熟,光纤处理工艺水平的不断提高,以及对光纤连接器需求的多样化,J599系列光纤连接器正在向低损耗、高密度、高可靠方向发展。中连讯科J599 I
    用户1741596356358 2025-03-11 14:24 101浏览
  • 质量管理体系可以依公司场址所有产品与服务过程管理,输入与输出活動來推行使用,例如电动自行车产业包括一阶委外加工供应商、客供品管理、风险管理与质量一致性车辆审验作业等。中小企业要确保组织质量系统的程序及政策得以落实。有效的执行质量保证责任,以满足客户的需求,成公司的目标质量政策,需制文件程序化。质量管理体系定义落实公司质量管理而建立的组织架构、工作职责、作业程序等并将其文件化管理。一般中小企业质量系统依据当地政府法令与ISO国际标准规范要求,以追求客户满意需求过程导向、公司的质量政策制定的。其文件
    优思学院 2025-03-11 11:25 95浏览
  •        记得二十多年前,年轻的我刚入行,加入了当年的全球最大的企业也是医疗器械的龙头老大,在企业内医疗器械分公司业务被誉为“皇冠上的宝石”,在他众多的卓越分公司中熠熠生辉格外耀眼。而当年年轻的我就加入了行业中的“黄埔军校”中茁壮成长,开始了追梦(也是噩梦)之旅,工作中得知该公司工程师在美国很受尊敬,路上出示工作证连警方都会优先放行。而在国内的工作让我深切感受到了一辆跑车是如何奔驰在崎岖不平的山路上,感恩这些年来祖国变的富强,建设出了条条康庄大道。风流
    广州铁金刚 2025-03-12 12:09 96浏览
  • 随着全球对光伏、风电等可再生能源需求的持续增长,在全球能源转型的浪潮中,储能技术凭借着可平衡能源供需、提高能源利用效率等优势,已成为实现 “双碳” 目标的核心支撑。据国家能源局公布数据显示,截至2024年底,我国新型储能装机规模突破7000万千瓦,约为“十三五”末的20倍,比2023年底增长超过130%,市场前景持续向好。目前,储能系统正朝着高电压(1500V+)与长寿命(≥10 年)等方向稳步演进,然而,愈发高压化、复杂化的储能系统亦面临着严峻的安全挑战。例如,储能电池组与控制电路的直接连接可
    华普微HOPERF 2025-03-12 11:16 55浏览
  • 行车记录仪存储卡现状描述行车记录仪作为现代驾驶中的重要安全设备,其记录的视频资料在关键时刻往往能起到至关重要的作用。然而,许多车主在使用行车记录仪时,经常会遇到存储卡提示需要格式化的情况。这一提示不仅让车主们感到困惑,更可能让他们担心行车记录仪的数据安全问题。行车记录仪存储卡提示需要格式化,意味着存储卡上的数据可能无法被正常读取,或者存储卡本身存在某种故障。这种情况下,行车记录仪可能无法继续录制新的视频,而原有的视频资料也可能面临丢失的风险。分析行车记录仪存储卡提示需要格式化怎么办当行车记录仪存
    172林 2025-03-12 14:00 99浏览
  • CS5228 是一款单端口 HDMI/DVI 电平转换 / 中继器,具有重新定时功能。它支持高达 6.0 Gbps 运行速率的交流和直流耦合输入T-MDS 信号,具备可编程均衡和抖动清理功能。它包含 TypeC双模式 DP 线缆适配器寄存器,可用于识别线缆适配器的性能。抖动清理 PLL(锁相环)能够消除输入抖动,并完全重置系统抖动容限,因此能更好地满足更高数据速率下 HDMI 抖动合规性要求。设备的运行和配置可通过引脚设置或 I2C 总线实现。自动断电和静噪功能提供了灵活的电源管理。2. 特性
    QQ1540182856 2025-03-11 15:35 84浏览
  • 随着科学技术的不断发展,触摸芯片在我们的生活中开始扮演着越来越重要的角色,大到工业设备,小到家用电器中都能找到它的身影。相信大家都很好奇触摸芯片到底是怎样一个神奇的存在呢?那我们今天就来一探究竟。要了解触摸芯片,首先我们要知道触摸芯片的定义。触摸芯片是一种感知人机交互的电子元器件,一般分为电阻式和电容式两种触控技术,目前市场上大部分触摸芯片是基于电容式触控感应技术的触摸芯片。我们就以此为例来说明。<iframe height=340 width=100% allowscriptaccess
    ICMAN 2025-03-12 09:37 81浏览
  • 在捷配PCB板厂的官网计价页中,材料选择难住了很多新打板的工程师,接下来就提供一些疑问解答:一、PCB 原材料有哪些?PCB 制造需要诸多原材料,对于 PCB 厂家而言,这是生产的基础要素。其中包括覆铜板、绝缘金属基板、半固化片、铜箔、阻焊油墨、丝印油墨以及一些化学药剂等。在柔性 PCB 制造时,原材料则有聚酰亚胺和聚酯柔性覆铜板、覆盖膜、胶粘剂、电磁屏蔽膜,有时还会用到钢板或 FR - 4 作为补强材料。 二、原材料在 PCB 成本中的占比情况如何?原材料成本在 PCB 运营成本中所
    捷配科技 2025-03-12 09:16 105浏览
  • 故障现象一辆单电机,前驱的纯电动汽车。方向盘往一边打死过弯,急加速下,听到底盘传来“呜呜”声。在车内能听到,但不算太明显,要仔细听才能听到。类似轴承的声音,车速在30~40km/h下也能重现。故障诊断初步判断根据故障现象的描述,初步怀疑可能的故障点是:1) 左边轮胎的轴承响2) 右边轮胎的轴承响3) 中间的减速器响4) 驱动电机响为了更精确地定位故障,我们使用虹科Pico NVH异响设备来捕捉故障出现时的实时振动和声音数据,用数据说话!设备连接与探头布置如图1,将四通道分别通过四个NVH接口盒与
    虹科Pico汽车示波器 2025-03-12 13:35 115浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦