本文来自“AMD:算力帝国的挑战者(2024)”。AMD 成立于 1969 年,是全球先进的微处理器厂商,产品包含 CPU、GPU、FPGA 等,业务涵盖数据中心、嵌入式系统、游戏等多个方面。AMD 共有数据中心、客户端、游戏及嵌入式四大业务板块。
1)数据中心业务:利用 CPU、GPU、FPGA、DPU、SoC 等芯片产品为客户提供先进的数据中心解决方案。近年来随着 AI 行业的快速发展,数据中心业务成为公司重点布局方向。2022 年公司通过收购赛灵思及 Pensando 完善数据中心芯片布局,23Q1 推出高性能的 MI300 GPU 加速器,对英伟达形成强有力的竞争。
2)客户端业务:为笔记本电脑、台式电脑、商业工作站等提供 CPU 和 APU 产品。AMD 在 1000 年推出 Athlon 处理器,进入高端处理器市场,并在 2023 年推出首个与 X86 兼容的 64 位处理器,助力公司市场份额提升。2005-2017 年 AMD受限于 CPU 架构,产品与 Intel 的差距逐渐拉大,而 2017 年公司推出的第一款Zen 架构处理器帮助公司夺回客户端市场份额。
3)游戏业务:产品包括台式机和笔记本电脑 GPU,游戏机及半定制 Soc。2022年 AMD 发布 Radeon RX 7900 系列显卡,是全球首款采用先进的 AMD chiplet设计的游戏显卡。
4)嵌入式业务:面向较为广泛的市场,产品包括自适应的 SoC 及 FPGA,嵌入式CPU 和 GPU 等。AMD 的嵌入式业务收入主要来自对赛灵思的收购,2022 年一季度 AMD 对赛灵思完成收购,该板块业务的下游市场主要涵盖航空航天、工业、汽车、消费电子、通信和数据中心等。
下载链接:
AMD:算力帝国的挑战者(2024)
算力设施产业图谱研究报告(2024)
2024年大模型应用实践报告
2024年AI发展状况:采用AI面临的挑战和组织成功的关键策略
服务器行业深度报告:AI和“东数西算”双轮驱动,服务器再起航
AI时代的3D内容生产工具
复盘与未来推演(AI应用):追本溯源之后,我们相信什么?
深度研究:量子计算:人工智能与新质生产力的“未来引擎”
多模态,AI大模型新一轮革命
2024前沿人工智能安全的最佳实践
人工智能大模型工业应用准确性测评
2024 AI智算产业趋势展望分析报告
边缘智能:铺平人工智能的“最后一公里”
泛半导体产业黑灯工厂发展研究洞察白皮书
PCIe标准的演进和测试要求
《英伟达GTC 2024技术汇总》
1、英伟达GTC 2024主题演讲:见证AI的变革时刻
2、展望GTC变革,共享AI盛宴
英伟达GTC专题:新一代GPU、具身智能和AI应用(精华)
2024年策略:AI鼎新,与时偕行
1、AMD 凭借架构的持续迭代,打入高端 CPU 市场
Zen 架构带领 AMD 进入高端 CPU 市场,正式与 Intel 开启竞争。AMD 在2017 年以前的 CPU 架构为推土机(Bulldozer)架构系列,该架构在 2011 年首次发布,并在 2012 年、2013 年以及 2015 年分别推出了名为打桩机(Piledriver)、压路机(Streamroller)和挖掘机(Excavator)的更新版架构。在推土机架构时代,AMD 的 CPU 和英伟达产品性能相去甚远,采用“价格战”的方式维持市占率,但在 2017 年 Zen 架构推出以前,AMD 在客户端 CPU 市场份额仍在逐年下降。
Zen 架构的推出,使得 AMD 的 CPU 性能大幅提升,正式与 Intel 同台竞技。Zen 架构的研发始于 2015 年,2017 年发布首款基于 Zen1 架构的锐龙一代处理器,采用格罗方德 14nm 工艺和更加主流的 SMT 多线程,CCX 内有四个 x86核心,每个核心都有独立的 L1 和 L2 缓存,单个模块共享 8MB L3 缓存,性能相较上一代产品提升 40%。此后 AMD 稳扎稳打,连续推出后续更新版架构,每一代的产品 IPC 性能均提升很多。
Zen 架构相较于上一代推土机架构的提升主要包括性能、吞吐能力、能效三个方面。性能方面,AMD 通过增强分支预测,微指令缓存等方式,增强了指令调度窗口、指令分发宽度和执行资源能力,使得 CPU 的单线程性能大幅提升。吞吐能力方面,Zen 架构采用高带宽、低延迟的缓存系统,单个核心缓存带宽最大提升5 倍;使用 AMD Hyper Transport 总线技术用于内部核心互联,提升了互联速度。能效方面,Zen 架构将制程从此前的 28nm 升级到 14nm,大大降低功耗,并提升了 CPU 频率。
Zen 架构不断更新迭代,Chiplet 成为设计的重要组成部分。Zen2 架构开始,AMD 采用 Chiplet 设计,使用小芯片作为 CPU 的处理器,每个小芯片都包含多个基于“Zen”的核心,其核心数从 2-128 不等,为消费者带来前所未有的可扩展性和灵活性。以 Zen4 架构的锐龙 7000 系列处理器为例,CPU 内部含有两个 CCD和一个 IOD,最多可以支持 16 核心,其中 CCD 为 Compute Die,用于计算;IOD 为 Input/Output Die,用于数据的输入和输出,CCD 和 IOD 之间通过 InfinityFabric 技术实现芯间的高速互联。
通过不同的 CCD 和 IOD 数量,AMD 可以实现不同客户需求的产品部署,例如 Genoa EPYC 7004 服务器的 CCD 数量达到 12个,从而增强了 CPU 的计算能力。
2、AMD CPU 产品矩阵
根据下游应用,AMD 处理器可分为服务器处理器、工作站处理器、PC 处理器等多个品类。服务器处理器主要使用霄龙 CPU 产品,可用于云计算、数据库和数据分析、超融合基础设施和虚拟化、高性能计算等多个领域;工作站处理器主要使用锐龙 CPU 产品,根据不同应用场景设置锐龙 Threadripper PRO、锐龙Threadripper、锐龙 PRO 移动处理器三个产品品类;嵌入式处理器主要使用霄龙及锐龙 CPU 产品,半定制处理器使用 ARM 多核 CPU;PC 端主要使用速龙及锐龙 CPU 产品,具有多个细分产品品类。
3、服务器:推出霄龙系列,AMD 强势回归
AMD 曾中途放弃服务器 CPU 市场,而 Lisa Su 凭借霄龙处理器,使得 AMD在服务器市场强势回归。由于投入过高,投入时间过长以及回报低等问题,AMD在 2013 年宣布退出服务器市场,AMD 在服务器市场的份额也从 2006 年最高点的 14%一路下降至 2016 年的 1%。而 2014 年伴随 Lisa Su 加入 AMD 以及 Zen架构的开发,2017 年 AMD 发布的第一代 EPYC(霄龙)处理器,公司在服务器CPU 的市场份额开始快速提升,2021 年 AMD 服务器市场份额已达到 15%。尽管受到全球经济下行的冲击,2022 年公司市场份额有所回落,2023 年公司市场份额再次同比提升 2pct,达到 14%。目前全球服务器市场基本被 AMD 和 Intel两家公司主导,而凭借霄龙处理器的强劲性能,AMD 已经基本在服务器市场站稳脚跟。
4、PC 端锐龙7000系列处理器持续迭代
PC 端处理器方面,锐龙 7000 系列处理器对标英特尔 13 代酷睿处理器,二者总体性能较为相近,AMD 在时钟频率、集成显卡、节能方面具有优势,英特尔在核心数量、性价比方面具有优势。
1)核心数量:英特尔第 13 代酷睿处理器核心数更多,酷睿 i9-13900 系列处理器核心数可达 24 个,可以确保 CPU 的稳健表现。
2)缓存:锐龙 7000 系列的三级缓存较大,最高可达 64MB,英特尔第 13 代酷睿处理器二级缓存为 20-32MB,显著高于锐龙 7000。
3)时钟频率:锐龙 7000 基础频率为 4.5-4.7GHz,显著高于第 13 代酷睿处理器。
4)集成显卡:锐龙 7000 系列的所有处理器均配备 Radeon 显卡,第 13 代酷睿处理器中有 3 个配备 Intel UHD Graphics 770 显卡。
5)热设计功率:第 13 代酷睿处理器的热设计功率为 181-253 瓦,压力条件下耗电量比锐龙 7000 系列更大。
2023 年初 AMD 发布锐龙 7000X3D 系列台式机处理器,进一步扩充高性能台式处理器产品阵容。据 AMD 官方披露,锐龙 7000X3D 处理器相比上一代性能提升 14%,具有 AMD 3D V-Cache 技术以及 AM5 插槽,是世界领先的游戏处理器,并于 2023 年 2 月上市。锐龙 7000X3D 系列产品发布进一步完善公司高性能台式处理器产品矩阵,有利于增强在 PC 端处理器的竞争力。
5、服务器端第四代霄龙处理器性能强劲
服务器处理器方面,公司在数据中心端发力,第四代霄龙处理器性能强劲。2022 年,AMD 推出第四代霄龙处理器,旨在打造高性能、高效率的数据中心 CPU。根据 Wccftech 统计,SPEC2017 整数基准下第四代霄龙处理器有多个产品测试得分在 1000 以上,显著优于英特尔可比产品至强系列 8380 及 8362 处理器;其中霄龙 9654 处理器测试得分为 1550,是英特尔至强系列 8380 处理器的 2.5 倍。
凭借出色的能效,霄龙四代处理器可帮助企业提升能源使用效率,降低成本。据 AMD 官方披露,在同时处理 1995 个虚拟化需求时,平均 5 台霄龙 9654 处理器即可满足单个企业的使用需求,而英特尔至强 8380 处理器则需要 15 台才能达到同等效果。通过使用霄龙四代处理器,企业可节省许多服务器和电力。
新型智算中心改造:网络成大模型训练瓶颈,节点内外多方案并存
量子计算:打破传统范式,通用计算应用可期
面向超万卡集群的新型智算技术白皮书(2024)
《NVIDIA BlueField系列合集》
《半导体行业深度报告合集(2024)》
《70+篇半导体行业“研究框架”合集》
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。