Intel 终于在Innovation 2023上正式揭晓Meteor Lake处理器,做为Intel在2023年下半年推出的新一代产品,采用全新核心架构、设计方法、功能和命名方式,将为笔电带来前所未有的效能和AI能力。
主流CPU处理器合集
1、Intel Xeon CPU
2、Intel IPU
3、Intel GPU
4、Intel Alderlake CPU
5、IBM Telum
6、Infineon英飞凌
7、AMD Zen3
8、AMD RDNA2
9、ARM Neoverse N2
如何看待ARM架构芯片在服务器端发展前景
服务器系列报告合集
SCM技术及趋势合集
NVM技术及趋势合集
UCIe白皮书(终版)
《海光CPU+DCU技术研究报告合集(上)》
《海光CPU+DCU技术研究报告合集(下)》
Intel Meteor Lake 处理器背景和发展 提到Meteor Lake系列处理器,Intel在2021年的IDM 2.0演讲中首次透露该系列处理器的消息,并确认它已经完成基于最新制程技术的计算模块(compute tile)的设计。随后,Intel 在各种活动中逐步揭露更多关于Meteor Lake处理器的信息和细节,例如在2022年的Hot Chips会议上展示下一代路线图,强调芯片堆叠和芯片化(chiplet)的未来。
Intel Meteor Lake 处理器背景和发展 Intel Meteor Lake 处理器芯片堆叠设计 Meteor Lake 处理器是继 Raptor Lake 处理器之后新一代产品,它不仅使用了新的工艺技术,也采用全新核心架构。同时,它也是Intel第一个完全采用芯片堆叠设计的客户端处理器,利用最新的封装技术Foveros。 作为第一代 Meteor Lake 系列处理器,玩家可以期待具备以下特性: 三重混合 CPU 架构 ( P / E / LP-E 核心) H/P 系列最多 14 个核心 (6+8)、U 系列最多 12 个核心 (4+8) Intel 4 制程节点用于 CPU,台积电用于 tGPU Intel Xe-MTL GPU具有最多128个EU 支持最高LPDDR5X-7467 和 DDR5-5200 支持最高96GBDDR5和64GB LPDDR5X容量 Intel VPU 用于 AI 推论,具有 Atom 核心 x8 Gen 5 线路用于独立 GPU (仅 H 系列) 另外,新一代Meteor Lake架构处理器仅会在笔电平台上推出,并不会推出桌面处理器版本,尽管Meteor Lake是采用新的Core Ultra形式命名,但桌面版的处理器仍是以Intel 14代作为延续。 而新的 Core Ultra 命名形式则是会以 Meteor Lake 作为第一代,后续将会在其他笔电和桌上型处理器上采用。所以,新的芯片将不再使用传统的Core i3、Core i5、Core i7和Corei9的品牌,而是改为Core 3、Core 5、Core 7和Core 9。这些变化将反映在品牌字符串、文本和产品徽章上。 Intel Meteor Lake 处理器芯片堆叠设计 在 Meteor Lake 处理器上,Intel 采用全新芯片布局,包括不同的功能模组或芯片,它们有各自不同的 IP。在大多数Meteor Lake处理器上会发现一共有四个模块,包括CPU、GPU、SOC和IOE。这四个模组都使用内部和外部的制造流程,代表有些模组是由Intel自己制造,而其他的则是由第三方厂商如台积电制造。 主要的CPU模组将使用Intel 4(7nm EUV)制程节点,而SOC模组和IOE模组则将采用台积电的6nm制程节点(N6)。tGPU 也是 Meteor Lake 处理器的重要组成部分,它是 iGPU (Tiled-GPU) 的新名称,并使用台积电的 5nm 制程节点。简单总结一下: 其中的计算模块可以在不同的核心数、核心代数、节点和缓存之间进行完全扩展。Intel 不仅可以在其 Foveros 3D 封装处理器中混合和匹配不同的核心架构,还可以向上或向下扩展到不同的节点。而图形模块也可以在核心数、节点和缓存方面进行扩展。 SOC 模块也可以根据 SKU 的不同而向上或向下扩展,此处主要是低功耗 IP (指 VPU)、SRAM、IO 和可扩展的电压设计。最后一个模块是I/O扩展器,或简称IOE,该模块在通道数、带宽、协议和速度方面都可以完全扩展。 这些图表虽然只是用于说明目的,但它们显示一个 tGPU 区块从 4 个 Xe 核心 (64 EUs) 扩展到 12 个 Xe 核心 (192 EUs) 的特点。此外,根据同一张图片中的芯片拍摄,可以看到8个Xe核心(128 EUs),这8个Xe核心包括前述的128个矢量引擎、2个几何管线、8个采样器、4个像素后端和8个光线追踪单元。每个Xe核心都包含16个256位的矢量引擎和192KB的共享L1快取。 介绍完各个模块之后,就到了封装阶段,为此,Intel 展示了 CPU 芯片是如何排列在一起的。最上层有一个背面金属化层,也是 Foveros 被动芯片所在的地方,而其下层则是刚刚讨论过的模块,这些模块使用 36um 间距 (芯片对芯片) 的互连连接到基础模块。基础模块具有大电容,并具有用于 IO/电源传递和 D2D 路由的金属层。 Intel 还提供基础模块金属层的特写,其中包含 3D 电容和芯片对芯片的电源传递以及封装 I/O 路由。每个金属层都是模块化的,具有用于逻辑和内存的主动硅。顶部和底部有封装凸块,用于与顶部和底部层互连。 这里显示的配置也是针对移动平台的芯片,具有6+8 (6 P-Core + 8 E-Core) 的布局,可以注意到CPU/IOE模块和图形模块之间有两个D2D(芯片对芯片)连接,导入SOC模块。这是Foveros 3D封装的一部分,Intel表示在主要的芯片上方有一个被动的互连器,它是基于Intel自己的22nm制程,这个互连器目前没有任何作用,但该公司计划未来使用更先进的封装技术以便在其中使用主动芯片。Intel Meteor Lake 处理器不使用 EMIB 技术。 Meteor Lake在新的Intel 4制程技术和优化的帮助下,能够达到比前一代Alder Lake CPU更高的最大涡轮功率,Intel展示了一个老派的比较,显示MeteorLake CPU在I/O能力方面相比HaswellCPU有多大的进步。Intel也提到价格问题,指出随着新一代晶圆价格的上涨,开发单芯片设计的成本也会增加。
最新最强的CPU/GPU核心 从前文我们已经提到,Intel Meteor Lake 的计算模组再次采用混合架构的布局,P-Core 使用全新的 Redwood Cove 架构,E-Core 则是 Crestmont。与以往一样,每个 Redwood Cove 核心都将支持 SMT,而 Crestmont 核心则不支持 SMT,这是 E-Core 的常见现象。在IPC提升方面,Intel 4制程节点本身应能带来20%的功耗比提升。 所以谈到核心本身,P-Core是针对高效能而设计的,通过提高整体芯片效率、增加每核带宽、改进性能监测单元,以及通过Intel的Thread Director改进反馈。每个 P-Core 都有 2MB ML 快取、64KB I-Cache 和 48KB Data Cache。 E-Core 部分 Intel 表示对比前一代 E-Core(Gracemont)相比有显著的提升,包括 IPC、AI 加速、增强分支预测和通过最新版本的 Intel Thread Director 改进反馈。E-Core 最多有 4MB L2 快取、32KB Data Cache(带 ECC)和 64KB 的 I-Cache。 SoC 模块中还有一个低功耗版本的相同架构 E-Core 核心,主要用于实现最大效率,而标准 E-Core 则提供高效多线程性能。 Intel 也更新了其 Thread Director 技术,它可以帮助为任何特定工作负载分配最佳核心。Meteor Lake 将通过 Thread Director 以及 Windows 中的 OS 特定优化来实现调度改进。 网友@Locuza_ 早前提供了一个Meteor Lake处理器die的解剖照(上图),里头可见Meteor Lake有2个P-Core和2个E-Core集群,共8个E-Core。每个P-Core都有3MB L3快取,而每个E-Core集群也有3MB L3快取。至于 L2 快取,Redwood Cove 架构似乎有 2MB,先前的 Gold Cove 架构则有 1.25MB,而每个 Cresmont 架构集群似乎有 3MB L2 快取。 在GPU方面,Intel将利用其Arc Alchemist图形架构Xe-LPG版本,这个芯片将在图形模组中搭载128个EU,并使用TSMC的5nm制程节点。据报道,其iGPU内显可以达到2.2GHz时脉速度,这与Alchemist桌上型版本在更高TDP下能够达到的速度相当,应该能让FP32计算性能达到4.5TFLOPs,相比于Reaptor Lake-H处理器上的Iris Xe 96 EU图形,能带来2.25倍计算能力提升。 由于AMD的RDNA GPU有不同的架构,并且以不同的方式计算FP32 TFLOPs,所以无法与之进行比较,但先前有制造商指出Intel内显效能逼近RTX 3050,看起来Intel可能会在与AMD的Radeon 700MiGPU竞争上取得领先优势。 此外,在 Meteor Lake 上搭载 Alchemist 架构也意味着将支持 DirectX 12 Ultimate 和 XeSS 等一系列功能,这些功能到目前为止只限于 Intel 桌上型 Arc 显示卡阵容。当然,也别忘了传闻中备受期待的Adamantine 快取也是一大看点,据说它将出现在一些 Meteor Lake SKU 上,最高可达 128MB 容量,这个快取对于通常缺乏带宽的内显来说是一个重大的提升。由于 Adamantine L4 快取也能被计算模块使用,因此可以带来更快的启动时间和相比于将数据移动到主 DRAM 而言更低的延迟。 Intel还展示了 Xe-LPG 图形IP各个部分性能提升的分解,大多数部分如顶点处理、三角形绘制、像素混合和计算都提升了2.1~2.6倍,但深度测试速率相比 Raptor Lake 提升了 6.6 倍。此外,由于有硬件加速光线追踪支持,这部分也能得到 2.64 倍的提升。Intel 一直在努力加强其驱动程序和软件生态系统,所有这些努力都将滚动到 Meteor Lake 上的 Xe-LPG。 而实际上来说,我们目前已经看到 7 款 SKU 信息曝光,它们都是 MTL-H 系列的一部分,拥有 14 和 12 核心的配置。 Intel Core Ultra 9 185H 似乎是目前看到最快的 SKU,拥有 14+2 核心,20+2 线绪,24MB L3快取,以及最高 5.1GHz 的加速时钟。谈到时脉,Meteor Lake作为Intel 4制程节点的第一代产品,与经过优化的Intel 7制程节点相比,势必会有一些数字下降。 但话又说回来,Intel最快的第12代Corei9-12900HK处理器在推出时也只能达到5.0GHz,而它的后继者则将时脉提高了额外400MHz(Core i9-13900HK)。所以5.1GHz以及更高的频率对于Intel 4来说是一个很好的开始,随着工艺技术和Intel EUV实现的改进,未来数字只会越来越好。 Intel 10 – Core i9-11980HK – 5.0 GHz(最高时脉)
Intel 7 – Core i9-12900HK – 5.0 GHz(最高时脉)
Intel 7 – Core i9-13900HK – 5.4 GHz(最高时脉)
Intel 4 – Core Ultra 9 185H – 5.1 GHz(最高时脉) 其余 SKU 及其相关规格如下表所示(请注意,这些规格在 Intel 正式公布之前都不是最终的)。
Intel Meteor Lake 性能预期 目前当然还没有任何正式的数字能实际测试判断,但预期 Meteor Lake 处理器在增加了新核心后,性能会有不错的提升。早前已经看到过一些曝光,其中这些芯片比现有的 Raptor Lake 处理器略快一些,而这些也都还是早期的工程样品。一旦最终的CPU和GPU性能数字开始出现,将看到更大的提升。效率也将是 Meteor Lake 处理器的一个重要优势,因为它们是围绕笔电平台设计的。 以下是最近泄漏出来的 Core Ultra 7 155H 和 Core Ultra 5 125H 基准测试结果,在多线程性能测试中,前者超过 Core i9-13900H,后者则是已超过 Core i7-13700H。 Intel Meteor Lake 正式推出时间 Intel已经确认,Meteor Lake的第一代Core Ultra家族正式发布将在12月14日。届时,这些芯片将在各式笔电厂商新品中登场,可以期待在同一时间看到规格、基准测试、各种产品等等。 1、AI大模型落地的前景和痛点,兼谈工程师架构师所面临的机会和挑战
2、AIGC驱动下高校数字化转型
3、大模型趋势下的企业数据体系思考
4、大模型时代下数据中台该何去
5、大模型重塑软件开发以及实践案例展示
6、当GPT遇到低代码低代码平台AIGC开发落地实战
7、迈向通用人工智能时代之路——边缘与管力网络演进及思考
8、网宿边缘智能平台与AIGC探索
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球) 星球下载全部资料 。
免责申明: 本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源 ,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect ”或“扫码 ”关注公众号实时掌握深度技术分享,点击“阅读原文 ”获取更多原创 技术 干货。