这两年,Intel越来越“超前”,以往新一代产品发布才会公布的诸多技术细节,都会提前几个月公诸于世。在今天的年度架构日活动上,Intel就公布了Alder Lake 12代酷睿的架构、技术细节。
第一篇先来看12代酷睿的整体设计、技术特性、大小核调度,之后我们会单独分析大核心、小核心的架构设计。
Intel此前的Lakefield处理器第一次采用了大小核混合架构设计(Intel Hybrid Technology),但只是一次试水之作,12代酷睿才是真正的起点。
其中,大核心叫做“性能核心”(Performance Cores),或者“P核心”(P-Cores),Golden Cove架构,最多8核心16线程,AVX-512指令集、DLBoost深度学习加速也只有大核心才支持。
小核心则叫做“能效核心”(Efficiency Ccores),或者“E核心”(E-Cores),Gracemont架构,最多8核心8线程,对不支持超线程。
为了解决大小核调度问题,Intel发明了新的“Thread Director”(线程调度器),并与微软全力合作,搭配Windows 11的任务调度器,将合适的负载分配给不同核心、线程。
12代酷睿都嵌入了一个微控制器,负责监视每个线程的性质和性能需求,衡量其载入、存储、分支、内存访问延迟、指令类型等,然后报告给Windows 11系统调度器,由后者结合运行环境,将此线程分配到最合适的核心。
Intel宣称,该技术可以在最短30微秒的时间里确定一个线程的性质、归属,而传统的系统调度器需要上百甚至几百微秒,还可能分配错误。
另外,Thread Director还会针对性地优化频率,尤其是在移动端,保证效率的同时还能提高能效,而且可以在微秒级别调整频率。
Windows 10呢?自然不会有Thread Director,只有一个基础版的Intel HGS(硬件指引调度),具体细节不详,但效率肯定不会高到哪里去。
Linux呢?Intel说目前的优化重点是Windows 11,也会和业界合作对Linux内核进行优化,但需要时间。
12代酷睿将有三种封装版本:
一是桌面高性能版的LGA1700独立封装,也就是S系列,最多8大8小16核心24线程,核显最对32EU单元,功耗最高125W;
二是移动低功耗版的BGA Type3整合封装,也就是UP3系列,尺寸50×25×1.3毫米,最多6大8小14核心20线程,核显最多96EU单元,功耗12-35W(此前曝料还有45/55W);
三是超低功耗版的BGA Type4整合封装,也就是UP4系列,尺寸28.5×19×1.1毫米,最多2大8小10核心12线程,核显最多96EU单元,功耗可以低至9W。
三种版本除了核心规模不同,本质上相同的,多个IP模块也是通用的,比如都集成新一代GNA 3.0高斯神经加速器,执行AI加速。
不过,IPU(图像处理器单元)、雷电4、Wi-Fi 6E都是移动端才有,其中UP3系列支持四个雷电4端口,UP4系列则是两个。
三级缓存增至最大30MB,而现在的11代移动版最多24MB,桌面版则是只有16MB。
内存方面,桌面版同时支持DDR5-4800、DDR4-3200、LPDDR5-5200、LPDDR4X-4266,而且所有版本都是同时支持四种内存,硬件层面没有区别,因此在一些迷你机平台上,应该会看到直接搭配LPDDR5/4X。
此外,还会支持内存的动态电压频率缩放,并强化超频。
但是,移动端的内存支持规格没有公开,估计和桌面版差不多。
PCIe连接方面,桌面版处理器会支持16条PCIe 5.0、4条PCIe 4.0,配套的芯片组(Z690)则最多支持12条PCIe 4.0、16条PCIe 3.0。
这一次Intel可是极为慷慨了,尤其是在PCIe 4.0上被对手抢先,终于扳回了一局,即便是PCIe 5.0全部给显卡,也可以同时搭配最多四块顶级SSD。
内部互连方面,12代提供了三种高速通道。
一是Compute Fabric,主要连接CPU核心、高速缓存,带宽可达惊人的1TB/s,并支持动态缓存优化。
二是Memory Fabric,连接内存和其他模块,带宽最高204GB/s,支持动态位宽和频率。
三是I/O Fabric,用户输入输出,最高带宽64GB/s,正好对应PCIe 5.0 x16,支持基于需求的实时带宽控制。
不过,内存带宽有点疑问:12代酷睿支持128-bit内存位宽,可以做到四个32-bit DDR5通道,而要想达到204GB/s的带宽,必须支持到DDR5-12750的高频率,但实际只有DDR5-4800,一半都没有。暂时还不知道Intel是如何算出这个带宽数字的。
Intel即将发布Alder Lake 12代酷睿,但后续几代产品也早都排上了号,比如13代就是Raptor Lake,将继续Intel 7工艺、大小核架构。
12代酷睿最多8个Golden Cove大核心、8个Gracemont小核心,13代则将大核心架构升级为Raptor Cove,最多还是8个,小核心架构延续Gracemont,最多翻番至16个。
这样一来,13代酷睿将有最多24个核心、32个线程(只有大核心支持超线程)。
今天,网上传出一份Rocket Lake-S桌面版的产品布局路线图,证实了上述猜测。
i9系列正是8大16小24核心32线程,集成多达36MB三级缓存、32个核显单元,热设计功耗125W、65W、35W三个档位,按惯例会分别叫做i9-13900K/KF、i9-13900/F、i9-13900T。
i7系列砍掉8个小核心、6MB三级缓存,其他延续i9的规格。
i5系列仍然是最复杂的,大部分是6大8小14核心、24MB三级缓存、32核显单元,也有一些会继续砍到6大4小10核心、21MB三级缓存、24核显单元。
i3系列都是只有4个大核心,12MB三级缓存,核显单元还是32个,甚至超过部分i5。
奔腾系列仅有2个大核心,6MB三级缓存,核显单元也减半至16个,但是架构上可能不是最新的。
据称,Raptor Cove架构将会将进一步改进性能、功耗、IPC(每时钟周期指令数)、频率,并扩大二级缓存容量,睿频加速频率可进一步提升200MHz而达到创纪录的5.5GHz,拥有无可比拟的单核心性能领先优势(多核心就不争了)。
GPU架构不详,估计和12代一样,还是Xe架构的12.2代版本。
Raptor Lake-S桌面版将有三种不同的原生芯片:
最大的是8大16小核心,仅用于i9系列。
中间的是8大8小核心,用于i7、i5系列。
最小的是6个大核心,没有小核心,但比较奇怪,布局图中没有这样的产品规格,难道i3、奔腾系列天然就是阉割版?