笔记本处理器这几年的竞争特别有意思,2017年AMD的初代Zen架构发布,同年Intel将移动版八代酷睿处理器的核心数目翻倍。随后,移动版十代酷睿的微架构、制造工艺双双升级,十一代酷睿的核显性能再上新台阶,今年下半年的十二代酷睿眼见着就要上大小核“混合”架构了。从没见Intel这么努力过,但即便如此,苹果去年发布的M1芯片又为这场战役开辟了新战场……

简单谈谈十一代酷睿(选读)

本文选读部分再花点笔墨,简单谈谈移动平台十一代酷睿。十一代酷睿移动处理器的代号名为Tiger Lake。这代处理器主体上有三个关键词:10nm SuperFin制造工艺、CPU采用Willow Cove架构、GPU核显是Intel最新的Xe。其他组成部分还包括I/O支持PCIe 4.0、雷电4、LPDDR5,还有升级版的AI能力(Gaussian Neural Accelerator)等。

(1)10nm SuperFin工艺

Intel的10nm SuperFin工艺,仔细算起来应该是Intel的第三代10nm工艺了(也可能是第四代)。如果昙花一现的Cannon Lake不算的话,那么也已经是第二代。初代10nm工艺,此前我撰文详细介绍过;新一代的10nm SuperFin应该算是Intel 10nm工艺的真正成熟版。

 

 

一个重要的依据是,十代酷睿(Ice Lake)虽然IPC有着15%-20%的提升,意即同频性能相比再上一代酷睿(Whiskey Lake)有15%-20%的提升。但十代酷睿的频率(主频与睿频)却降了10%-20%,大约在4.2GHz左右,故IPC性能提升就被抵消了,虽然理论上会更省电。十代酷睿频率降低,很大程度上与当时的10nm尚不成熟有关。

Tiger Lake的CPU就再次回到了5.0GHz的水平,这表明10nm SuperFin起码应付高频率已经没问题了。不过其产能可能仍是问题,毕竟很快要发布的桌面版十一代酷睿Rocket Lake,仍会延续14nm工艺。有关10nm SuperFin的具体改进,我会在后续的文章中详细介绍。本文主要来谈谈Willow Cove架构和Xe核显。

(2)Willow Cove处理器核心

Willow Cove也就是目前十一代酷睿移动版处理器的CPU架构。Intel宣称,Willow Cove比上一代(Sunny Cove,十代酷睿)的性能提升了10%-20%。事实上,Willow Cove和Sunny Cove的微架构设计基本上差不多,包括分支预测器、解码、ROB、TLB、后端执行、load/store等。这两者的差异,除了10nm SuperFin工艺带来更高的频率(以及可能同频更省电),还包括:L2、L3 cache更大,以及CET(控制流强制技术)。

Willow Cove的最重要微架构变化,应该主要来自cache架构调整。其中Sunny Cove的L2 cache为包含式512KB 8-way,而Willow Cove的L2 cache变成了非包含式1.25MB 20-way。cache size的提升,是能够显著提升缓存命中率的。当然尺寸加大,也会增加访问时延。

 

包含式(inclusive)的意思,就是指L1 cache中的每一行内容,在L2 cache中都有相同的一份。而非包含式就是两级cache没有这种关系,不过也因此实现缓存一致性原则就需要有额外的晶体管实施,也就需要额外的芯片面积,并可能带来一定的功耗影响。

这一代CPU的L3 cache部分提升到了12MB,增大了50%;只不过关联性从16-way 8MB变成了12-way 12MB。L2、L3 cache的这种调整应该能够带来IPC的小幅提升,功耗、面积的提升则可能会因10nm SuperFin的工艺改进而填平。

除了Cache变化,Willow Cove的另一个加强就是CET(Control-Flow Enforcement Technology,控制流强制技术)。这属于处理器安全方面的调整,用于抵御返回、跳转式的恶意攻击,通过page追踪实现返回地址保护;还有Indirect Branch Tracking(间接分支追踪)来抵御错误的跳转/调用目标。

CPU外围还有一些变化,主要是存储子系统——如前文所述开始支持LPDDR5-5400。不过现有主流实施普遍都是DDR4-3200、LPDDR4X-4266,也就是内存带宽有提升。而且Tiger Lake整个芯片上开始采用双向的双ring互联,这对内存敏感型应用场景应该也是有价值的。

(3)Xe GPU核显

十代酷睿的Gen11核显相比Intel此前的处理器,在性能上实则已经有个显著飞越了。无奈市面上的竞争对手都越来越彪悍,所以十一代酷睿的Xe-LP架构核显更上了一层楼。如果不考虑系统设计中内存带宽的限制,Xe可以说是目前性能最强悍的核显(可能需要排除苹果M1)。Xe-LP同等电压下可以达到远高于上一代Gen11核显的频率,这和10nm SuperFin工艺当然也是分不开的。

 

有关Xe的详情,未来我也有计划独立撰文。Xe是Intel 2018年宣布的一种GPU架构产品,大方向包括3种不同的微架构,Xe-LP(集成和入门级独立GPU)、Xe-HP(狂热爱好者、数据中心)和Xe-HPC(HPC集群)。所以移动版十一代酷睿集成的就是Xe-LP GPU。

原本十代酷睿的Gen11核显包含了64个EU(执行单元)。每个EU有2组4-wide ALU,其中一组面向FP/INT,另一组针对FP/Extended Math型计算。Xe-LP架构中,每个EU现有10个ALU(8+2),其中8个ALU支持2xINT16和INT32数据类型运算,有个新的DP4a指令可加速INT8 inference工作。Tiger Lake的Xe-LP GPU总共有96个EU。

Xe-LP的每2个EU共享一个单线程的控制模块,可做合作任务的分派。16个EU构成一个所谓的subslice,根据性能需求,这些subslice可按需增加。与上一代的差别在于,每个subslice都有独立的L1数据和纹理cache,像素后端每2个subslice每周期跑8个像素。另外Xe-LP有独立的16MB L3 cache,连接到memory fabric的接口部分带宽翻倍。

 

从实际情况来看,Tiger Lake之上的Xe算力表现靠谱,不过会较大程度受制于数据传输带宽。从现有十一代酷睿超级本的实际游戏体验,与跑分的差异能够看得出来——所以Xe应用于Tiger Lake感觉略有些匆忙。这个问题理论上会在十二代酷睿Alder Lake上得到解决(更高的内存频率)。

有关Xe核显另外值得一提的是,它开始正式支持AV1解码加速,其他一些流行的codec也有编解码带宽的翻倍,即硬解8K 60fps支持,“12bit端到端视频管线”。而在显示支持部分,Tiger Lake扩展至4条4K显示管线:Display Port 1.4、HDMI 2.0、雷电4、USB 4 Type-C四输出同时到位。

所以前文中提到Intel嘲讽M1在显示输出方面的表现局限。另外显示引擎也支持HDR10、12bit BT2020色彩、最高360Hz刷新率和自适应同步。

有关Intel的10nm SuperFin工艺,以及Xe核显更多技术方面的内容更新,可关注我的面包板。我会将这些内容更新在面包板博客上。

责编:Luffy Liu

 

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 产品论合格,不说好坏。合格有标准,好坏没有度。
  • 产品论合格,不说好坏。
阅读全文,请先
您可能感兴趣
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
Arm预计,到2025年将会有1,000亿台基于Arm架构的设备可具备人工智能功能,包括由Cortex-A、Cortex-M驱动的设备。
台积电的1.6纳米芯片“A16”技术具有多项创新点,其中最显著的是其超级电源轨(SPR)背面供电网络。这一技术是台积电首创,专为高性能计算产品设计,旨在提高芯片的性能和降低功耗。
使用旗下CUDA-Q平台,谷歌可以在英伟达Eos超算上动用1024块H100 Tensor核心GPU,以极低的成本执行全球最大、最快的量子设备动力学模拟,可以对容纳40个量子比特的设备进行全面、逼真的模拟。
为了应对这一挑战,英伟达正在与多家云服务提供商合作,共同优化散热方案,并强调工程迭代是正常且预期的一部分,但其交付时间或不得不再次推迟。
最近国产AI芯片市场遭遇一波有关7nm被禁的震荡,现状如何了?
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情
上个月,亿万富翁埃隆·马斯克谈到了年轻一代的生育问题。他强调生育的紧迫性,认为无论面临何种困难,生育后代都是必要的,否则人类可能会在无声中走向消亡。他认为人们对于生育的担忧有些过头,担心经济压力等问题