Intel下一代LunarLake架构全公开:功耗大降40%、E核性能飙升4倍

原创 硬件世界 2024-06-05 09:07

日前,Intel官方宣布了下一代低功耗移动平台Lunar Lake,也就是第二代酷睿Ultra的一部分(还有高性能的Arrow Lake),现已量产,将在第三季度正式发布上市,20多家厂商的80多款笔记本新品蓄势待发。

现在,Intel完全公开了Lunar Lake的架构设计细节,涵盖模块化结构、封装工艺、P性能核、E能效核、混合架构与线程调度、GPU核显、NPU AI引擎、平台连接等部分。

我们逐一来看。

【模块化与封装】

首先说一句,Intel尚未明确公布Lunar Lake的制造工艺,目前第三方说法是主要采用台积电N3B,也就是台积电第二代3nm。

不过Intel强调,如今的处理器设计理念是架构、工艺彼此99%的解耦分离,不再互相依赖,可以各自独立推进路线图。

Lunar Lake延续了Meteor Lake的分离式模块化设计,但又截然不同,首先是简化为计算模块(Compute Tile)、平台控制器模块(Platform Controller Tile)两大部分,角落里还有个填料模块(Filler Tile),不具备实际电路和功能,只是将整体凑成一个方形以保证结构强度。

它们通过底部的基础模块,结合Foveros封装工艺,组合在一起。

其次,Lunar Lake还整合封装了两颗内存。

计算模块内包含最多四个P核、最多四个E核、GPU核显、媒体引擎、显示引擎、IPU图像处理单元、NPU AI单元、NOC、MSC(内存侧缓存)等

其中,MSC缓存最大容量8MB,独立于二三级缓存,主要用于IO引擎的缓存配合,可以减少对系统内存的依赖,提升延迟与带宽。

平台计算模块则包含PCIe 5.0/4.0控制器、雷电4控制器(没有雷电5)、USB控制器、Wi-Fi与蓝牙控制器、安全引擎等。

注意,Meteor Lake上的超低功耗E核取消了,因为它改变了模块组合,并且引入了新的“低功耗岛”(Low Power Island),不再是单一物理模块管理节能,而是将是所有可节能的模块纳入统一管理,整体按需开关,效率更高。

计算模块内部通过Home Agent、Coherency Agent等连接主要单元,平台控制器模块内部也有IO Coherency,确保彼此一致性地高效通信。

而在两大模块之间,通过可扩展的第二代交叉总线,以及D2D界面进行彼此互连,这相比Lunar Lake的四大模块更加简单高效。

这是Intel第一次在处理器内部封装整合内存,称之为“Memory on Package”,也就是“封装级内存”(MOP)。

它采用的是LPDDR5X规格,最高频率8500MHz,每颗芯片四个16-bit通道,总容量最高32GB

官方称这种设计可以节省40%的功耗,并节省多达250平方毫米的主板面积,从而可以显著提升电池续航,并留出空间给笔记本的其他设计。

但是注意,Lunar Lake笔记本不再支持独立的SO-DIMM内存,不能扩展和升级。

值得一提的是,Lunar Lake还设计了全新的独立电源管理单元,一共四组,可以提供更多供电电路,动态调节电压。


【P性能核与E能效核】

这是P核结构简图,代号Lion Cove,在微架构上进行了全面的彻底改进,大幅提升IPC并增强可扩展性,优化了每瓦性能(尤其是单线程),以及单位面积的性能。

它共有多达18个执行端口,吞吐量和效率更高,预测宽度也提升了8倍。

缓存系统大大增强,每核心一级数据缓存48KB,一级指令缓存192KB,二级缓存最多达2.5MB(Arrow Lake上最多3MB),同时所有核心共享最多12MB三级缓存。

频率控制也更加精细,间隔从100MHz大大缩小到16.7MHz,效果自然是能效更高。

官方宣称,新性能核的IPC性能比上代有着平均14%的提升,而且功耗越低,提升越明显,超低功耗下可达18%。

如果频率也能进一步提升,性能自然会更好,这一点要到后续公布具体型号规格的时候才知道了。

E能效核代号Skymont,也是全新设计的,号称Intel最节能的架构。

它重点扩展了工作范围、提升了多线程性能,也提高了整体的扩展性,以及加强预测以快速寻找指令、调度端口增至26个、队列加深以更快并行处理、分配和回退加快等等,

通过四个128位FP浮点单元和SIMD矢量单元,带来了两倍的矢量性能和AI吞吐量,可以更好地执行VNNI,对于AI PC的整体表现提升有很大裨益。

缓存机制与P核截然不同,每个核心有32KB一级数据缓存,所有核心共享最多4MB二级缓存,没有自己的三级缓存。

单线程性能可以在1/3的功耗下,平均提升多达68%,最高可接近翻倍。

多线程性能方面,四个E核组成一个集群,相比于Meteor Lake上的双核集群,只需要1/3的功耗,就能带来2.9倍的性能,单纯比较性能更是最高可以带来惊人的4倍提升。

P、E核组合,前者峰值性能提升超过50%,后者能效提升20-80%,可以更灵活地适应对高性能、低功耗等不同应用场景的需求,覆盖各种能效范围。

针对混合架构的调度,Intel 12代酷睿就引入了硬件线程调度器(Thread Director),Lunar Lake上进行了全新升级,结合操作系统的调度器,带来了动态的调度策略、增强的算法、更精细的控制等。

还设置了操作系统隔离区,加强了电源管理,可以将应用能效降低多达35%。

P核和E核之间,只要工作负载合适,就会首选分配给单个P核,多线程负载时再扩展到其他能效核,并按需导向性能核。上图就是Office办公下的核心调度实例。

此外,Intel也给予了OEM厂商更大的灵活度,可以选择设置性能模式、能效模式。


【GPU核显】

Lunar Lake的核显升级为第二代Xe2微架构,也就是和即将发布的Battlemage独立显卡是同宗同源的,只是针对低功耗、高能效进行了优化。

Xe2 GPU架构引入了8个第二代Xe2核心、全新的XMX引擎(INT8整数操作每秒4096和FP16浮点操作每秒2048)、最多8个更强的光追单元、更大的XeSS内核、Xe2矢量引擎(优化能效和AI性能)、8MB二级缓存、eDP 1.5视频输出等等。

官方称其性能提升了多达50%,AI算力也高达67TOPS。

全新的媒体引擎支持AV1硬件编解码、H.266/VVC视频硬解码。

其中VVC,一如之前从H.264到H.265/HEVC,可以在保持同等画质的前提下继续降低码率、文件体积,并支持自适应分辨率码率,更加灵活,还支持屏幕内容编码流(SCC)、360度全景码流。

显示引擎支持HDMI 2.1、DP 2.1、eDP 1.5,最多三个屏幕,其中eDP 1.5自然是配合笔记本自带屏幕,可以更好地适应屏幕自刷新以进一步节能,使用提前传输进行选择性的显示内容更新。

【NPU AI引擎】

NPU AI单元别看是第二次独立提出,但是按照Intel的技术演进,号称已经是4.0版本(背刺隔壁第三代),在设计理念上增加大小以适应下一代AI负载,提升频率和能效,并针对现代AI进行优化以高效地运行新的大语言模型和Transformer。

NPU 4配备了6个神经计算引擎、12个增强的SHAVE DSP、能效优化的MAC阵列,带来了2倍的带宽和48TOPS的算力,峰值性能提升可多达4倍。

相比于AMD Strix Point也就是锐龙AI 300系列的第三代NPU,算力略逊了一筹,后者达到了50TOPS。

Lunar Lake处理器的整体算力将达到120TOPS,其中NPU适用于持续性的AI负载,能效非常高,GPU适合高性能的游戏和创作AI应用,CPU算力只有5TOPS,适合轻型、通用型AI负载。

AMD尚未公布锐龙AI 300系列中CPU、GPU的算力,整体孰强孰弱还有待观察。

【平台连接】

IO与连接方面,Lunar Lake提供最多四条PCIe 5.0、四条PCIe 4.0总线通道,可以连接两块SSD,或者一块SSD和其他扩展。

无线升级到了Wi-Fi 7(5G Gig),最高速率达5.8Gbps,还有蓝牙5.4。

当然更少不了Intel独家的雷电4,带宽40Gbps,最多三个连接,而且支持新的雷电共享技术,可以在不同PC之间快捷分享、传输、控制。

【产品上市】

这就是Lunar Lake在架构设计上的主要情况了,可以说进步是方方面面的,就看最终的实际性能表现了。

Intel已经向厂商和开发者提供一个迷你机形式的开发套件,但没有公布具体情况,而且Intel也不再做NUC迷你机了,殊为可惜。

今年第三季度开始,我们将看到超过20家厂商的超过80款Lunar Lake笔记本陆续上市。

AI PC应用也在迅速丰富起立,Intel平台上已有100多家厂商的300多个AI软件功能,优化的大模型也已超过500个。

Intel预计到2027年,将近60%的新PC,都会是AI PC。

Meteor Lake第一代酷睿已经出货800多万颗,产品设计超过230款,遍布48个国家和地区。

Lunar Lake之后,今年晚些时候,我们将看到高性能的Arrow Lake,同样基于Lion Cove、Skymont混合架构,但更加强大,并首次采用Intel 20A制造工艺。

明年,我们还会看到下一代Panther Lake,再往后则是Nova Lake……


硬件世界 共同研究探讨硬件知识及相关信息
评论
  • 当下,智能手机市场正呈现出明显的高端化趋势,更多消费者愿意为高端设备买单,这也推动了智能手机均价的提升。作为中国科技品牌出海的代表,传音控股凭借在折叠屏手机、AI技术、多肤色影像技术等方面的优势,在全球高端手机市场上展现出强大的竞争力。智能手机高端化趋势明显,传音打造AI技术优势12月初,全球市场调研机构Counterpoint发布报告称,2024年三季度,全球智能手机市场出货量达3.07亿部,同比增长2%,连续四个季度保持增长。全球智能手机收入同比增长10%,平均售价增长7%,均创下历史新高。
    电子资讯报 2024-12-24 16:57 41浏览
  • 本文介绍瑞芯微开发板/主板Android系统APK签名文件使用方法,触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,各类接口一应俱全,帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。系统签名文件生成APK系统签名文件,具体可参考此文章方法RK3588主板/开发板Android12系统APK签名文件生成方法,干货满满使用方法第一步,修改APK工程文件app/src/build.gradle,并添加以下内容: android {     na
    Industio_触觉智能 2024-12-26 09:20 76浏览
  • 据IDTechEx最新预计,到2034年,全球汽车舱内传感(In-Cabin Sensing,ICS)市场将超过85亿美元。若按照增长幅度来看,包含驾驶员监控系统(DMS)、乘员监控系统(OMS)、手势控制和生命体征监测等高级功能在内的舱内传感市场预计2020年到2034年将增长11倍。感光百科:ICS中的光源选择01、政策推动带来的“硬”增长作为其中的增长主力,舱内监控系统应用(包含DMS和OMS等)被推动增长的首要因素正是法规。据统计,中国、欧盟、美国、韩国、印度等主要汽车国家或地区已推出相
    艾迈斯欧司朗 2024-12-25 19:56 73浏览
  • 全球照明技术创新领航者艾迈斯欧司朗,于2024年广州国际照明展览会同期,举办【智慧之光】· 艾迈斯欧司朗-照明应用研讨会,以持续的技术创新,推动光+概念的全面落地。现场还演示了多款领先照明技术,且由资深工程师倾情解读,另有行业大咖深度洞察分享,助你开启“光的无限可能”探索之旅!精彩大咖分享引领未来照明无限遐想艾迈斯欧司朗精心准备了照明领域专业大咖的深度分享,无论是照明领域的资深从业者,还是对照明科技充满好奇的探索者,在这里,您都将大有所获。在艾迈斯欧司朗照明全球产品市场VP Geral
    艾迈斯欧司朗 2024-12-25 20:05 59浏览
  • RK3506是瑞芯微Rockchip在2024年第四季度全新推出的Arm嵌入式芯片平台,三核Cortex-A7+单核Cortex-M0多核异构设计,CPU频率达1.5Ghz, M0 MCU为200Mhz。RK3506平台各型号芯片该怎么选,看这篇文章就够了。RK3506各型号RK3506有3个型号,分别是RK3506G2、RK3506B、RK3506J,配置参数如图: 配置差异解析总的来说,RK3506各型号间的差异主要体现在内存、工作温度和封装上‌:内存差异‌:RK3506G2‌集成
    Industio_触觉智能 2024-12-25 10:27 41浏览
  • 在谐振器(无源晶振)S&A250B测试软件中,DLD1到DLD7主要用于分析晶体在不同驱动功率下的阻抗变化。此外,还有其他DLD参数用于反映晶振的磁滞现象,以及其频率和功率特性。这些参数可以帮助工程师全面了解KOAN晶振在不同功率条件下的动态特性,从而优化其应用和性能。磁滞现象晶振的磁滞现象(Hysteresis)是指在驱动功率变化时,晶体的阻抗或频率无法立即恢复至初始状态,而表现出滞后效应。1. DLDH: Hysteresis Ratio (MaxR/MinR)在不同驱动
    koan-xtal 2024-12-26 12:41 85浏览
  • IP 语音(VoIP)网络依赖于 SIP(会话启动协议)和 RTP(实时传输协议)等实时通信协议,因此必须保持高可用性和低延迟。一旦出现问题,就必须迅速查明并解决,以防止服务中断。一个常见的问题是不兼容问题,目前有 100 多份与 SIP 相关的征求意见稿(RFC),其中有大量 “应该”(SHOULD)而非 “必须”(MUST)的声明。这通常会导致用户无法拨出或拨入电话。本文将介绍一种使用 IOTA 的故障排除方法,IOTA 是一种实时流量捕获和分析工具,可简化复杂 VoIP 网络问题的根本原因
    艾体宝IT 2024-12-24 14:37 50浏览
  • 在PCB设计中,Stub(也称为短桩线或残桩线)对信号传输有以下几个主要影响:1.容性效应导致的阻抗偏低:Stub会导致容性效应,使得阻抗偏低,影响信道的阻抗一致性。Stub越长,阻抗降低得越多。这是因为传输线瞬态阻抗计算公式为:Z = \ sqrt { \ frac { L } { C } }Stub就像并联在传输线上的小电容,Stub越长,电容量越大,阻抗也就越低。2.信号反射:当信号在传输线与Stub的交界处遇到阻抗不匹配时,会产生信号反射。这会导致信号的失真和能量的反向传播,增加了噪声和
    为昕科技 2024-12-24 18:10 32浏览
  • “金字招牌”的户外叙事。2024年的夏天似乎异常炙热,体育迷们的心跳也随之澎湃,全球瞩目的体育盛宴——巴黎奥运会在此刻上映。在这个充满荣耀与梦想的夏天,我们见证了无数激动人心的瞬间:男子4X100米混合泳接力决赛中,潘展乐的最后一棒,气壮山河,中国队的历史性夺冠,让整个泳池沸腾;射击10米气步枪混合团体决赛,黄雨婷和盛李豪的精准射击,为中国队射落首金,展现了年轻一代的力量;乒乓球男单四分之一比赛中,樊振东的惊天逆转令人难以忘怀,凭借坚韧不拔的意志和卓越的技术,成功挺进半决赛,并最终夺冠……在这一
    艾迈斯欧司朗 2024-12-25 19:30 73浏览
  • 新能源汽车市场潮起潮落,只有潮水退去,才能看清谁在裸泳。十年前,一批新能源汽车新势力带着创新的理念和先进的技术,如雨后春笋般涌入中国汽车市场,掀起一场新旧势力的角逐。经历市场的激烈洗礼与投资泡沫的挤压,蔚来、理想、小鹏等新势力车企脱颖而出,刷爆网络。不曾想,今年新势力车企杀出一匹“超级黑马”,爬上新势力车企销量榜前三,将蔚来、小鹏等昔日强者甩在了身后,它就是零跑汽车。公开数据显示,11月份,零跑汽车实现新车交付量约4.02万辆,同比增长117%,单月销量首次突破4万辆;小鹏汽车当月共交付新车约3
    刘旷 2024-12-26 10:53 116浏览
  • 今年AI技术的话题不断,随着相关应用服务的陆续推出,AI的趋势已经是一个明确的趋势及方向,这也连带使得AI服务器的出货量开始加速成长。AI服务器因为有着极高的运算效能,伴随而来的即是大量的热能产生,因此散热效能便成为一个格外重要的议题。其实不只AI服务器有着散热的问题,随着Intel及AMD 的CPU规格也不断地在提升,非AI应用的服务器的散热问题也是不容小觑的潜在问题。即便如此,由于目前的液冷技术仍有许多待克服的地方,例如像是建置成本昂贵,机壳、轨道、水路、数据中心等项目都得重新设计来过,维修
    百佳泰测试实验室 2024-12-26 16:33 73浏览
  • 引言  LIN(Local Interconnect Network)是一种针对汽车电子系统应用的串行通信协议,主要用于汽车电子控制单元(ECU)之间的通信。LIN总线的特点是成本低、速率低、通信距离短、连接节点少,主要用于对带块要求低、实时性要求不高的控制任务,例如车门控制、天窗控制、座椅控制、车内照明等功能。LIN总线采用的是主从式架构,由主节点基于调度表调度网络中的通信。  LIN总线的错误类型  尽管LIN协议设计简单,具有低带
    北汇信息 2024-12-25 14:18 69浏览
  • 概述 Intel 要求用户为其10代FPGA器件使用特定的上电和掉电顺序,这就要求用户在进行FPGA硬件设计的时候必须选择恰当的FPGA供电方案,并合理控制完整的供电上电顺序。经过在Cyclone 10 GX测试板上实际验证,统一上电确实会导致FPGA无法正常工作,具体表现为JTAG接口无法探测或识别到目标器件。上电顺序要求 Cyclone 10 GX,Arria 10以及Stratix 10系列器件所有的电源轨被划分成了三个组合,三组电源轨要求依次上电,如图1所示,为三组电源轨上电顺序示意图。
    coyoo 2024-12-25 14:13 59浏览
  • 本文介绍瑞芯微RK3588主板/开发板Android12系统下,APK签名文件生成方法。触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,该开发板是核心板加底板设计,音视频接口、通信接口等各类接口一应俱全,可帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。工具准备下载Keytool-ImportKeyPair工具在源码:build/target/product/security/系统初始签名文件目录中,将以下三个文件拷贝出来:platform.pem;platform.
    Industio_触觉智能 2024-12-26 09:19 108浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦