等你24年了!IntelArc锐炫独立显卡深入解读:化腐朽为神奇

原创 硬件世界 2022-03-30 23:55

3月30日晚,Intel终于发布了预热良久的Arc锐炫系列独立显卡,代号Alchemist(炼金术师)。


Intel的上一款高性能游戏独立显卡,还要追溯到1998年的i740,但是昙花一现之后就没了,后来的Larrabee独显计划也没能开花结构(除了衍生出短命的Xe Phi加速卡)。


现在,24年过去了,Intel终于回归游戏显卡!



Intel Arc显卡包括3、5、7三大系列,分别定位主流游戏、性能游戏、发烧游戏。


首批登陆笔记本移动端(后续陆续进入桌面台式机和工作站),而首发的是主流的3系列,5、7系列将在今年初夏面世。


平台搭档主力是12代酷睿H45、P28系列高性能处理器,也入围了Intel Evo严苛认证。




【型号/规格/性能:最高飙到150W】






Arc A系列有大小两种不同的GPU芯片,其中大的编号“ACM-G10”,拥有32个Xe核心(可以粗略地理解为512执行单元)、32个光追单元、16MB二级缓存,搭配256-bit GDDR6显存,支持PCIe 4.0 x16。


小的编号“ACM-G11”,8个Xe核心,8个光追单元,4MB二级缓存,96-bit GDDR6显存,支持PCIe 4.0 x8。


它们都具备2个Xe媒体编解码引擎、4个显示通道。



产品方面,Arc 3系列首发两款型号,高端的Arc A370M核心频率1550MHz,64-bit 4GB显存,功耗范围35-50W。


Arc A350M精简到6个Xe核心、6个光追单元,核心频率降至1150MHz,显存不变,功耗范围则是25-35W。


Arc 5系列目前仅一款型号Arc A550M,16个Xe核心、16个光追单元,核心频率仅900MHz,搭配128-bit 8GB显存,功耗60-80W。


Arc 7系列将有两款型号,满血的是Arc A770M,32个Xe核心(512执行单元)、32个光追单元,核心频率高达1650MHz,配备256-bit 16GB显存,功耗范围高达120-150W。


Arc A730M精简到24个Xe核心、24个光追单元,核心频率1100MHz,显存降至192-bit 12GB,功耗80-120W。



值得一提的是,Arc显卡的核心频率并不是固定的,而是有一个动态范围,可以根据不同负载自动调节,规格表中的频率只是一个平均值。




性能方面,Arc A370M显卡搭配i7-12700H处理器,1080p中等画质下,大部分主流游戏都可以稳定超过60FPS,《GTA5》、《火箭联盟》等则可以超过90FPS。


对比12代酷睿i7-1280P中集成的96个执行单元、1450MHz频率的锐炬Xe核显,综合游戏性能高出一倍左右。



而在内容软件中,得益于优化适配,性能提升幅度最多可以达到1.4倍。



目前,基于Arc A300M系列的笔记本正在陆续问世,品牌包括宏碁、华硕、戴尔、海尔、惠普、联想、微星、三星、蓝天、闻泰等等,Intel NUC迷你机也会加入。


在国内市场,Arc笔记本将从下个月开始上市。


【内核架构:这次完全变了】




Intel Arc锐炫显卡基于高性能的Xe HPG架构,基本组成单元包括Xe内核、Xe媒体引擎、Xe显示引擎、Xe图形流水线等,我们逐一来看。





大家知道,Intel GPU多年来的基本模块一直都是“执行单元”(EU),Xe HPG架构上变成了全新的“Xe核心”(Xe Core)。


Xe核心中又包含16个256位矢量引擎(XVE)、16个1024位矩阵引擎(XMX)、192KB共享缓存、载入存储单元等等,其中缓存可以根据工作负载,在一级缓存、共享本地内存(SLM)之间动态分配。




Xe核心的上一层级是渲染切片(Render Slice),每个包含4个Xe核心、4个光追单元、4个纹理采样器、几何前端、光栅前端、HiZ单元、2个像素后端。


渲染切片可以多组结合扩展,Arc显卡最多有8个。


Arc显卡完整支持DX12 Ultimate、Vulkan,并且同时支持DXR光追、Vulkan光追。



这就是Arc显卡完整的内部架构图。



矢量引擎改进了ALU单元,提供专用的FP浮点执行接口,共享的INT/EM整数执行接口,每个时钟周期可以执行16个FP32操作、32个FP16操作、64个INT8操作。


由于AI算法核心几乎完全围绕矩阵乘法、累加算法,所以Xe核心里加入了单独的矩阵引擎,专门用于执行XMX指令。


它具备独立的执行端口,每个时钟周期可以执行128个FP16/BF16操作、256个INT8操作,512个INT4/INT2操作。


【XeSS:化腐朽为神奇的超分辨率缩放】


针对矩阵引擎不同指令的处理操作,Intel也做了详细的解释,我们来简单了解下。




MAC作为图形渲染中的基本SIMD矢量指令,也是Xe矢量引擎的核心,可以执行8次并行乘法,然后执行8次并行加法,每个时钟周期就是16个操作。


上图最左侧水平方向的前排、后排蓝色方块,就代表操作数,上下的方框则代表累积的源和结果。


DP4a指令是针对不需要32位精度的AI计算所做的优化,工作原理是将所有32位输入分成8位块,然后独立执行,总共32次并行乘法(紫色方块),每个时钟周期就是64个操作,相比标准SIMD MAC提高了4倍。


XMX指令也是每个操作分成4个块,然后独立相乘、累加,共有64个操作,每个时钟周期4个阶段就是256个操作,由此带来16倍的算力提升。


XMX矩阵引擎最直接的作用就是支撑XeSS超采样抗锯齿技术,类似NVIDIA DLSS、AMD FSR,可以通过低分辨率渲染、高分辨率缩放输出,提升游戏性能,并得到类似或超越原生的画质。



XeSS已经得到了十多款游戏的支持,不过目前还不可用,会在今年初夏正式面世。


下边感受一下XeSS在实际游戏中的效果,左侧是1080p原生渲染,右侧是4K XeSS缩放渲染,可以明显看到后者的画面质量高得多,细节也更加丰富、锐利。


至于性能提升幅度,Intel暂时没有给出具体数据。







【多媒体:首发全新视频格式AV1】




Xe媒体引擎可以为主流视频软件带来硬件加速,解码支持高达8K60 12-bit HDR,编码支持高达8K 10-bit HDR。


视频编解码格式不但支持MPEG-4、VP9、AVC、H.264、HEVC(H.265),更是首发支持AV1硬件编码、解码。


AV1的编码效率相比H.264、H.265分别高出50%、20%,能够以更小的文件、更少的带宽带来更高的画面质量,关键是开放的,无需版权费,是开放媒体联盟力推的技术。



这个联盟的成员都是大名鼎鼎的巨头,包括亚马逊、苹果、ARM、思科、Facebook、Google、华为、Intel、微软、Mozilla、Netflix、NVIDIA、三星、腾讯等等。


AV1还在起步阶段,但普及速度很快,尤其是解码方面,NVIDIA RTX 30系列、AMD RX 6000系列,联发科天玑1000开始,Windows 10系统和不少视频软件、视频网站、视频设备,都已经支持。


来对比一下AV1、H.264在游戏直播中的画质差异,分辨率都是1080p,码率都是5Mbps。






【显示:支持平滑同步】



Xe显示引擎支持HDMI 2.0b、DisplayPort 1.4a输出标准,并且为下一代DisplayPort 2.0 10G做好了准备。


视频输出也支持极高的分辨率、刷新率,最高可以双路8K60 HDR、四路4K120 HDR,以及1080p360、1440p360。



同步技术更是带来了三种,最常见的是VESA标准的Adaptive Sync(适应性同步),与显示器刷新率同步,消除画面撕裂,当今多数游戏本的屏幕都支持该技术。


其次是Speed Sync(加速同步),可以在关闭V-Sync垂直同步后,为当前帧提供加速,不仅可以消除撕裂,还具备低延时、无上限的优点。



最后是新的“Smooth Sync”(平滑同步),通过抖动过滤功能,对画面撕裂进行模糊化处理,保证同步无撕裂、无失真。


【Deep Link:CPU+GPU协同发力】



处理器、显卡都是自己家的,自然要联合作战,这就是Deep Link技术,可以让酷睿处理器、核显、独显协同释放各自的潜力,主要应用包括三个方面。




一是动态功率共享,支持12代酷睿平台,原理很简单,就是根据不同的负载,动态调节CPU、GPU的功耗配比,玩游戏就多给GPU。


AMD平台有相同的技术SmartShift,NVIDIA也有类似的,但自己没有CPU处理器,效果自然大打折扣。



二是超级编码通过oneVPL API,可以让独立显卡、核芯显卡共同进行视频编码,处理不同的帧画面,再合成。



三是超级算力联合基于机器学习的MLS框架,结合XMX引擎加速,可以智能地将计算负载分配给独立显卡、核芯显卡各自的计算引擎,比如处理视频的时候,将画面分成不同区块,交给两种显卡,处理完毕后再合成输出。



Intel宣称,在内容创作上,动态功率共享、超级编码、超级算力可以分别带来最多30%、60%、24%的性能提升。


Intel也展示了超级算力的应用实例,将低画质的视频AI处理缩放到高分辨率画质。










【驱动面板:焕然一新 监控优化都在行】



硬件有了,驱动自然也要跟上,Arc显卡将搭配全新的“Arc Control”驱动控制面板,功能更加丰富,包括游戏驱动、性能调优、全局设置、游戏库、创作者工作站等模块。



性能调优部分,可以实时监测查看各种硬件指标,频率、电压、占用率、温度、风扇转速等等,还可以设置监测涂层,随时覆盖查看。


未来的桌面产品,还会支持调节功耗、风扇转速等,不知道是否会加入超频……



创作者工作站部分,可以方便地进行直播、AI摄像头强化(背景模糊/背景替换/删除和自动补帧等)、自动生成游戏高光时刻。


等了这么久,Intel高性能独立显卡终于来了,你准备好了吗?






硬件世界 共同研究探讨硬件知识及相关信息
评论
  • 国产光耦合器因其在电子系统中的重要作用而受到认可,可提供可靠的电气隔离并保护敏感电路免受高压干扰。然而,随着行业向5G和高频数据传输等高速应用迈进,对其性能和寿命的担忧已成为焦点。本文深入探讨了国产光耦合器在高频环境中面临的挑战,并探索了克服这些限制的创新方法。高频性能:一个持续关注的问题信号传输中的挑战国产光耦合器传统上利用LED和光电晶体管进行信号隔离。虽然这些组件对于标准应用有效,但在高频下面临挑战。随着工作频率的增加,信号延迟和数据保真度降低很常见,限制了它们在电信和高速计算等领域的有效
    腾恩科技-彭工 2024-11-29 16:11 105浏览
  • 光耦合器作为关键技术组件,在确保安全性、可靠性和效率方面发挥着不可或缺的作用。无论是混合动力和电动汽车(HEV),还是军事和航空航天系统,它们都以卓越的性能支持高要求的应用环境,成为现代复杂系统中的隐形功臣。在迈向更环保技术和先进系统的过程中,光耦合器的重要性愈加凸显。1.混合动力和电动汽车中的光耦合器电池管理:保护动力源在电动汽车中,电池管理系统(BMS)是最佳充电、放电和性能监控背后的大脑。光耦合器在这里充当守门人,将高压电池组与敏感的低压电路隔离开来。这不仅可以防止潜在的损坏,还可以提高乘
    腾恩科技-彭工 2024-11-29 16:12 117浏览
  • 艾迈斯欧司朗全新“样片申请”小程序,逾160种LED、传感器、多芯片组合等产品样片一触即达。轻松3步完成申请,境内免费包邮到家!本期热荐性能显著提升的OSLON® Optimal,GF CSSRML.24ams OSRAM 基于最新芯片技术推出全新LED产品OSLON® Optimal系列,实现了显著的性能升级。该系列提供五种不同颜色的光源选项,包括Hyper Red(660 nm,PDN)、Red(640 nm)、Deep Blue(450 nm,PDN)、Far Red(730 nm)及Ho
    艾迈斯欧司朗 2024-11-29 16:55 152浏览
  • 国产光耦合器正以其创新性和多样性引领行业发展。凭借强大的研发能力,国内制造商推出了适应汽车、电信等领域独特需求的专业化光耦合器,为各行业的技术进步提供了重要支持。本文将重点探讨国产光耦合器的技术创新与产品多样性,以及它们在推动产业升级中的重要作用。国产光耦合器创新的作用满足现代需求的创新模式新设计正在满足不断变化的市场需求。例如,高速光耦合器满足了电信和数据处理系统中快速信号传输的需求。同时,栅极驱动光耦合器支持电动汽车(EV)和工业电机驱动器等大功率应用中的精确高效控制。先进材料和设计将碳化硅
    克里雅半导体科技 2024-11-29 16:18 157浏览
  • 在电子技术快速发展的今天,KLV15002光耦固态继电器以高性能和强可靠性完美解决行业需求。该光继电器旨在提供无与伦比的电气隔离和无缝切换,是现代系统的终极选择。无论是在电信、工业自动化还是测试环境中,KLV15002光耦合器固态继电器都完美融合了效率和耐用性,可满足当今苛刻的应用需求。为什么选择KLV15002光耦合器固态继电器?不妥协的电压隔离从本质上讲,KLV15002优先考虑安全性。输入到输出隔离达到3750Vrms(后缀为V的型号为5000Vrms),确保即使在高压情况下,敏感的低功耗
    克里雅半导体科技 2024-11-29 16:15 119浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-29 14:30 116浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 68浏览
  • 随着航空航天技术的迅猛发展,航空电子网络面临着诸多挑战,如多网络并行传输、高带宽需求以及保障数据传输的确定性等。为应对这些挑战,航空电子网络急需一个通用的网络架构,满足布线简单、供应商多、组网成本相对较低等要求。而以太网技术,特别是TSN(时间敏感网络)的出现,为航空电子网络带来了新的解决方案。本文将重点介绍TSN流识别技术在航空电子网络中的应用,以及如何通过适应航空电子网络的TSN流识别技术实现高效的航空电子网络传输。一、航空电子网络面临的挑战航空航天业专用协议包括AFDX、ARINC等,这些
    虹科工业智能互联 2024-11-29 14:18 100浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 58浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 61浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 53浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 57浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 84浏览
  • By Toradex胡珊逢简介嵌入式领域的部分应用对安全、可靠、实时性有切实的需求,在诸多实现该需求的方案中,QNX 是经行业验证的选择。在 QNX SDP 8.0 上 BlackBerry 推出了 QNX Everywhere 项目,个人用户可以出于非商业目的免费使用 QNX 操作系统。得益于 Toradex 和 QNX 的良好合作伙伴关系,用户能够在 Apalis iMX8QM 和 Verdin iMX8MP 模块上轻松测试和评估 QNX 8 系统。下面将基于 Apalis iMX8QM 介
    hai.qin_651820742 2024-11-29 15:29 150浏览
  • 在现代科技浪潮中,精准定位技术已成为推动众多关键领域前进的核心力量。虹科PCAN-GPS FD 作为一款多功能可编程传感器模块,专为精确捕捉位置和方向而设计。该模块集成了先进的卫星接收器、磁场传感器、加速计和陀螺仪,能够通过 CAN/CAN FD 总线实时传输采样数据,并具备内部存储卡记录功能。本篇文章带你深入虹科PCAN-GPS FD的技术亮点、多场景应用实例,并展示其如何与PCAN-Explorer6软件结合,实现数据解析与可视化。虹科PCAN-GPS FD虹科PCAN-GPS FD的数据处
    虹科汽车智能互联 2024-11-29 14:35 147浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦