英特尔GPU使命:应对计算多元化 承载图形算力渴求

亮点科技 2022-05-17 09:23

在一部分大众认知里,英特尔重回GPU市场的主要目标是与NVIDIA、AMD在消费领域一较高下。但事实果真如此吗?

重回高性能GPU领域 英特尔的目标不只在消费级市场

2017年,随着图形架构大神Raja Koduri加入,英特尔宣告重回高性能GPU领域的那一刻起,其目标就并不仅仅是指向消费市场。因为对于英特尔而言,核芯显卡的存在使其在PC领域拥有极高的GPU市占率。同时,PC市场的盘子也承载不下英特尔GPU的宏伟愿景。


市场调研机构JPR发布的2Q21GPU市场份额报告显示,英特尔GPU市占率为68.3%
(注:该报告包含了独立GPU、集成型GPU,并非单指显卡)

伴随着边缘计算、5G、AI、云游戏、超清视频流媒体、在线直播、区块链、元宇宙等新兴技术和行业兴起,“计算”这一概念再次被拓宽边界。英特尔希望在一直以来所擅长的CPU与集成型GPU之外,拓展在独立GPU领域的优势,以此来满足这些新兴行业对于算力的渴求。因此,为大众消费市场和这些新兴行业兴起和发展做好准备,并成为驱动这些行业发展的中坚力量,才是英特尔GPU使命所在。

灵活的Xe  图形架构为英特尔GPU带来优异的泛用性

单从架构技术层面就可以看出,英特尔GPU绝不仅仅只是在消费市场一争高下。

英特尔Xe图形架构从研发之初就考虑到了灵活性和泛用性,因此在一种架构下实现了四种不同规格的微架构设计。它同时包含面向集成显卡、入门级独显的Xe LP架构,面向游戏和桌面级图形性能的Xe HPG架构,还包含面向数据中心和AI的Xe HP架构以及面向高性能计算的Xe HPC架构。


一种架构包含多种微架构,进而覆盖不同应用需求

Xe图形架构的出现,正式宣告了英特尔向高性能GPU领域进军的决心,同时也完成了英特尔对Scalar(CPU)、Vector(GPU)、Matrix(ASIC)、Spatial(FPGA)四大计算类型的芯片全覆盖。

全面满足行业对高算力的需求 英特尔GPU宏伟愿景清晰勾勒

产品层面,五年时间里英特尔稳扎稳打步步为营,同样可以看到其不仅仅只是局限于消费级领域,而是以高算力为基础,全面满足新兴行业不断拓展的愿景。

今年3月末,英特尔率先发布锐炫A系列高性能移动端独立GPU。它采用灵活可拓展的Xe HPG微架构设计,包含了强大的AI引擎和增强的媒体引擎,通过全新打造的Xe显示引擎和图形管线来处理各种不同显示任务。同时还支持XeSS超级采样技术,并且是行业首个支持AV1编解码的消费级GPU。锐炫A系列GPU还包含了Deep Link这样的多功能技术集,其中的动态功率共享,超级编码和超级算力三大技术成为锐炫A系列GPU的王牌技术。

除了首发的锐炫移动端之外,英特尔还将在今年年内陆续推出面向台式机和工作站的高性能独立GPU。而锐炫A系列显卡的逐步落地,也是英特尔向消费级高性能GPU领域迈出的又一大步。

但是到此就够了吗?当然不是。

5月,英特尔借着“英特尔On产业创新峰会”,让我们窥见了其面向数据中心的代号为Arctic Sound-M(ATS-M)的高性能GPU的一些细节。它包含两种不同的配置,150W 功率版本在一个3/4长、全高尺寸的 PCIe 4.0 加速卡中封装了 32 个 Xe 内核。75W 功率版本则在半高尺寸的 PCIe 4.0 加速卡中封装了两颗具有 8 个 Xe 内核的 GPU,共 16 个 Xe 内核。这两种配置均配备了 4 个 Xe 媒体引擎、英特尔首款面向数据中心的 AV1 硬件编码器和加速器、GDDR6 内存、光线追踪单元和内置 XMX AI 加速,能够提供每秒150万亿次运算(150 TOPS)能力。

值得一提的是,ATS-M是一款能够真正满足多媒体转码、视觉图形处理和云端推理等企业级生产力场景需求的“多用途GPU”。它由完整的解决方案堆栈支持,为开发者提供了面向流媒体、云游戏和云端推理的开源软件堆栈,并广泛支持 AVC、HEVC、VP9,以及更多 API、框架和最新的编解码器。

面对云游戏的使用场景,无论用户对峰值性能、高密度提出需求,还是期待通过一个平台满足跨智能手机和 PC 游戏的融合云游戏解决方案,ATS-M均可以提供出色的游戏串流体验。针对媒体串流和传输,ATS-M配备的 AV1 硬件编码器,可在不牺牲质量的同时,带来 30% 比特率的提升,并可以实现一卡同时处理多达 8 路 4K 视频流或超过30 路 1080p 视频流。

特别地,针对远程办公所带来的虚拟桌面架构(VDI)的增长,ATS-M还提供了灵活的虚拟 GPU(vGPU)调度策略,让管理员能够单独微调 GPU 上每个虚拟机的运行指令,而目前其他厂商产品仅允许在虚拟机的全局设置中进行调整。针对媒体分析类的工作负载,ATS-M还提供良好的扩展性,为客户提供更高的流密度和更低的成本,具体而言,集成两颗 GPU 的 75W 功率版本 ATS-M 能够在计算和解码能力上实现很好的平衡,且不受媒体限制。

事实上,除了ATS-M之外,英特尔此前多次提及的为Aurora超级计算机项目所打造的Ponte Vecchio GPU同样展现了惊人的图形计算能力。据悉,它包含了多达47个颗不同芯片模块,其中包括16个Xe HPC 架构计算芯片、8个Rambo cache芯片、2个Xe基础芯片、11个EMIB连接芯片、2个Xe Link I/O芯片和8个HBM芯片。其整套芯片包含了惊人的1000亿枚晶体管,规模庞大,能够提供千万亿次级图形算力!

消费市场的锐炫系列、超级计算领域的Ponte Vecchio以及数据中心级的ATS-M均陆续在今年相继交付,这已然将英特尔GPU愿景的轮廓清晰地勾勒出来:在计算多元化、算力需求爆发式增长的大趋势下,英特尔GPU将成为驱动新兴行业发展的算力基石,同时也将成为英特尔自身业务增长的突破点。

高性能GPU成为英特尔新的业务增长点

现如今,消费级GPU市场的应用场景已经成型,不外乎游戏、视频编解码、在线视频流媒体播放等。而要想在固有市场中寻求业务增长,尤其是想要在强大竞争对手面前取得发展,只能“积跬步以行千里”。

而面对算力需求呈几何倍数暴增的云游戏、全堆栈流媒体,以及边缘超级计算、高端车载信息娱乐系统、区块链、元宇宙等新兴领域的挑战,则需要大开大合,借助Ponte Vecchio、ATS-M这样的怪兽级GPU加速生态建设与完善,进而使高性能GPU成为英特尔芯片业务的强力增长点。

其实在英特尔2022年投资者大会上,CEO帕特·基辛格就指出,“英特尔GPU产品将在2022年为公司带来超过10亿美元营收。而作为英特尔新的增长引擎,预计到2026年,GPU相关产品将创造近100亿美元营收。”

对于英特尔而言,从传统芯片公司迈向数据服务型公司时,实现增长就已经注定不再只依赖自身所擅长的CPU。尤其近年来人们对于无处不在的算力的需求,让英特尔更加明确了GPU图形计算能力的重要性,而大幅度的营收规模增长预期,足以看出GPU强劲的“造血能力”对于英特尔自身发展的重要性。

结语

在很多人心目中,英特尔是一家出色的CPU芯片公司,这一点无可厚非,毕竟数十年来英特尔在这个行业都是公认的领军企业。但事实上,英特尔现如今所扮演的角色,则是借助强大的算力提供能力,驱动各行各业发展的基石力量。

就以GPU为例,如果从大众认知角度来看,英特尔所提供的就是锐炬Xe、锐炫A系列这样的传统意义上的图形显卡,它们为大众消费者,为PC用户提供可靠的图形性能支持,满足用户看视频、玩游戏、剪视频的基本应用需求。

但如果从行业角度来看就不仅仅是这么简单了。

一方面,无论是Ponte Vecchio还是ATS-M,亦或是未来Falcon Shores(一款将x86与Xe 显卡集成在同一插槽的全新架构,它将在每瓦性能、计算密度、内存容量与带宽方面均实现超过5倍的性能提升)体系下的全新架构产品,它们可能并不像锐炬Xe、锐炫A系列这样能够描摹出某一个具体的用户画像,但其强大算力却可以为世界上千千万万用户提供更好的体验或服务。

另一方面,伴随着新兴领域、新兴技术不断涌现,越来越庞大的工作负载驱使图形算力需求持续增长。因此,英特尔必须以技术为驱动,以产品为先锋,以生态体系建设与合作为后盾,利用自身在软件、AI、网络、边缘等技术上的优势,与各个产业合作伙伴携手,在为新兴领域不断提供强大算力支持、实现自身增长点突破的同时,驱动新兴行业高速发展,从而使得由算力驱动的、有望改变人类生活方式的新技术、新行业、新领域最终实现落地。

评论
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 101浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 78浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 109浏览
  • 艾迈斯欧司朗全新“样片申请”小程序,逾160种LED、传感器、多芯片组合等产品样片一触即达。轻松3步完成申请,境内免费包邮到家!本期热荐性能显著提升的OSLON® Optimal,GF CSSRML.24ams OSRAM 基于最新芯片技术推出全新LED产品OSLON® Optimal系列,实现了显著的性能升级。该系列提供五种不同颜色的光源选项,包括Hyper Red(660 nm,PDN)、Red(640 nm)、Deep Blue(450 nm,PDN)、Far Red(730 nm)及Ho
    艾迈斯欧司朗 2024-11-29 16:55 174浏览
  • 国产光耦合器正以其创新性和多样性引领行业发展。凭借强大的研发能力,国内制造商推出了适应汽车、电信等领域独特需求的专业化光耦合器,为各行业的技术进步提供了重要支持。本文将重点探讨国产光耦合器的技术创新与产品多样性,以及它们在推动产业升级中的重要作用。国产光耦合器创新的作用满足现代需求的创新模式新设计正在满足不断变化的市场需求。例如,高速光耦合器满足了电信和数据处理系统中快速信号传输的需求。同时,栅极驱动光耦合器支持电动汽车(EV)和工业电机驱动器等大功率应用中的精确高效控制。先进材料和设计将碳化硅
    克里雅半导体科技 2024-11-29 16:18 180浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 87浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 124浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 111浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 71浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 120浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 119浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 68浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 50浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 100浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 98浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦