Intel发布全新GPU:性能5倍于NVIDIA!功耗仅一半

原创 硬件世界 2022-08-25 23:29

Intel独立GPU虽然是后起之秀,但正在无处不在!

今天,Intel正式发布了全新的数据中心GPU Flex系列(曾用代号Arctic Sound-M),主要用于视频转码与传输、视觉AI推理、云游戏、桌面虚拟化等领域。

早在2020年11月,Intel就发布了首款面向服务器和数据中心的独立GPU,基于Xe LP低功耗架构的DG1核心,面向的就是高密度、低时延的安卓云游戏、流媒体服务。

全新的Flex系列则是基于Arc A系列独立显卡同款的Xe HPG高性能架构、DG2核心,支持H.264、H.265(HEVC)、AV1硬件编解码,VP4解码与传输。

该系列包括两款型号:

一是Flex 170,满血的32个Xe核心(512个执行单元/512个XMX引擎)、32个光追核心,基准频率1950MHz,最高加速2050MHz,搭配256-bit 16GB GDDR6显存,等效频率18GHz,带宽576GB/s。

整卡功耗150W,单插槽设计,PCIe 4.0 x16系统接口。

二是Flex 140,一半的16个Xe核心(256个执行单元/256个XMX引擎)、16个光追单元,基准频率、最高加速分别降低至1600MHz、1950MHz,搭配192-bit 12GB GDDR6显存,等效频率14GHz,带宽336GB/s。

整卡功耗也减半来到75W,系统接口同样减半至PCIe 4.0 x8。

这样的规格,应该分别对应桌面顶级型号Arc A770、主流型号Arc A580的水平,当然它们俩是没有视频输出接口的,频率、功耗估计也会不太一样。

Flex GPU系列集成最多四个Xe媒体引擎,相比于NVIDIA A10,可提供5倍的媒体转码吞吐性能、2倍的媒体解码吞吐量,而且只需要一半的功耗,开源的AV1硬件编码器还能节省30%以上的带宽。

它单卡即可支持多达36路视频流的1080p60转码吞吐量、8路视频流的4K60转码吞吐量。

在4U服务器中扩展到10卡配置时,可以支持多达360路视频流的H.265-H.265 1080p60转码吞吐量。

搭配Deep Link超级编码功能,Flex 140可在单卡上配备两套编解码设备,满足“一秒时延”要求,同时提供8K60实时转码,适用于AV1、H.265 HDR格式。

安卓云游戏方面,Flex 170、140分别支持多达68路、46路720p30数据流,Flex 140 6卡可以做到216路720p30数据流。

目前,Google Play商店中热门的近90款游戏都已经得到支持。

另外,Intel还提供了一整套开放式、包括开源组件和工具的软件堆栈(Open Software Stack),以有效实现Flex GPU面向视觉云工作负载的功能,包括对oneAPI、OpenVINO的支持。

戴尔、慧与(HPE)、新华三、浪潮、联想、超微等将陆续推出搭载Flex GPU的系统。

应用方面,首先从媒体传输、安卓云游戏开始,随后扩展到Windows云游戏、AI、VDI(虚拟桌面基础架构)。

Hot Chips 34大会上,Intel又公布了Ponte Vecchio GPU高性能计算卡的更多细节,包括性能数据。

Ponte Vecchio GPU基于全新的Xe HPC高性能计算架构,使用5种不同制造工艺(Intel 7和台积电N7/N5等)、多种封装技术,整合了多达47个不同计算模块,晶体管数量超1000亿个。

它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GB HBM2e高带宽内存,支持PCIe 5.0,可以四路甚至八路并联。

Intel给出的最新数据声称,Ponte Vecchio FP32单精度、FP64双精度性能可达52TFlops,TF3.2浮点性能可达419TFlops,BF16、PF16浮点性能可达839TFlops,INT8整数性能则可达1678Tops。

Data Parallel C++ (DPC++)测试项目中,Ponte Vecchio的性能相比于NVIDIA A100可以领先1.4-2.5倍。

另外,ExaSMR OpenMC计算性能可领先2倍,NekRS性能则领先0.3-1.7倍。

当然,NVIDIA新一代的H100都已经发布了……

Ponte Vecchio的使命是将联合下一代可扩展至强Sapphire Rapids,用于美国的首批三台百亿亿次超算之一Aorura,但不幸的是,Sapphire Rapids一再推迟,预计明年第二季度才能发布,Ponte Vecchio也一直没有量产上市。

相比之下,AMD三代霄龙处理器、Instinct MI250X加速卡组成的Frontier已经上线运行,并以1.6EFlops的性能,成为当今(公开的)超算之王。

同样是在本次HotChips 34大会上,NVIDIA公布了自研 CPUGrace的更多详情,感兴趣的不妨了解下。

NVIDIA设计CPU产品已经有段时间了,不过Tegra从手机、平板到盒子折腾一番后,最终发现自己的归宿在汽车自动驾驶以及任天堂Switch游戏机上。

抛开Tegra,NVIDIA在今年的GTC 2022上还公布了名为Grace的处理器,主要用于服务器、高性能计算等领域。

据悉,Grace处理器采用台积电4nm工艺制造,72核ARM v9指令集架构。注意,NV不是直接套用的ARM Cortex公版(比如X1/X2、A710等),而是和苹果一样,纯自行研制CPU核。

因为NVIDIA只卖两种Grace处理器集成方案,一是两颗CPU的双芯平台,一是Grace CPU+Hopper GPU的联合平台,所以一套系统就能做到144核规模。

此外,处理器还支持最大512GB的LPDDR5X内存(ECC),提供68条PCIe 5.0通道,三级缓存多达117MB。

性能方面,72核在Spec_Int中可拿到370分,大约是AMD EPYC 7742的一半水平(128核Zen2)。


硬件世界 共同研究探讨硬件知识及相关信息
评论 (0)
  • 文/Leon编辑/cc孙聪颖‍“无AI,不家电”的浪潮,正在席卷整个家电行业。中国家电及消费电子博览会(AWE2025)期间,几乎所有的企业,都展出了搭载最新AI大模型的产品,从电视、洗衣机、冰箱等黑白电,到扫地机器人、双足机器人,AI渗透率之高令人惊喜。此番景象,不仅让人思考:AI对于家电的真正意义是什么,具体体现在哪些方面?作为全球家电巨头,海信给出了颇有大智慧的答案:AI化繁为简,将复杂留给技术、把简单还给生活,是海信对于AI 家电的终极答案。在AWE上,海信发布了一系列世俱杯新品,发力家
    华尔街科技眼 2025-03-23 20:46 62浏览
  • 文/Leon编辑/cc孙聪颖‍去年,百度公关部副总裁璩静的争议言论闹得沸沸扬扬,最终以道歉离职收场。时隔一年,百度的高管又出事了。近日,“百度副总裁谢广军女儿开盒孕妇”事件登上热搜,持续发酵,引起网友对百度数据安全性的怀疑。3月19日晚间,百度正式发布声明,表示坚决谴责窃取和公开他人隐私的网络暴力行为,同时强调,百度内部实施匿名化、假名化处理,经查验,泄露数据并非来自百度,而是海外的社工库,“当事人承认家长给她数据库”为不实信息,针对相关谣言百度已经向公安机关报案。然而,并非所有网友都对这份声明
    华尔街科技眼 2025-03-21 21:21 78浏览
  • 核心板简介创龙科技 SOM-TL3562 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARM C ortex-A53 + 单核 ARM Cortex-M0 全国产工业核心板,主频高达 2.0GHz。核心板 CPU、R OM、RAM、电源、晶振等所有元器件均采用国产工业级方案,国产化率 100%。核心板通过 LCC 邮票孔 + LGA 封装连接方式引出 MAC、GMAC、PCIe 2.1、USB3.0、 CAN、UART、SPI、MIPI CSI、MIPI
    Tronlong 2025-03-24 09:59 104浏览
  • 在智慧城市领域中,当一个智慧路灯项目因信号盲区而被迫增设数百个网关时,当一个传感器网络因入网设备数量爆增而导致系统通信失效时,当一个智慧交通系统因基站故障而导致交通瘫痪时,星型网络拓扑与蜂窝网络拓扑在构建广覆盖与高节点数物联网网络时的局限性便愈发凸显,行业内亟需一种更高效、可靠与稳定的组网技术以满足构建智慧城市海量IoT网络节点的需求。星型网络的无线信号覆盖范围高度依赖网关的部署密度,同时单一网关的承载设备数量有限,难以支撑海量IoT网络节点的城市物联系统;而蜂窝网络的无线信号覆盖范围同样高度依
    华普微HOPERF 2025-03-24 17:00 84浏览
  • 今年全国两会期间,“体重管理”和“育儿”整体配套政策引发了持久广泛关注。从“吃”到“养”,都围绕着国人最为关心的话题:健康。大家常说“病从口入”,在吃这件事上,过去大家可能更多是为了填饱肚子,如今,消费者从挑选食材到厨电都贯彻着健康的宗旨,吃得少了更要吃得好了。这也意味着在新消费趋势下,谁能抓住众人的心头好,就能带起众人的购买欲望,才能在新一轮竞争中脱颖而出。作为家电行业的风向标,在2025年中国家电及消费电子博览会(AWE)上,这两个话题也被媒体和公众频繁提及。深耕中国厨房三十余年的苏泊尔再次
    华尔街科技眼 2025-03-22 11:42 46浏览
  •        当今社会已经步入了知识经济的时代,信息大爆炸,新鲜事物层出不穷,科技发展更是一日千里。知识经济时代以知识为核心生产要素,通过创新驱动和人力资本的高效运转推动社会经济发展。知识产权(IP)应运而生,成为了知识经济时代竞争的核心要素,知识产权(Intellectual Property,IP)是指法律赋予人们对‌智力创造成果和商业标识等无形财产‌所享有的专有权利。其核心目的是通过保护创新和创意,激励技术进步、文化繁荣和公平竞争,同时平衡公共利益与
    广州铁金刚 2025-03-24 10:46 28浏览
  • 无论你是刚步入职场的新人,还是已经有几年经验的职场老手,培养领导力都是职业发展中一个至关重要的环节。拥有良好的领导能力不仅能让你从人群中脱颖而出,也能让你在团队中成为一个值得信赖、富有影响力的核心成员。什么是领导力?领导力并不仅仅意味着“当老板”或者“发号施令”。它更多地是一种能够影响他人、激发团队潜能,并带领大家实现目标的能力。一位优秀的领导者需要具备清晰的沟通能力、解决问题的能力,以及对人心的深刻理解。他们知道如何激励人心,如何在压力下保持冷静,并能在关键时刻做出正确的决策。如何培养领导力?
    优思学院 2025-03-23 12:24 66浏览
  • 人形机器人产业节奏预估:2024年原型机元年,2025年小规模量产元年。当宇树科技H1人形机器人以灵动的手部动作在春晚舞台上演创意融合舞蹈《秧Bot》,舞出"中国智造"时,电视机前十几亿观众第一次深刻意识到:那个需要仰望波士顿动力的时代正在落幕。*图源:宇树科技短短数周后,宇树G1机器人又用一段丝滑的街舞在网络收割亿级播放量,钢铁之躯跳出赛博朋克的浪漫。2月11日,宇树科技在其京东官方旗舰店上架了两款人形机器人产品,型号分别为Unitree H1和G1。2月12日,9.9万元的G1人形机器人首批
    艾迈斯欧司朗 2025-03-22 21:05 99浏览
  • 在智能终端设备快速普及的当下,语音交互已成为提升用户体验的关键功能。广州唯创电子推出的WT3000T8语音合成芯片,凭借其卓越的语音处理能力、灵活的控制模式及超低功耗设计,成为工业控制、商业终端、公共服务等领域的理想选择。本文将从技术特性、场景适配及成本优势三方面,解析其如何助力行业智能化转型。一、核心技术优势:精准、稳定、易集成1. 高品质语音输出,适配复杂环境音频性能:支持8kbps~320kbps宽范围比特率,兼容MP3/WAV格式,音质清晰自然,无机械感。大容量存储:内置Flash最大支
    广州唯创电子 2025-03-24 09:08 113浏览
  • 在人工智能与物联网技术蓬勃发展的今天,语音交互已成为智能设备的重要功能。广州唯创电子推出的WT3000T8语音合成芯片凭借其高性能、低功耗和灵活的控制方式,广泛应用于智能家居、工业设备、公共服务终端等领域。本文将从功能特点、调用方法及实际应用场景入手,深入解析这款芯片的核心技术。一、WT3000T8芯片的核心功能WT3000T8是一款基于UART通信的语音合成芯片,支持中文、英文及多语种混合文本的实时合成。其核心优势包括:高兼容性:支持GB2312/GBK/BIG5/UNICODE编码,适应不同
    广州唯创电子 2025-03-24 08:42 104浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦