Imagination发布新一代GPU,全面解读光追技术在移动端、Chiplet/异构计算在汽车领域的应用趋势

原创 EETOP 2023-01-18 18:04

近日,Imagination隆重推出其新一代GPU IP产品IMG DXT。据介绍,DXT高配包括DXT72-2304 RT3,50%的性能增加和计算能力增加,标配达到2.25T浮点运算能力,72GB像素填充能力,9TB的AI推理能力,同时把D4光线追踪技术进行可配置化、可扩展化,黄金搭档搭配光线追踪一起使用。


█ DXT的三大关键技术


DXT产品主要是面向手机游戏。从ABI 2022年的调查显示,手机游戏用户会将会从2022年的26亿增长到2030年的39亿。此外,到2026年,85%的游戏玩家将首选在手机上玩游戏。Imagination认为,手机游戏有三个趋势是非常值得重点关注的:

  • 越来越沉浸感的体验。

  • 更高的性能,更流畅的体验。

  • 低功耗,一直充电或者功耗比较大,这些对手机的玩家也是不可以接受的。


DXT产品的关键技术包括可扩展的光线追踪技术、可变速的着色技术,以及在手机游戏领域可以提高性能、降低功耗的关键技术。Imagination首席营销官David Harold表示:“随着移动游戏市场的不断增长,我们需要平衡该市场对低功耗的要求和对逼真沉浸式画面的渴望。作为高效移动光追领域的领导者,我们正在加快光追的采用并推动整个生态的发展。”


让光追变得触手可及


最近一到两年,光线追踪的热度很高。光线追踪解决的是让3D游戏场景中的光照更加贴近真实生活中的折射和反射。Imagination 中国区技术总监艾克介绍说:“IMG DXT可以使移动设备制造商能够根据自己的设计目标将光追技术集成到他们的系统级芯片(SoC)中。DXT的Photon架构是目前唯一达到光追系统(RTLS)4级的光追设计,这意味着它能够以业内效率最高的方式提供领先的视觉效果。“


Imagination在光线追踪领域有超过十年的技术积累和开发。根据技术特点的不同,Imagination提出了用于区分光线追踪等级技术的RTLS系统。

  • 第一级的光线追踪技术都是软件实现的,开销比较大,CPU占用资源比较高。

  • 第二级的光线追踪技术对一些光和或者三角形碰撞用硬件处理,其实就节省了CPU资源,目前典型的桌面显卡都是这项技术。

  • 第三级的光线追踪技术对BVH回溯就有硬件支持,这是光线追踪描述大场景下的结构,就是大小矩形框把整个场景描述,光线在这里碰撞需要回溯,放在硬件来做的时候能耗功耗比就下来了。

  • 第四级的光线追踪技术有别于前面,除了光和自动测试和回溯,还能把相同光线上的光数统一计算,可以用统一的指令运行。

  • 第五级的光线追踪技术是Imagination的储备技术。


以前的光线追踪技术很多都是应用在PC和主机上。这样的设备,本身的带宽和能耗的要求是可以得到满足的。但移动端就不行,因为移动端的能耗和运算带宽本身受到的限制比较大,所以要尽可能地把这些光线追踪的能力都部署到硬件级别,才能更好地在移动端解决光线追踪的问题。2021年,Imagination发布光线追踪技术,把这项技术引入手机领域,让手机也能用上光线追踪技术,当年也因此获得最佳IP设计奖。


艾克分享说:“DXT提供的是第四级别。与相同移动配置下的CXT相比,DXT能够将提供可用光追的面积成本降低40%。开创性的光追GPU将为所有移动设备用户带来最先进的图形技术。”



Vulkan®的片段着色率(FSR)技术


IMG DXT支持Vulkan的片段着色率(FSR)技术,为开发者带来了性能上的裕量。FSR在尽可能不影响视觉质量的前提下减少处理的片段数量并大幅提高图形性能,同时通过减少投射到场景中的光线提高光追的效率,这意味着可以在更小的硅片面积上实现逼真的灯光和阴影。


FSR是一种可以在几乎不降低图像质量的前提下减少片段着色器运行次数的技术,能够降低占用的带宽与功耗。开发者可以控制FSR的使用力度,最极端的情况下甚至可以对一个4x4的片段区域只执行一次着色器代码,从而使工作负载减少近94%,实现同等的功耗和带宽节省。所解放的性能使开发者能够利用硬件来完成更多的内容渲染,为玩家打造更高质量的游戏体验。


全新三重通用着色器集群USC


IMG DXT GPU搭载全新的着色器处理单元(SPU)。SPU是一个硅片,包含一个用于计算任务的算术逻辑单元(ALU)和一个用于像素着色、几何处理和光栅化逻辑的纹理处理单元(TPU)。


凭借全新三重通用着色器集群(USC)设计(3个ALU/TPU单元),DXT GPU将每个SPU的高端计算和纹理(ALU/TPU)性能提升50%以上,而以前的架构只侧重于双USC设计(2个ALU/TPU单元)。这个改进后的模块使Imagination能够创造出最高性能的高端移动GPU--DXT-72-2304,这款GPU在1GHz时钟频率下具有72GTexels/s和2.5TFLOP FP32性能。


█ IP的技术趋势


Imagination是世界第四大硅IP,就是硅知识产权的提供商。芯片设计通常由自主设计部分与外购IP组合而成。半导体IP行业处于整个产业链最上游,可为芯片设计提供预先设计、经过重复验证的、可重复使用的功能模块。当前,IP在芯片设计中的占比有提高的趋势。



Imagination 公司副总裁兼中国区总经理刘国军分享说:“当前,半导体开发的成本在不断快速攀升。SoC或者芯片的设计者和提供商对第三方IP的需求将会迎来爆发式增长。”


随着摩尔定律接近极限,IP的发展也出现了两个尤为关键的趋势。异构变得很重要,Chiplet也变得很重要。刘国军介绍:“我们的IP,其实过去几年就在考虑和Chiplet合作,异构计算就更不用讲了。我们的GPU、CPU和AI都是为支持异构计算来做的!”


Chiplet和异构集成


Chiplet,小芯片,又称为模块芯片,是系统级芯片(SoC)集成发展到后摩尔时代后,持续提高集成度和芯片算力的重要途径。它创新了芯片封装理念,把原本一体的SoC分解为多个芯粒,分开制备出这些芯粒后,再将它们互联封装在一起,形成完整的复杂功能芯片。Chiplet最大的优势是降低成本和提升芯片集成度,且有利于后续产品迭代,加速产品上市周期。


日前,阿里达摩院发布的2023十大科技趋势提到,面向后摩尔时代,Chiplet可能将是突破现有困境最现实的技术路径。Chiplet可以降低对先进工艺制程的依赖,实现与先进工艺相接近的性能,成为半导体产业发展重点。从成本、良率平衡的角度出发,2D、2.5D和3D封装会长期并存;同构和异构的多芯粒封装会长期并存;不同的先进封装和工艺会被混合使用。Chiplet有望重构芯片研发流程,从制造到封测,从EDA到设计,全方位影响芯片产业格局。


在显著的技术方案优势下,Chiplet也早已引来多家巨头竞相布局。进入2013年,更是多家企业相继发布其Chiplet产品。1月6日,在2023年美国消费电子展(CES)上,AMD发布了首款数据中心/HPC级的APU“Instinct MI300”,这款APU采用的就是Chiplet(芯粒)技术,在4块6nm芯片上,堆叠了9块5nm的计算芯片,以及8颗共128GB的HBM3显存芯片。1月11日英特尔在北京发布了代号为“Sapphire Rapids”的第四代英特尔至强可扩展处理器,该GPU的一大亮点之一便是,它是英特尔首款基于Chiplet(芯粒技术)设计的处理器,扩展了多种加速器引擎,被英特尔称为“算力神器”。


Imagination作为IP领域的领先企业,对Chiple的关注和战略部署又是什么呢?为此,EETOP特别采访了Imagination首席营销官David Harold和Imagination技术产品管理高级总监Stephen Barton



EETOP:您如何看待Chiplet对IP企业发展的影响?当前,Chiplet面临的最大挑战,您认为是什么?


David Harold:作为一家IP公司,Chiplet对我们来说肯定是非常值得关注的一个领域,它意味着我们可以把原有的IP进行重复使用。Chiplet应用本身在制造、使用和设计都会更加方便展开这些异构的计算,很多产品做成Chiplet以后可以在装配前进行提前测试,避免了在装配完成后才发现测试失败,没有办法通过。在这种情况下,失败的是单一的Chiplet,不会影响到整个设备和Device。尤其对很多小的、初创型芯片企业,如果需要做SoC的话,那Chiplet将是一个比较好的切入点和新的切入方向。


当前,Chiplet的最大挑战就是接口过于碎片化,但这样的挑战比起Chiplet的发展给大家带来的益处而言,未来效果肯定会更好,所以值得大家克服这样的挑战。


EETOP:Imagination在Chiplet领域的推进计划是怎样的?您如何看待像英特尔、ADM这样的大半导体公司在Chiplet领域的发展?如果Imagination开发Chiplet的产品,着力点会放在哪?竞争优势又是什么?


Stephen Barton:我们当初设计B系列GPU就已经专门针对Chiplet做了相应的设计,能够更好地适应未来在Chiplet中的应用。这样的设计理念和思路也将会延续下去,包括现在的D系列以及以后新的GPU里面。


David Harold:其实Chiplet是介于IP和芯片组之间存在的形式,英特尔这样的大型半导体公司就更像是可以利用Chiplet把内部原有的IP技术变得像我们一样进行IP化,就是把X86往ARM或者RISC5的方向发展,大的半导体公司也会利用这样的机会拓宽外部的IP市场,一定程度上变得像一家IP公司一样,通过这样的方式运营。


很多异构架构把CPU、GPU、AI和以太网结合到一个Chiplet,这确实可以带来很多未来先进的应用场景,也有很多机会,会在某些特定的市场上大放异彩。手机上一直推行采用最新的工艺节点和SoC,可能Chiplet不会那么快地展开手机场景中的应用,但其它应用场景比如汽车或者消费电子,Chiplet都是大有可为,我们自己也非常感兴趣。


再加上另外一个趋势,就是异构计算。我们公司对RISC-V一直都是很有信心的。它一定会带来颠覆性的、巨大的变化,改变很多的东西,只不过这个过程会是需要时间的,可能是十年以后。我们希望GPU IP可以成为诸多RISC-V架构的首选,现在有很多RISC-V相关的IP Vendor,但能提供GPU IP的并不多,我们希望进一步巩固这种领导地位。


EETOP:谈到汽车行业,这是大家都非常关注、也是未来非常重要的一个市场。在汽车领域,SoC有一个趋势,就是把CPU和GPU集成在一块,这个方向是不是未来的技术趋势?除了这个趋势以外,SOC目前还有哪些值得关注的方向?Imagination2023年在汽车领域有没有什么汽车创新和技术部署的规划?


David Harold:目前对车辆相关的解决方案有多种不同的设计形式,其中包括异构计算,也有把CPU和GPU捆绑整合在一起,放在车辆上的同一位置或者以传统的方式分开,放在不同的离散连接方式,通过离散的方式连接起来放在车内不同的位置。现在还不能确定哪种趋势就已经成为技术路线上的一种主流。我们是比较偏向于异构计算,毕竟我们自己在AI、GPU和CPU方面的能力都很强,也有很强的能力合理地在这些不同的芯片中分配合理的工作量。针对这些车辆上的应用有一个关键点,不管采用何种方式进行架构的部署,最重要的一点就是所有设备都要符合车规级的要求,达到ISO26262的标准,ISOD和ISOB。


目前Imagination已经有很多IP应用在数以万计的车辆,也有相应的其它技术储备,HMI、ADAS高级驾驶辅助系统,车辆使用的CPU、GPU和这些设备中的连接方式等,而且都是能够符合车辆功能安全级别。车辆专属的设计在我看来是比其它的整不整合更加重要的事情,我们现在已经有了专门为车辆应用去做设计的能力、团队以及心态,这才是目前最重要的一点。


补充一点,汽车行业真的已经开始越来越多地应用RISC-V架构的CPU,我们第一家RISC-V的客户就是车企,现在有越来越多的企业尝试嵌入式的RISC-V,如Google定义未来各种设备都会采用RISC-V,包括移动端,我们认为最先到来的使用RISC-V大规模的使用场景一定会是汽车行业


█ 结束语


Imagination是世界第四大硅IP,就是硅知识产权的提供商。Imagination有近三十年的技术积累,是以GPU立足行业,核心技术有着非常大的优势。


刘国军分享说:“过去三年,Imagination最大的变化是更换新的CEO、制定公司整体战略以及中国战略。新的战略主要Focos四大应用领域:传统的Mobile,Consumer、Automotive、Data Centre。其中

Automotive是Imagination的传统强项,目前我们的汽车GPU还是市场占有率超过一半。不过,新的GPU既要用于渲染又要用于计算,这是一个新的变化。这也是我们当前面临的挑战之一。”


紧紧抓住中国市场,是Imagination应对挑战的关键策略之一。据刘国军介绍,在过去的两年,Imagination中国业务的增长带动整个新的Imagination在过去的年增长率达到33%。目前,Imagination正在加大中国的生态建设,从整机厂到游戏厂。



刘国军表示:“作为Silicon IP的主要提供商,Imagination的成功正是跟整个行业、客户以及合作伙伴一起,生态化发展。希望Imagination拥有这些核心技术以及IP价值位置,能够给中国半导体既有挑战又有机遇、有着非常巨大发展潜力的市场做出我们应有的贡献。”

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 198浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 399浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 122浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 101浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 186浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 112浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 41浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 150浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 182浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 53浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 437浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 339浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦