IP的发展就好比一只蝴蝶,从卵从幼虫,再到蝶变的过程,背后反映的是应用市场需求的变化和推动。越来越多的SoC厂家,开始考虑借助专业IP公司的力量,在某一领域中提供优质技术服务,从而降低其总拥有成本并节省产品进入市场的时间。

近年来,全球对半导体器件的需求持续增加,也因技术的进步导致产品单价下跌。此外疫情、经济环境也导致半导体市场整体需求不断周期性变化。但无论是产品生命周期还是标准迭代的变化中,高性能SoC IP的需求始终处于增长态势,这也带动了技术市场的提振。

“IP的发展就好比一只蝴蝶,从卵从幼虫,再到蝶变的过程,背后反映的是应用市场需求的变化和推动。越来越多的SoC厂家,开始考虑借助专业IP公司的力量,在某一领域中提供优质技术服务,从而降低其总拥有成本并节省产品进入市场的时间。”11月2日,在由深圳市易维讯信息咨询有限公司(EEVIA)举办的第10届年度中国硬科技媒体论坛暨产业链研创趋势展望研讨会上,Imagination产品市场高级经理 黄音女士在题为《30年积淀,SoC IP技术如何赋能未来硬核科技创新》的演讲中说到。

Imagination产品市场高级经理 黄音 女士

Imagination也将参与即将于11月10日在深圳大中华交易广场举办的IIC深圳(2022国际集成电路展览会暨研讨会)。届时Imagination中国区董事长白农将在同期举办的全球CEO峰会上发表主题演讲。IIC是由Aspencore主办的电子产业权威交流平台。展会设置IC设计专区、分销与供应链专区、综合展区等,集合了国际国内最顶尖的电子科技产业领袖。同期还将举办全球CEO峰会、全球分销与供应链领袖峰会、国际工业4.0 技术与应用论坛及第24届高效电源管理及功率器件论坛。点击这里报名参会

半导体产业链就像一个“倒金字塔”,数十亿美元的IP产业支撑着数千亿美元的半导体行业。据统计,2021年全球GDP约为96万亿美元,电子信息制造业规模约1.4万亿,而半导体的销售大概近6000亿,IP产值则是50多亿。

有数据显示,每年全球芯片的研发投入约为600亿,但IP研发投入只有36亿,占极小的6%份额。这也从侧面说明,IP是整个半导体上游产业链中的核心。换算下来,每1元的芯片能撑起200多元的社会经济;而每1元的IP,能支持20000元的社会经济价值,IP的重要性不言而喻。

大型半导体设计公司往往拥有有足够的技术、人才和资金储备,可以面向广阔市场在每一个细分领域和专项拓展。但对一些中小型、创业型的公司来说,成长过程需要专注核心领域,无法自研整个SoC的完整技术,需要IP公司的支持来突出优势并最终完成SoC设计。

IP公司的创新方向

IP公司在这个过程中的作用是提供核心领域的IP技术,协助验证、辅助流片等技术领域的事情。而包括芯片应用领域的应用技术和市场拓展,才是芯片设计公司应该专注的。黄音表示,Imagination作为一家拥有30多年历史的IP公司,“创新焦点一是性能,二是功耗,但它们的平衡——也就是PPA最重要。”

从常见的产品应用来看PPA的重要性,手机有电池供电,所以功耗非常重要;汽车因为在各种极限使用场景下都需要保证功能的稳定性,所以汽车芯片的功耗一定要保证散热的可持续性;服务器看似插电,但这类多集群设备24小时运转,也需要考虑到耗电和散热问题。而与芯片功耗直接相关的IP功耗,就显得非常重要。

市场趋势驱动着半导体技术的创新,灵活性和可扩展性非常重要。“过去,Imagination的技术主要应用在手机等嵌入式领域。如今随着国内内需市场中台式机、服务器、数据中心等对GPU需求的不断增加,从小核转向大核的扩展需要非常好的灵活性。”黄音说到,“其他需求还包括功耗、带宽和安全性。IP核供应商需要思考怎么在技术层面针对这些需求进行创新。”

第一方面,灵活性和可扩展性。以Imagination的C系列GPU核心CXT 8-256 RT1为例,该核心具有光线追踪功能,名称中的“8”表示贴图能力,“256”表示浮点运算能力,是最小的用在中端智能手机中的GPU核心。Imagination将其一路扩展到16-512、48-1536甚至64-2048的核,大单核性能可达到小单核的4-8倍,通过多核还可进一步提高性能,实现逻辑的扩大和增强。

为确保IP的可扩展性,Imagination采用了低耦合多核技术,它不像一般的SoC需要有中心核控制其它核工作,而是每个核有相同等级的权重和功能,信号不需要一定经过中心核可以节省能耗和带宽。

部分核心技术介绍

分块延迟渲染(TBDR)是Imagination最早提出的GPU核心技术,其优势在于不对整个贴图进行带宽渲染,而是进行分块后,把一个个小块上的图形数据一次性挪到GPU Cache中节省带宽。TBDR还能把负载在高性能GPU上高效分布,更加善于利用系统内存,并通过只渲染可见像素,放弃被覆盖或被遮挡的像素来大幅提高整体效率。

目前业内的SoC芯片大多采用硬件压缩技术,例如ASTC、ETC/ETC2等。Imaginatio的GPU硬件压缩技术PVRGC和IMGIC各有特点,其中IMGIC提供四种压缩等级,从像素完全无损模式,到可确保 4:1 或更佳压缩率的带宽极省模式。“除了无损压缩外,我们还能做有损压缩。例如25%、50%或75%的有损压缩后,肉眼看起来跟原图没有太大的差别,但能节省20%-40%的带宽。”黄音介绍到。

Imagination也是第一家实现GPU硬件虚拟化IP授权的公司,硬件虚拟化可以理解为对用户隐藏了真实的计算机硬件,表现为另一个抽象计算平台。以搭载GPU的智能计算单元为例,虚拟化让它具备了托管一个或多个虚拟机的能力,这样单个GPU可以支持多个同时运行的操作系统,而工作负载都提交给单个GPU,大大提升并行计算能力,缓解负载压力。

具体到汽车应用,OEM厂商可以通过采用硬件虚拟化技术来实现服务和应用程序的有效隔离。一方面可确保在系统被入侵或数据损毁时仍能保持安全,另一方面可任意部署或移除某个应用,而不影响其他同时在运行的服务。

黄音表示,硬件虚拟化有3个好处:

第一,节省硬件成本。通过硬件虚拟化技术,可以用单个GPU核最多支持8路虚拟OS,提高硬件利用率。这意味着用户可以实现“一芯多屏”。

第二、更低的软件成本。每个汽车OS都具有完整的驱动程序,并且可以以独立和并发的方式直接向GPU底层硬件提交任务。这大大减少了CPU控制调度的程序开销,以及软件移植和维护的工作量。

第三、安全性和健壮性。硬件虚拟化可在不同的汽车OS及其相对应的应用程序之间,提供安全隔离,非关键OS应用程序的失效不会影响到关键OS。除了隔离,还支持对多个汽车OS和应用之间,灵活地调整业务优先级和分配GPU性能。据悉,Imagination这技术已广泛应用于众多车型中。

Imagination还首创在GPU中放置小型固件核。它首先可以用于本地事务,同时Off load host CPU部分的工作,减少Host CPU的负载;其次,在GPU出错时,它能采集全部数据日志,并做错误分析;第三,它能通过GDB连接到GPU寄存器,进行一些Debug工作。另外基于固件的核还能通过GPIO,做一些用户需要的自定义业务。例如,连接外部的摄像头、AI或压缩解压缩的设备,进行功耗的控制。

PowerVR今年30岁了,回顾进化史

Imagination的王牌IP核产品PowerVR GPU,最早应用于Dreamcast等街机中, 后来专注于智能手机等嵌入式领域,如今诞生已经30年。

2019年,Imagination对GPU架构进行了大改进,推出了A系列AXT GPU。该内核是Imagination的第十代核,相较于第九代性能密度比(即单位面积的性能)提高了2.5倍,拥有更完善的运算逻辑单元,提高了纹理处理的能力,能够配置Cache,而且提高了压缩算法。

2020年,推出B系列BXT GPU产品开始支持4核多核技术,并且在算力上进行了优化,在微架构上进行了微调。

2021年,推出的C系列CXT GPU增加了光线追踪(RAC)的核,可以做到多核光追。

黄音认为,过去的50年是算法和算力发展的50年,计算的创新和演进聚焦于可扩展性、灵活性、效能、效率以及可编程性。“在软件上,Imagination有行业标准的API工具,支持不同的语言、API,同时还有可视工具和Debug设备,能够针对不同的AI应用场景需求做建模、部署和计算。”

当计算持续发展,异构计算将是必由之路。数据大爆发带来了AI计算的需求,包括SoC设计公司在内的芯片公司,都在追求更高性能、更低功耗、更节省带宽的方案。这就需要在硬件和SoC整体设计上采用异构解决方案,把不同类型的核进行集成,如CPU、GPU、NPU、神经网络加速单元等进行叠加,对数据进行专业分工和更先进的处理。

异构计算中,GPU的重要性不言而喻。以Imagination的GPU架构为例,完整的运算逻辑单元能进行乘、加、浮点运算、向量运算等。“我们支持浮点运算(FLOAT)到32位,以及INT8/16/32。纹理处理单元、反扭曲处理、基础过滤、结合着色器做更加复杂的过滤……这都通过GPU里的不同运算器来实现。”黄音说到。

从上面两张图的PowerVR GPU的系列运算单元架构演进史,ALU架构最大已经支持128 Pipelines。

Imagination在AI领域的研发也有十年历史,其神经网络加速器是一款高效率纯硬件加速器,也是对GPU计算的补充。例如,一些专有神经网络层可直接放到AI上做加速,一些网络计算、非最大值抑制、典型图形运算等,也可能需要GPU来做的。这就需要GPU和AI相互配合做计算。

在软件方面,Imagination有针对多核异构的IMGDNN中间件,往上能支持各家的运算库、框架、模型和算子;往下能够到Imagination的NC-SDK层(异构计算核心),主要支持GPU和NNA的DDK,从而驱动硬件。

2021年,Imagination推出全新RISC-V CPU核Catapult,作为对GPU和AI核的补充。资料显示,Catapult RISC-V CPU有SDK和集成开发环境(IDE),基于Visual Studio Code。

具体到应用

异构计算有非常多的应用场景,比如汽车。汽车行业目前正向高性能化、智能化、电动化甚至自动驾驶化方向发展,“未来我们将看到更多的人机交互屏,更先进的智能座舱,不但车与车之间可以交互,还能跟行人、路况及周边设备做交互,时刻把握行驶的安全可靠性,”黄音说到,实现这些需要非常多的计算,Imagination不但与芯片厂商、Tier 1厂商合作,还与OEM合作,所提供的一系列IP核都能够辅助计算。“目前我们在汽车GPU IP市场份额高达51%。”

据介绍,硬件实时光线追踪是Imagination最早提出来并实现的。光线追踪可以在不同的性能和效率等级下执行,为了明确这一点,Imagination 建立了光线追踪等级系统(RTLS),确定了从0级(Level 0)到5级(Level 5)共6个等级的光线追踪功能的要求。IMG CXT采用的Photon架构处于RTLS的4级(Level 4),这是当前可用的最先进的光线追踪技术,应用在移动端可为移动游戏玩家和开发者提供桌面级质量的体验。

如上图所示,光线追踪RT OFF时,阴影渲染非常生硬,阴影跟光线之间的分隔非常明显。但有了光线追踪技术,这些阴影会变得非常柔和,如果再加上全局光照GI,就能追踪每条光线的来源和去向,光线跟物体之间交汇的作用都会显示出来,让画面更加自然逼真。

谈到Photon架构的先进性,黄音表示,移动设备上光追,总会受限于面积和功耗的预算,所以需要高效架构解决方案。“Photon架构的硬件光线追踪和排序,对软件来说是透明的,确保硬件上并行追踪的发射光线具有潜在的相似性,这称为相干性聚集。而业界的其他光线追踪解决方案,大部分是在软件中完成这一关键步骤,不可避免地会更慢、更低效。”另一个要求是可扩展性,Photon架构中的高效单例RT核可线性扩展。IMG CXT-48-1536 RT3 内核具有三个 RAC 实例,性能可达 1.3GRay/s 。

黄音介绍到,这项技术推出后得到了业界大量应用厂商、游戏厂商的支持。不过目前Ray tracing在游戏主机和PC上还属于比较新的功能,对于移动设备开发者和生产商来说,更需要一些时间来跟进。Imagination已经在光追解决方案上深耕十余年,在最近的几年才开始授权。并且得益于Imagination的多核技术,Photon架构可以扩展应用于云、数据中心和PC市场。

Imagination也将参与即将于11月10日在深圳大中华交易广场举办的IIC深圳(2022国际集成电路展览会暨研讨会)。届时Imagination中国区董事长白农将在同期举办的全球CEO峰会上发表主题演讲。IIC是由Aspencore主办的电子产业权威交流平台。展会设置IC设计专区、分销与供应链专区、综合展区等,集合了国际国内最顶尖的电子科技产业领袖。同期还将举办全球CEO峰会、全球分销与供应链领袖峰会、国际工业4.0 技术与应用论坛及第24届高效电源管理及功率器件论坛。点击这里报名参会

责编:Luffy
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
不管怎么样,英特尔仍在努力推进18A芯片工艺,以期未来在最先进的芯片工艺上能与台积电、三星有一定的领先优势,毕竟其已经率先拿到ASML两台最先进的High NA(高数值孔径)EUV光刻机。未来,英特尔没有选择,只有抓住任何的可能性,硬着头皮上。
Xockets认为,英伟达凭借侵犯该企业专利的DPU产品垄断了AI GPU服务器市场,而微软则垄断了支持GPU的AI平台领域。此外,Xockets还称这两家科技公司就授权费建立了垄断同盟。
英伟达的CUDA生态系统和高性能AI GPU仍将作为核心竞争力,但要支撑其像以往那样的飞速的发展态势,必然要面临更大的挑战,或者已到增长的天花板。
Intel刚刚发布了至强W-2500与W-3500系列处理器,最高60个核心,面向工作站设备。现在的工作站,相比从前似乎已经大不一样了...
在性能方面,Granite Rapids-D至强6 SoC采用了英特尔最新的Intel 3工艺计算小芯片与基于Intel 4的边缘优化I/O小芯片相结合的创新设计,提供了显著的性能、能效和晶体管密度提升。
即使Rapidus已经获得9200亿日元的政府援助,但仍有大量资金需要从私营部门筹集。为了弥补这一资金缺口,Rapidus不得不寻求银行贷款和其他私人融资渠道。Atsuyoshi Koike也坦言,由于Rapidus的业务尚处于起步阶段,因此很难获得私人实体的支持。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
‍‍近期,IC 设计大厂联发科宣布了2024年上半年度的员工分红计划,与8月份薪资一起发放。据外界估算,按照上半年税前盈余约648.66亿新台币(约 144.42 亿元人民币)进行估算,此次分红总额接
据市场调查机构Allied Market Research的《单晶硅晶圆市场》报告指出,2022年单晶硅晶圆市场价值为109亿美元,预计到2032年将达到201亿美元,2023年~2032年的复合年均
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
‍‍据龙芯中科介绍,近日,基于龙芯3A6000处理器的储迹NAS在南京师范大学附属小学丹凤街幼儿园、狮山路小学、南京大学附属中学等学校相继落地。储迹NAS是基于最新的龙芯CPU--3A6000,其代表
今日碎碎念由于所租的共享办公空间政策的调整,上周我和我队友又搬到开放共享空间了。所以,也就有了新同桌。从我的观察来看,新同桌们应该基于AI应用的创业型公司。之所以想起来叨叨这个,是因为两位新同桌正在工
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
近日,3个电驱动项目迎来最新进展,包括项目量产下线、投产、完成试验等,详情请看:[关注“行家说动力总成”,快速掌握产业最新动态]青山工业:大功率电驱项目下线9月5日,据“把动力传递到每一处”消息,重庆