华为Mate 40系列手机中国区的发布会今天刚刚在上海举办,其中最引人注目的部分自然就是在这个特殊历史时期出现的海思麒麟(Kirin)9000 SoC了。本文主要探讨麒麟9000这颗芯片——虽然电子工程专辑此前已经在这款手机的全球发布会期间,对这颗芯片做了简单的探讨,我还是希望能够更全面地来呈现这颗,未来回看可能具有历史意义的SoC。

GPU:秒杀高通Adreno?

麒麟9000的GPU部分是非常值得一说的。去年麒麟990并未按照我们的预期,采用Arm Mali G77,而是继续采用麒麟980时期的G76。此前我曾撰文提到过,高通如今正逐渐在GPU部分丢失往常的优势:如果Mali G77能够按照Arm预期的那样,那么Mali GPU很可能实现对Adreno GPU性能和效率的同时追平。

悲剧的是,华为并未采用G77。而实施G77的三星Exynos 990(Mali G77MP11)与联发科天玑1000(MP9),在规模上都不够大——前者多方面的问题还相当一言难尽。这就让我们无从了解,G77到底是个什么水平。加上骁龙865的Adreno 640小小发挥了一下,在不少测试中的效率表现都和苹果相差不大了(性能仍有差距),Arm Mali阵营这边就急需一款产品来证明GPU的实际水准。

麒麟9000直接跳过G77,用上了Mali G78。华为给出的数据是,相比骁龙865+,麒麟9000的GPU性能领先52%,能效领先50%。从华为的PPT来看,对比的是GFXbench 5.0 Aztec Ruins Vulkan项目(不过极有可能,性能提升和效率提升的测试条件是不同的)。单纯从这个跑分来看,可能已经达到了苹果A13或者A14的水平——余承东在手机发布会现场列出了iPhone 12 Pro与Mate 40 Pro+的GPU跑分性能,两者似乎的确已经是相近水平:虽然目前还不清楚这是峰值性能还是持续性能,以及并未有能效比较的数据。

无论如何,这两个分数都是相当巨大的领先,这使得今年Mate 40系列手机的游戏表现非常令人期待。

华为自己的实际游戏性能测试是,“某国内TOP MOBA类游戏”满帧状态的能效,平均比“友商”(也就是骁龙865 Plus,三星Galaxy Note 20 Ultra)优秀20%;包括《王者荣耀》《和平精英》《明日之后》等在内的多款主流游戏,系统能效比都优于骁龙865+——这似乎还是华为首次在反复提GPU的“能效”,而不单纯是性能:表明这次的底气比以往都更充足。

事实上,Mali G78相比G77并没有发生太大的变化。但G77是首次换用了Valhall架构——算是一次大变动,G78则是个改款。仍然建议有兴趣的同学阅读此前有关Mali G77的文章《Arm新版Mali GPU简析:这次终于赶超高通和苹果?》。G77相比G76,性能密度提升30%,能效提升30%;主要是G77的shader核心换用新的执行引擎,16-wide warp执行模型,合并为一个执行引擎,提升ALU利用率。

因为此前G76已经有了一次Arm Mali阵营的大跃进,所以G77就纸面数字来看还是比较优秀的。而G78,Arm的数字是结合微架构与制造工艺的双重改进,相较G77有25%的性能提升。相同工艺情况下,性能密度提升15%(相同面积下,获得15%性能提升);能效提升10%。

Mali G78支持的最大核心数目提升到了24个核心,不知该说Arm Mali这种增多核心的路线是种进步还是退步——麒麟9000显然拉满了这个数字,算是G78的顶配了(9000E则为22个核心),从去年开始似乎华为已经不再走过去那种高频少核的路线了。

G78的执行核心与前代相比没什么变化,就是延续了Valhall架构的特色(16-wide,合并为一个引擎);shader核心整体上也没什么变化。其最大的变化在于从整个GPU的全局频域(frequency domain)变为两级结构,最顶级的共享GPU模块为一个频域,shader核心为一个频域——也就是GPU内部不同步的时钟域,shader核心可以跑在不同的频率下。只是不知道麒麟9000是否实施了这个方案。

这事实上解决了Mali GPU一个很大的问题:要在屏幕上推更多数量的多边形时,以前只能全面推高运行频率。如今市面上出现的新游戏普遍是几何处理工作偏重的,将tiler和几何引擎运行频率解耦,就能够解决吞吐不平衡的问题。另外就是,理论上能效也能得到改进——只不过要增加额外的电压域实施,也就增加了系统的成本。除此之外,G78的FMA引擎做了翻新,主要是乘法器结构变化,以及FP32和FP16路径做了隔离,据说是以面积来换取30%的节能。

大概也是因为GPU性能和效率水平真的上来了,艾伟今年谈了不少游戏画质相关的东西。而且事实上,在《原神》这类游戏开始出现在手机之上,更多原本属于PC和主机的游戏体验、特效,都开始向移动平台迁移。

包括SSR屏幕空间反射、MSAA/TAA抗锯齿,以及动态模糊、体积光+实时阴影等更好的游戏画质实现上,华为宣传的是麒麟9000在更好地实现这些特效的基础上,同时做到高帧率,以及更高的效率——如上图所示,是对比某尚未发布的游戏,在开启HDR、MSAA抗锯齿等特性后,稳定60fps运行,以及实现比“友商芯片平台”(这个对比对象未知)高了一倍的效率(图中中间mW/frame数值)。这其中应该也有AI的辅助:早年Kirin 970时期起,通过机器学习来达成针对特定游戏、特定设备的最优化DVFS调度。

所以Mate 40的GPU实际表现,的确令人十分期待。骁龙875的GPU恐怕会面临比较大的压力。

NPU:现在有什么用?

麒麟9000的NPU升级到达芬奇架构2.0,“NPU算力翻倍”。当然我们不清楚达芬奇架构2.0相比1.0,到底改了些什么。比较抽象的形容是“MAC规模翻倍,卷积网络性能翻倍,核间通讯带宽翻番”。所以AI Benchmark(ETH AI Benchmark V4.0)之类的拿“全球第一”也并不奇怪。另外华为这次特别提到了Int8数据类型的性能与能效。

艾伟说AI普及后,手机终端越来越多地需要做8位整型数据计算,而不是浮点FP16。用ResNet50网络来跑,麒麟9000的Int8性能较骁龙865+高出60%,能效则高了150%——这应该和高通的AI Engine始终不上专核,而主要靠强化DSP与异构计算有关。

SoC层面另外值得一提的就是前文已经提到过的system cache。由于这个末端cache容量增大,很多情况下各IP模块就不需要再去调用DRAM。由于带宽的成倍增加,以及能效的提升,NPU与其他处理器工作的实时性才有更好的保障。

往年的NPU介绍,大致上也就停留在这个程度了。今年华为似乎急着想要证明,NPU究竟能用来做什么。事实上,Android阵营的AI生态发展得并没有那么高速,即便华为始终在说HiAI支持的人工智能网络算子是业界最多。但华为在这个生态上的建设,真可谓不遗余力。这次艾伟主要列举了NPU的三个用处:AI视频处理、AI拍视频、AI AR。

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • a15 isp 和麒麟9000isp
  • 100~150ms玩游戏是高ping了。理想ping值要在小两位数左右。
  • 没有如果
  • 理性文字
  • 如果华为的麒麟装到苹果手机上面不知道会怎么样
  • 写得非常清晰,赞
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202