北京时间9月2日晚,华为在德国柏林的IFA展上正式发布麒麟970芯片。麒麟970采用10nm工艺打造,CPU、GPU以及Modem全面提升,全球首次内置神经元网络单元(NPU)完成人工智能计算。预计将在10月16日德国慕尼黑发布的Huawei Mate 10上首用。
图为华为消费者业务CEO余承东进行以“终端智能”为主题的演讲
在麒麟970芯片上,总计包含55亿晶体管(骁龙835是31亿颗,苹果A10是33亿颗),面积约100平方毫米(骁龙835约为153平方毫米)。
如果你是一个非常看重手机 SoC 的 CPU、GPU 极限表现的‘性能党’,麒麟 970 可能不会让你太兴奋。
CPU方面,麒麟970最大的改变是,由之前台积电的16nm工艺直接提升到了10nm,这也看出了华为想要与竞争对手一比高下的决心,毕竟无论是高通骁龙835,还是联发科X30处理器都已经采用了10nm的制作工艺。
核心配置上,麒麟970与麒麟960基本相同,进行了小小的提升。采用4Cortex-A73+4Cortex-A53的公版大小核设计,其中A73大核主频为2.4GHz(麒麟 960 是 2.36GHz),A53小核主频为1.8GHz(麒麟 960 是 1.84GHz)。
在发布会上,余承东并没有透露上述麒麟 970 CPU 性能相比 960 的变化,只表示麒麟 970 的能耗比提升了 20%(主要得益于全新的 10 纳米工艺)。至于实际的性能表现,不出意外的话,麒麟 970 应该和麒麟 960 处于同一段位,不会有非常明显的提升。
麒麟 970 并没有用上 ARM 在今年 5 月发布的新一代 Cortex-A75、Cortex-A55 架构以及为 AI 相关运算优化的 DynamiIQ 设计。当然了,考虑到 A75 和 A55 的发布时间、设计的复杂程度,麒麟 970 没用上也是可以理解的。
当然,横向来看的话,麒麟 970 的 CPU 性能没提升其实不是什么大问题。从 GeekBench 4 等跑分软件的得分上看,麒麟 960 的分数和高通骁龙 835、三星 Exynos 8895 基本处于同一水准,明显强于联发科 Helio X30。因此,即使麒麟 970 的 CPU 性能不变,也依然是 Android 阵营里移动 SoC 的顶级水准,只是不再像麒麟 960 发布时那么领先。
GPU上麒麟970提升的诚意更足些,用上了ARM今年5月刚发布的Mali-G72 MP12,ARM 的官方说法是相比 G71 性能提高 20%,功耗比提升 25%。在视频方面首次支持HDR10,支持4K@60fps视频解码,4K@30fps视频编码。相机双ISP,支持人工智能场景识别、人脸追焦、智能运动场景检测,夜拍效果增强。
此外,在核心数上,麒麟 970 的 GPU 也从麒麟 960 的 8 核增加到了 12 核。
实际性能上,余承东表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,并且能效比提升了 50%。
照理说,由于麒麟 970 的 GPU 核心架构比麒麟 960 更先进,核心数还多了 50%,并且工艺更先进,GPU 性能提升的幅度应该远不止 20%。之所以出现这种情况,很可能是华为将麒麟 970 的 GPU 主频压得比较低,从而更好地降低功耗(于是就有了提升幅度高达 50% 的能效比)。不出意外,麒麟 960 上出现的 GPU‘满血跑’时功耗感人的情况,麒麟 970 上不会再出现。
作为一家通讯行业有着多年积累的公司,华为海思基带方面一直是杀手锏,麒麟970也进行了较大提升,支持LTE Cat18,最高下载速度达到1.2Gbps(4x4 MIMO,3CC CA,256QAM),要知道骁龙835号称千兆LTE的最高下载速度为1Gbps。
麒麟 970 还终于支持了在同时使用两张 SIM 卡时,主副卡同时用 4G(上一代麒麟 960 的副卡只能支持 3G)。此外,麒麟 970 还特别针对高铁时的使用做了优化,信号更稳定,减少掉线。
不过话还是要说回来,虽然麒麟 970 的通讯基带的确是厉害,但和骁龙 835、Exynos 8895 等支持千兆 LTE 的 SoC 一样,普通用户想要真正体验到这种超高速 LTE 网络,还得过上相当一段时间。
一方面,超高速 LTE 网络需要运营商的支持,虽然目前全球不少运营商(包括中国联通)已经开始了千兆级 LTE 的测试,但距离大规模商用还仍需时日。另一方面,在手机端,除了需要 SoC 自身的基带支持,如果要支持千兆级的 LTE,手机厂商还必须在手机的天线设计上投入额外的精力,以搭载骁龙 835 的手机为例,在目前上市的众多骁龙 835 手机中,真正能支持到千兆 LTE 的只有三星 Galaxy S8、HTC U11 等少数国际品牌机型的部分型号。
麒麟 970 的 ISP 主要是一些‘常规升级’,依然是双核设计,拥有更快的速度,更快地对焦,更优秀的降噪效果,并且对运动图像的捕捉做了优化。
在 DSP、配套 Codec 等方面,麒麟 970 也有所提升,其中配套的音频 Codec 可以支持 32bit/384k 的音频解码,过去几代华为高端机(Mate、P 系列)上表现乏善可陈的内放音质,有望在麒麟 970 这代产品上获得明显的提升,当然前提是 Mate 10 和 P11 系列还能保留 3.5 毫米耳机插孔。
另外,麒麟 970 依然搭载了 i7 协处理器,而 inSE(integrated secure element)和 TEE 安全引擎,在麒麟 970 上也都在。
在总线架构上,不出意外的话,麒麟 970 采用的应该是和 960 相同的 CCI-550。
在发布会上,余承东也表示,台积电的 10 纳米工艺可以降低 20% 的能耗,将芯片核心面积缩小 40%。
不过有趣的是,麒麟 970 的核心面积并没有因为工艺的进步而缩小,反而比麒麟 960 还要略大,这是因为麒麟 970 集成了高达 55 亿个晶体管,比麒麟 960 多出了 15 亿。
55 亿个晶体管是什么概念呢?大家可以参考几个数字。
Intel 在 2014 年发布的拥有 18 个核心的至强 E5 CPU,也才内置了 55.6 亿个晶体管。在更具对比价值的移动 SoC 中,以‘堆料’著称的苹果 A10 拥有 33 亿个晶体管,高通骁龙 835 拥有 31 亿个。
需要说明的是,虽然晶体管数量对性能有一定的影响,并且通常是越多越好,但在芯片工艺、架构不同的情况下,我们是无法简单地用晶体管数量来判断性能的,尤其是在内部部件众多的移动 SoC 中。
最特别的部分,麒麟970也是全球首款内置神经元网络单元(Neural-network Processing Unit,NPU)的人工智能处理器,NPU运算能力达到1.92TFP16 OPS。内部测试显示,这种性能允许麒麟970每分钟处理2005张图像,而在没有NPU的情况下每分钟只能处理97张图像。
关于这颗 NPU 的功能,大家可以简单理解为专门高效地进行 AI 相关计算定制的处理器,就像 GPU 之于图形处理相关的计算,ISP 之于成像相关的计算。从现场演示来看这种处理数据远胜三星S8以及iPhone7。
传统的 CPU(包括 x86 和 ARM)和 GPU 也是可以用来做深度学习计算的,但由于它们本身并不是专门为深度学习定制的,效率并不高。余承东表示,麒麟970在AI任务下完成比正常CPU内核快25倍的特定任务,并且能够减少50倍的功耗。同时华为也将开放其人工智能的处理平台。
从上图可以看到,性能上,NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是达到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。
在华为内部的测试中,麒麟 970 的 NPU 每分钟可以识别出 2005 张照片,而不使用 NPU 的话则每分钟只能识别 97 张(这个速度应该是用 CPU 进行计算的),优势同样巨大。
至于这颗 NPU 具体能实现哪些特别的功能,我们还需要等到 Mate 10、Mate 10 Pro 上来揭晓。在发布会上,余承东提到了一些 NPU 在拍照方面的应用。
具体到拍照中,NPU 可以帮助手机更精准和快速地识别拍摄场景,让手机选择最合适的图像处理算法,在双摄背景虚化时,让手机对边缘虚化的处理更准确,还有最近很火的 AR 相机,NPU 可显著提高渲染的速度,降低功耗。
再比如说,有了 NPU 之后,手机可以将语音和语义识别的部分工作转移到手机本地,提高语音和语义识别的表现,提高手机中语音交互应用(比如语音输入法、智能语音助手)的体验。
据此前报道,麒麟 970 的这颗 NPU 采用了来自寒武纪(Cambricon)的 IP,专门为深度学习而定制。
华为表示,麒麟970芯片预计将在10月16日发布的华为Mate10新机上首用。麒麟970的官方宣传片上也出现了一款全面屏手机的轮廓,而Mate 10极有可能将采用这样的外观设计。
今天麒麟970正式发布,且不说其具体跑分如何,至少从全球首次搭载的NPU芯片上来看,已经完胜骁龙、联发科、苹果、三星等处理器。而在这个十条手机新闻八条都是iPhone8的时候推出麒麟970芯片,也可以看出华为要做行业老大的决心。
本文综合自搜狐科技、极客公园报道
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。