三星电子系统LSI昨天在上海举办了Exynos 1080芯片的发布会,电子工程专辑已经第一时间发布了相关的快讯。这是三星电子系统LSI首次在中国内地召开芯片产品的首发会议。这个动作应该是在很多人的意料之中的:本月早前, BusinessKorea就报道System LSI“计划在2021年向中国智能手机制造商提供Exynos芯片”,而且除了常规合作伙伴vivo之外,还包含OPPO和小米等。

三星电子系统LSI昨天在上海举办了Exynos 1080芯片的发布会,电子工程专辑已经第一时间发布了相关的快讯。这是三星电子系统LSI首次在中国内地召开芯片产品的首发会议。这个动作应该是在很多人的意料之中的:本月早前, BusinessKorea就报道System LSI“计划在2021年向中国智能手机制造商提供Exynos芯片”,而且除了常规合作伙伴vivo之外,还包含OPPO和小米等。

所以在中国召开Exynos新品发布会,显然是System LSI要铺开中国市场的开端——预计明年我们会看到更多国产手机搭载三星Exynos芯片。

Exynos 1080并不在旗舰定位,它理应属于Exynos 980的继任者,而非Exynos 990。其同档竞品应该是麒麟820、骁龙765G。

值得一提的是,三星此前宣布不再采用自研架构的CPU,实则与Exynos 1080/980这个定位及以下的产品也是无关的,比如Exynos 980采用的是Cortex-A77大核心,而Exynos 990的大核心才是三星自研的M5。猜测这一代更高定位的Exynos 1090会加入Cortex-X1大核心。

本文分成三部分:(1)Exynos 1080本身;(2)三星5nm工艺;(3)Cortex-A78核心。读者可以按照兴趣选择性阅读。

配置综述,Exynos 1080的一些亮点

这场发布会上,三星透露有关Exynos 1080芯片的技术细节比较少,但我仍然期望借着这篇文章来简单谈谈其中的一些亮点。主要包括了三星的5nm工艺,以及这颗芯片的CPU部分率先采用的Cortex-A78大核心(GPU部分的Mali-G78此前已经撰文详述过,本文不再单独讨论)。

Exynos 1080主要配置罗列如下:

 ▪ CPU:1x Cortex-A78 2.8GHz,3x Cortex-A78 2.6GHz,4x Cortex-A55 2.0GHz;

 ▪ GPU:Mali-G78 MP10

 ▪ 内存支持:四通道 LPDDR4 & 5;

 ▪ ISP:单摄2亿像素支持,双摄3200万+3200万像素支持,最多可接收6个传感器信号(6摄),同时可接收3路输入信号;

 ▪ NPU:与DSP联合算力5.7TOPS,另可与ISP协作,实现AISP“AI图像处理”;

 ▪ Modem:支持5G Sub-6GHz 5.1Gbps下行 1.28Gbps上行;毫米波 3.67Gbps下行 3.67Gbps上行;支持2G-4G网络,4G LTE Cat.18 6CA 1.2Gbps下行 2CA 200Mbps上行;

 ▪ 其他无线连接:蓝牙5.2,WiFi 6;

 ▪ 其他:显示支持WQHD+ 90Hz,FHD+ 144Hz;HDR+高动态范围视频技术,原生10bit 4K 60fps视频编码与解码;游戏加入了Amigo电源管理系统;

 ▪ 制造工艺:三星5nm(5LPE)

这里面还是有不少内容是值得拿出来好好说一说的。因为篇幅关系,本文仅略微带过。其中CPU终于采用了Cortex-A78,这是Arm今年年中对外公开的CPU IP。前不久的华为麒麟9000就没有赶上Cortex-A78的时髦。

Exynos 1080的CPU整体是1+3+4的核心搭配,其中有个频率最高的Cortex-A78核心,频率为2.8GHz。这个频率在如今的旗舰市场上是不算高的。骁龙865+与麒麟9000的Cortex-A77大核都已经把频率提到了3.0GHz以上。

但2.8GHz还是比Exynos 980的2.2GHz要高不少的。这一点其实也能看出Exynos 1080的定位是偏次旗舰的。三星半导体中国研究所所长潘学宝表示,与上代产品相比,CPU单核性能提升50%,多核性能提升100%(基于Geekbench 5的数据)。

这里的所谓“对比上代”是指Exynos 980。不过50%和100%的提升仍然是比较恐怖的数字,略有旗舰水准。尤其大核的Cortex-A78,应该是贡献良多的,单就三星宣称的Geekbench 5成绩来说,应该已经超过了骁龙865的水平。

Exynos 1080的GPU部分是Arm最新的Mali-G78,麒麟9000采用的也是这个GPU。但在规模上前者就远远小于后者了:麒麟9000的GPU是采用Mali-G78最高支持的24个核心,而Exynos 1080为10核心。

三星没有公布GPU的频率,只是提到“计算核心从原来5个,提升到10个,存储通道由双通道变为四通道”,这显然说的就是对比Exynos 980了。与此同时,“GPU性能相比上代,提升130%,是上代的2.3倍之多”(基于Manhattan 3.0测试数据)。

此前Exynos 980的GPU大约可以应付《和平精英》这类游戏的中低特效,虽说Exynos 1080的GPU规模仅有麒麟9000的一半不到,不过这次至少相比前代应该会有游戏方面较大程度的提升,而且效率可能会提升不少——当然主要还得看具体的实施方案。

有关Mali-G78,我在麒麟9000的剖析文章中已经有比较详细的介绍。Mali-G78是Valhall架构的第二代核心IP,G78实则相比G77是个小改款。不过在性能和效率上,Mali G76/G77已经与同代的高通Adreno比较接近。上代Exynos 980采用的是Mali-G76MP5的方案,G76仍然是Bifrost架构,所以在架构翻新、核心数翻倍、工艺改进的基础上,性能提升130%是在意料之中的。有关G78的更多内容,这里不再赘言,可移步《全面剖析麒麟9000:华为Mate 40碾压了谁?》一文了解详情。

在图形计算部分,比较值得一提的是潘学宝提到的Amigo电源管理方案。这是主要面向游戏的一个方案。潘学宝表示,这种节电解决方案能够实时监控各流程电源消耗情况,优化游戏过程中的总功耗,令电源效率提高10%。“在游戏运行时,动态监测功耗,并作出预测,实时给出最佳电源分配方案,保证游戏性能的同时,节约整体功耗。”

“拿《王者荣耀》做测试,Amigo能够在保证性能不变的前提下,总体耗电下降10%以上。”潘学宝说。除此之外,他并未再透露更多有关这项技术的细节。不知道这是个硬件方案,还是个软件方案。

听起来和华为的GPU Turbo以及更为传统的reactive DVFS驱动有些类似(一个是GPU驱动之间有个监听层用于监听渲染调用;另一个则是通过硬件计数来监听GPU利用率,再做调整;前者有着更细的调节粒度),而且GPU Turbo实际的功耗红利也在10%左右。

以上硬件参数中,另外值得一提的是AISP,即“基于AI的图像处理”,也就是NPU+ISP的融合。这一点,麒麟9000的媒体沟通会上也提过。我在此前的文章中也提到了,NPU+ISP是拍照与拍视频后处理的一个趋势。苹果和谷歌在更早的时间就已经在做了,谷歌也时常介绍Pixel手机怎样利用机器学习,做自动白平衡、防抖等的加强——虽然谷歌是通过外置一颗PVC芯片的方案。

所以潘学宝也提到通过NPU,做拍摄物体与风景的检测,优化白平衡与曝光——这在当代算是比较常规的思路。不过三星并未透露Exynos 1080所用NPU的型号和性能。三星有将NPU与DSP融合做AI计算的传统。Exynos 1080的官方页面提到,NPU+DSP,令Exynos 1080能够达到至多5.7 TOPS的性能表现[1]。作为参考Exynos 990的AI算力在15 TOPS左右。

三星的5nm工艺

这颗芯片的亮点主要在5G modem和5nm工艺上。有关5G支持部分,支持载波聚合达成5.1Gbps最高下行速率。三星对此介绍也比较简单,这还是要看终端产品的实施方案。另一方面,以Exynos 1080的定位,想必明年也会有更多便宜的5G手机上市了。

5nm工艺很有必要多谈一谈。Exynos 1080的5nm工艺具体应该是5LPE。发布会上,三星半导体System LSI市场部副总裁CY Lee提到,三星5nm EUV工艺,芯片面积减少25%,功耗效率提升20%,性能表现提升10%。这组数字其实还是比较抽象的。

三星5LPE相对于7LPP工艺来说,算是个1/4代工艺——这一点就与台积电N5很不一样(三星路线图中,7LPP、6LPP、5LPE、4LPE都属于一代内的进化,而下一代工艺应该是3GAE),或者说三星7LPP->5LPE的跃进幅度远没有台积电N7->N5那么大。其标准单元库的晶体管密度提升1.3倍。

实际上,5LPE工艺晶体管的fin pitch、gate pitch、metal各层间距基本上都没什么变化。从Wikichip的数据来看,5LPE的UHD(超高密度,54PP)单元库密度在126.89 MTr/mm²(HD单元库密度91.36 MTr/mm²)[2]。

如果一定要对比的话,台积电N5工艺的超高密度库晶体管密度在171.3 MTr/mm²,相比N7的密度推进为1.84倍[3]。当然,我在《为什么说Intel的10nm工艺比别家7nm更先进?(上)》一文中就提到过,晶体管密度的计量方法有差异,而且晶体管在芯片上也不是均匀分布的,以及即便是同代工艺的不同单元库的密度也不一样,所以不同厂商的晶体管密度数字实则并不应该直接比较。

5LPE实际上更像是三星7nm工艺的一个扩展。因为三星此前的工艺路线图上,7nm工艺就已经比别家的更为激进,更早在某几层采用了EUV(极紫外光)。所以5LPE所用的晶体管、SRAM也都和7LPP基本相同。而且7LPP的设计IP在5LPE上是可以复用的,迁移比较平滑。

来源[4]

晶体管各项参数没什么变化,又如何实现密度提升呢?这就叫scaling booster了。主要还是从单元(cell)来着手。

5LPE最大的提升是新的6T UHD单元库,主要特性包括SDB(single diffusion break)、36nm的M2间距,CB on RX edge等(RX是指单元的活跃区域,CB属于额外的本地互联层,在单元内横向布局,将接触层的触点连接到多晶硅本地互联——位于第一层金属层之下,也就是MOL互联;所以CB on RX edge也就是CB互联层用到单元活跃区域边缘);还增加了一种低漏电的1-fin device(1个p fin,1个n fin)能够提供至多20%的功耗节约。

这里的SDB,我在介绍Intel 10nm工艺的文章里也提到了,实际上就是单元之间共享单个dummy gate的方案,对于增加晶体管密度都是有价值的。三星曾在14nm工艺中用过这个结构,只不过7nm没有采用SDB,而是DDB(也就是两个dummy gate)。前面这些都属于常规晶体管缩放之外的技术,被称作scaling booster。

5LPE相比7LPP的实际提升是:对于HD高密度(7.5T)库而言,性能提升了11%(同功耗下,速度提升11%;同性能下,功耗降低约20%);而UHD超高密度(6T)库则实现了大约33%的密度提升,也就是前面提到的126.89 MTr/mm²。下面这张图是三星在Arm TechCon 2019会议上提供的:

再看下Wikichip画的这两种单元库,相比之前7nm单元之间的差异。8nm和7nm HD单元都减掉了一个fin,而且7LPP每个fin也实现了更高的驱动电流,也就能有更好的性能——减fin则能够获得面积方面的收益。5LPE的UHD单元库再减1个fin——所以整个单元高度就变小了,加上稍作加强的晶体管(包括low-k spacer、DC加强等),实现面积和功耗的小幅缩减。

来源:WikiChip[2]

当然,若考虑性能的话,HD库还是必要选择。HD库的CPP(gate pitch)仍然是60nm,和7LPP工艺一样,另外单元间用MDB(mixed diffusion break,混合间隔,即pMOS用SDB,而nMOS用DDB),性能肯定会更好。

有关Cortex-A78大核心

最后再花一点笔墨谈谈Arm的Cortex-A78处理器核心。Cortex-A78仍然是Arm v8.2指令集的一颗CPU;它也是Austin家族中的第三代产品。

Cortex-A78的微架构调整,从前到后主要着重在效率提升,包括面积效率和功耗,尤其是针对A77的部分结构和尺寸做了缩减——针对那些收益并不是很高的资源做缩减,或者说进一步找准了性能与功耗/面积的甜蜜点。

前端部分最大的变化是分支预测器:除了精度提升外,现在能够处理至多每周期2个分支——平衡了去年A77后端多出的第二个分支执行单元。即A78每个周期可并行处理2个预测,增加这部分的核心吞吐,并且更快地从分支错误预测中恢复过来。前端设计变化主要还包括可选32KB的L1I cache(指令缓存)。

核心中段到执行管线部分,绝大部分提升是针对面积缩减和能效提升的:包括更多的指令融合;发射序列设计新结构提升能效;寄存器重命名结构和寄存器堆,也特别针对效率做了优化——包括尺寸的缩减,条目密度增加,相同空间内可以容纳更多数据,减少结构的整体尺寸,但对性能无影响;re-order buffer效率,可以塞进更多指令;乱序窗口尺寸缩减;6Mops的dispatch宽度,应该是比去年增加了的。

执行部分,唯一较大的变化是整数执行模块,升级了一条更复杂的ALU管线,可处理乘法,令整数MUL宽度加倍。

核心后端和存储子系统有更多相关性能的调整。首先是新的load AGU(地址生成单元),令核心的load操作带宽增加了50%;load/store队列到L1D cache(数据缓存)的带宽翻倍,核心到L2的读取与写入带宽翻倍;可选更小配置的L1D(32KB);L2 TLB缩减至1024 pages——仍然足够应对4MB L3 cache。

这么看下来,感觉的确有不少的结构、尺寸缩减。Cortex-A78作为着重在效率提升上的一代微架构,看来明年高性能的担当的确会落在Cortex-X1身上。最终还是落地到Exynos 1080身上来看看吧。

市面上还不怎么能见到采用A78核心的CPU产品。因为没有对比对象,我们无从了解Exynos 1080对于Cortex-A78的实施方案具体怎么样。

Arm年中给出过一组A78相比A77各方面提升的数据,但那些主要是基于台积电的N5工艺——就让此处的对比没有那么凑效,所以提升数字就权当参考吧。

Arm的数字是,一个核心相同的1W功耗下,A78(3.0GHz,N5工艺)会比A77(2.6GHz,N7工艺)提升20%的性能;而在相同的性能水平上,A78(2.1GHz,N5工艺)功耗是A77(2.3GHz,N7工艺)的一半。这两组对比看起来还是略有点随意的……如果以相同制造工艺为前提,加上相近的核心配置,A78相比A77大约有7%的性能提升,同时降低4%功耗和4%的占地面积。

三星提及Exynos 1080的Geekbench 5单核性能成绩相较Exynos 980提升50%。考虑这两代产品工艺上是8LPP->5LPE,频率提升27%,外加架构迭代,似乎有50%的性能提升还算合理。但Arm针对两代架构所说的20%性能提升,实则已经加入了频率和工艺差异。个人认为50%的性能提升还是略超出预期的——或许5LPE工艺带来的性能提升是部分超出了预期的。

有兴趣的同学可以参考联发科天玑1000(2.6GHz Cortex-A77,N7工艺)以及Exynos 980(2.2GHz Cortex-A77,8LPP工艺)的Geekbench 5成绩来算一算,按照单核性能50%提升、多核100%提升,Exynos 1080的性能水平在哪里,以及5LPE工艺和Cortex-A78架构实际可能带来了多大的性能红利。

另外,三星不曾在发布会上提到Exynos 1080的功耗与能效表现。Arm此前公布的数据显示,在A77达到峰值性能,且A78达到与其相同性能的情况下,A78的功耗可降低至多36%(相同功耗水平下,A78提升性能至多7%)。所以Exynos 1080 CPU的效率还是可以期待一下的。

总体来看,上述CPU提升,再加上Exynos 1080对GPU的Mali-G78MP10实施方案,若三星在设计和制造上都相对得宜,这颗芯片或许会成为明年非常有竞争力的甜品级、且长寿命的芯片。因为其各方面表现都比较均衡,而且性能和效率就中端市场定位来看,还有个飞跃。

三星在发布会上提到,首款搭载Exynos 1080的手机会由vivo推向市场。另外三星也强调了vivo也参与了Exynos 1080的研发过程。这些在去年的Exynos产品中就已经是传统了。就纸面数字来看,三星的确在推广自家芯片、拓宽芯片市场的问题上开了个好头,具体还是要看这颗芯片的实测表现——以及Exynos 1080将会在多少机型上应用。

参考来源:

[1] Mobile Processor Exynos 1080 - 5G processor that will make your phone fly

(https://www.samsung.com/semiconductor/minisite/exynos/products/mobileprocessor/exynos-1080/)

[2] Samsung 5 nm and 4 nm Update - Wikichip Fuse

(https://fuse.wikichip.org/news/2823/samsung-5-nm-and-4-nm-update/)

[3] TSMC Details 5 nm - Wikichip FUse

(https://fuse.wikichip.org/news/3398/tsmc-details-5-nm/)
[4] High-Performance 5LPE Implementation Next-Generation Arm “Hercules” CPU. Kevin K. Yee (Samsung), Fakhruddin Ali Bohra (Arm), Edson Gomersall (Cadence). Arm TechCon 2019

责编:Yvonne Geng

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 麒麟9000主要差在没有用上A78架构。被人家卡脖子。但是普通用户感觉不出来。就是耗电大点。
阅读全文,请先
您可能感兴趣
9月10日,苹果发布了一系列新品,包括iPhone 16系列手机、Apple Watch Series 10智能手表和AirPods 4耳机。发布会后网上响起了一片吐嘈声,带着这些吐槽,我们来看看这次苹果到底有没有新玩意……
不管怎么样,英特尔仍在努力推进18A芯片工艺,以期未来在最先进的芯片工艺上能与台积电、三星有一定的领先优势,毕竟其已经率先拿到ASML两台最先进的High NA(高数值孔径)EUV光刻机。未来,英特尔没有选择,只有抓住任何的可能性,硬着头皮上。
一直听说x86指令集天生做不了低功耗,真的是这样吗?这篇文章着重谈谈酷睿Ultra二代是怎么考量低功耗的,有没有可能做到低功耗...
Xockets认为,英伟达凭借侵犯该企业专利的DPU产品垄断了AI GPU服务器市场,而微软则垄断了支持GPU的AI平台领域。此外,Xockets还称这两家科技公司就授权费建立了垄断同盟。
经营业绩下滑,以及在代工业务上的巨额亏损以及市场需求疲软,也或是英特尔出售Mobileye股份的重要原因之一。
英伟达的CUDA生态系统和高性能AI GPU仍将作为核心竞争力,但要支撑其像以往那样的飞速的发展态势,必然要面临更大的挑战,或者已到增长的天花板。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
点击蓝字 关注我们德州仪器全球团队坚持克服挑战,为电源模块开发新的 MagPack™ 封装技术,这是一项将帮助推动电源设计未来的突破性技术。  ■ ■ ■作为一名经验丰富的马拉松运动员,Kenji K
在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
周二,捷普科技(Jabil)官员与印度泰米尔纳德邦代表团在泰米尔纳德邦首席部长MK Stalin的见证下,签署了一份备忘录。MK Stalin正在美国进行为期17天的访问,旨在吸引新的投资。MK St
在德国柏林举行的IFA 2024上,AMD计算和图形业务集团高级副总裁兼总经理Jack Huynh宣布,公司将把以消费者为中心的RDNA和以数据中心为中心CDNA架构统一为UDNA架构,这将为公司更有
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
近日,又一国产SiC企业宣布实现了主驱突破,并将出口海外。据“行家说三代半”的追踪统计,自2022年起,国内主驱级SiC器件/模块开始在多款车型中得到应用,尤其是2024年,本土供应商的市场份额显著上
近日A股上市公司陆续完成2024年上半年业绩披露,其中24家SiC概念股上半年合计营收同比增长14.58%至1148.65亿元,研发费用同步增长7.22%至69.16亿元。尤为值得注意的是,天岳先进、
往期精选2023年度中国移动机器人产业发展研究报告发布!超200个——2024年上半年AGV/AMR行业中标项目盘点市场保有量超10000台的8大中国AGV/AMR厂商总额超190亿-盘点全球移动机器
随着汽车智能化升级进入深水区,车载ECU(域)以及软件复杂度呈现指数级上升趋势。尤其是多域、跨域和未来的中央电子架构的普及,以及5G/V2X等车云通信的增强,如何保障整车的信息与网络安全,以及防范外部