龙芯麒麟国芯双娇

原创 铁君 2023-09-10 22:00

         

         

上月,龙芯发布了新一代桌面CPU 3A6000,在单核性能上打平i3-10100F,其IPC追平了13代酷睿。紧接着,麒麟9000S问世。最近,有人向龙芯首席科学家胡伟武提问,龙芯3A6000和麒麟9000S孰强孰弱,对于这个问题胡伟武回答的比较委婉,说龙芯应该和英特尔、AMD比,麒麟应该和高通、苹果比。有鉴于此,铁流从技术上分析一下,两款芯片的差异。

         

龙芯是CPU 麒麟9000S是SoC

其实,胡伟武的答复是充满智慧的,因为这既避免得罪人,又说明了龙芯和麒麟的差异。

龙芯3A6000是一款桌面CPU,由于电脑空间大,GPU、桥片都可以布置在主板上,集成度不高。麒麟9000S是一款手机SoC,由于手机对空间要求苛刻,因而必须有非常高的集成度,才能节省空间,手机的SoC集成了CPU、GPU、DSP、ISP、NPU、基带等诸多模块,使一款手机芯片具有非常丰富的功能,苹果的M1处理器甚至把内存都集成到SoC里。

正是因此,龙芯和英特尔、AMD的CPU是同一类,麒麟和高通、苹果的处理器属于同一类。硬要对两者进行比较的话,由于3A6000不具备麒麟9000S的很多功能,因而如果就这些方面进行对比,龙芯是非常吃亏的。

比如麒麟9000S集成了GPU,龙芯的GPU集成在桥片,3A6000没有集成GPU,比GPU性能,麒麟9000S完胜;

3A6000 没有集成DSP,麒麟9000S集成了DSP,比DSP性能,麒麟9000S完胜;

比如麒麟9000S集成了NPU,龙芯3A6000 没有集成NPU,比NPU性能,麒麟9000S完胜。

不过,在两者在某些方面是可以进行比较的。比如指令集自主水平,CPU性能和制造工艺。

在指令集上,龙芯采用自主指令集LoongArch,麒麟9000S采用的是ARM v8.2,在自主水平上龙芯完胜。

在制造工艺上,龙芯采用的是境内12nm工艺,麒麟9000S采用的是境内新锐工艺,因而可以获得更高的集成度和更低的功耗,在工艺上,麒麟9000S占优。至于CPU性能对比,稍后再介绍。

由于龙芯和麒麟是不同类型的芯片,拿来对比不太合适,其实,拿龙芯和鲲鹏进行对比才比较合适。

         

麒麟9000S大核定点对标A78 浮点接近X1

虽然在GPU、NPU、DSP等方面不适合拿龙芯和麒麟进行对比,但就CPU部分,还是可以从测试数据中来探个究竟的。

根据SPEC测试,编译环境为GCC12.0 -Ofast,麒麟9000S在2.6Ghz主频下,SEPC06 单核定点成绩为35.5,浮点成绩为50.6。

SEPC17测试,编译环境是GCC12.0 -03,麒麟9000S单核定点成绩为4.14,浮点成绩为6.51。由于浮点性能对超算意义大,对手机意义有限,因此我们主要看定点成绩。

作为参照,ARM的X3核心在3.1Ghz主频下,定点可以达到61.7分;X1在3Ghz下,定点可以达到50.3分;2.8Ghz的A710达到38.7分;2.4Ghz的A78达到32.33

换算为IPC就是:

x3,61.73/3.1=19.91

x1,50.38/3=16.79

a710,38.76/2.8=13.84

a78,32.33/2.4=13.47

麒麟9000S的大核,35.55/2.61=13.62

再来看SPEC2017测试下麒麟9000S的大核和ARM公版架构的IPC对比。

x3,6.58/3.1=2.122

x1,5.71/3=1.9

a710,4.05/2.8=1.45

a78,3.62/2.4=1.51

麒麟9000S的大核,4.14/2.61=1.58

从数据可以看出,麒麟9000S的大核在定点上与a78相当。

         

另一家机构的测试也可以看出,麒麟9000S在SPEC2017测试下比较亮眼的是浮点性能,已经接近X1的水平。

总结一下,麒麟9000S的CPU核在定点上对标A78,在浮点上接近X1,与X3这样的公版架构尚有一定差距。

         

CPUIPC 麒麟不如龙芯

SPEC06实测数据看,麒麟9000SIPC达到13+/G(定点),龙芯6000的IPC达到17+/G(定点)。从SPEC17实测数据看,麒麟9000SIPC达到1.58/G(定点),龙芯6000的IPC达到2.08/G(定点)。

9000S的大核心是6发射,A78是4发射,等于说用了更多资源,最后堆出来的核定点与A78差不多,同样6发射的龙芯6000 IPC追平13代酷睿,9000S的CPU核逻辑设计只能算中规中矩,尚有较大提升空间。

必须说明的是,龙芯的编译器是GCC8.2,测试麒麟9000S用的是GCC12。GCC对ARM的支持,比对LoongArch好,LoongArch才出现3年,过于年轻,龙芯在软件上几乎都是“负优化”,在编译器方面,龙芯尚处于补课阶段,而X86和ARM经过多年优化,GCC对X86和ARM非常友好。正是因此,胡伟武说计划用2-3年完成编译器的补课,完成补课后,能够把性能提升10%—20%。

从中可以看出,龙芯3A6000的逻辑设计是非常强悍的,在制造工艺落后一代,且编译器拖后腿的情况下,实测IPC依然比麒麟9000S高25%。

也许有人会说龙芯IPC高是因为9000S只要4M缓存,而龙芯6000有16M缓存,麒麟9000S的大核心可以用于鲲鹏处理器,届时就可以弥补缓存的不足,进而大幅提升IPC。

事实上,缓存对IPC有影响,但影响不足以抹平IPC上两者的差距。

用数据说话,i3-10100F和i9-10850K,两者的核心是相同的,不过i3的三缓是6M,i9的是20M。只要把它们锁定到相同的频率来测试,就可以知道三缓从6M提高到20M后,可以把性能提高多少。

把i3-10100F和i9-10850K都锁定到1.0GHZ的频率,都使用双通道3200内存,使用相同的编译参数和系统环境测试SPEC CPU2006 int base,得到的成绩如下:

i3-10100F @ 1.0GHz int base=12.9

i9-10850K @ 1.0GHz int base=13.2

也就是说,把三缓从6M增加到20M,可以带来2%左右的性能提升。

如果新一代鲲鹏CPU把把9000s的4M三级增加到16M,性能的提升比例也应该是2%左右。简言之,基于9000s的CPU核开发鲲鹏CPU,其IPC会有提升,但提升会比较有限。

由于PC和服务器上,功耗限制不会像手机上那么严格,新一代鲲鹏CPU的主频可以往上提一提。

铁流估算,新一代鲲鹏CPU(3Ghz)的SEPC06 单核定点成绩为38-40,这个性能已经很强了。

作为参照,3Ghz主频的Intel i3-10100F  SEPC06 单核定点成绩为36.5:

3.5Ghz主频的Intel i3-10100F成绩为41.6

4Ghz主频的Intel i3-10100F成绩为46.4。

2.5G的龙芯3A6000成绩为43.1。

总的来说,瑕不掩瑜,毕竟定点IPC可以对标A78,这个性能已经很不错了,只要不运行高负载的3A游戏,足以满足绝大部分应用。


麒麟和龙芯有着截然不同的定位

麒麟和龙芯是两种截然不同定位下的芯片,麒麟的定位是商业芯片,可以从国外购买外商技术授权,可以买台积电尖端工艺流片,其商业化受益于ARM+安卓体系,可以运行AA体系软件生态。

几年前,麒麟就因为过度依赖ARM授权和台积电尖端工艺——从K3V2到麒麟9000,其CPU、GPU核全部从外商购买,一直采用台积电尖端工艺。这是这种依赖性导致其在4年时间内“绝版”,直到最近才随着境内新锐工艺的良率攀升,才实现“王者归来”。

龙芯的定位是自主CPU,要求高度自主可控,自研LoongArch指令集和全套IP,始终与境内工艺保持同步,一方面是因为龙芯穷,买不起台积电尖端工艺,另一方面也是龙芯为了保证自主可控,始终坚守底线思维。在麒麟用上台积电16nm时候,龙芯使用的是境内40nm工艺;当麒麟用上台积电5nm工艺时,龙芯使用的是境内12nm工艺。

正是依靠自主指令集LoongArch,自主研发核心IP,坚持使用境内工艺,自建软件生态,使龙芯在被美国列入实体清单后,不受丝毫影响,始终保持了正常的迭代速度。

总的来说,麒麟9000S是目前国内基于境内新锐工艺打造的最强ARM芯片,功能丰富,集成度高,在商业市场上非常具有竞争力。但在CPU核设计,以及自主可控水平上与龙芯有差距。

龙芯3A6000是基于境内12nm工艺和LoongArch指令集打造的自主桌面CPU,在IPC上已经追平了英特尔13代酷睿,在国产CPU中单核性能最强,且自主程度最高。但在工艺上与麒麟有差距,在软件上存在明显短板。

麒麟9000S和龙芯3A6000有各自的优势与不足,在各自的优势领域都会有很好的前景。

         

         

         

         

         

铁君 集成电路 人工智能
评论
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-12 10:13 25浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 108浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 83浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 63浏览
  • 铁氧体芯片是一种基于铁氧体磁性材料制成的芯片,在通信、传感器、储能等领域有着广泛的应用。铁氧体磁性材料能够通过外加磁场调控其导电性质和反射性质,因此在信号处理和传感器技术方面有着独特的优势。以下是对半导体划片机在铁氧体划切领域应用的详细阐述: 一、半导体划片机的工作原理与特点半导体划片机是一种使用刀片或通过激光等方式高精度切割被加工物的装置,是半导体后道封测中晶圆切割和WLP切割环节的关键设备。它结合了水气电、空气静压高速主轴、精密机械传动、传感器及自动化控制等先进技术,具有高精度、高
    博捷芯划片机 2024-12-12 09:16 80浏览
  • 在智能化技术快速发展当下,图像数据的采集与处理逐渐成为自动驾驶、工业等领域的一项关键技术。高质量的图像数据采集与算法集成测试都是确保系统性能和可靠性的关键。随着技术的不断进步,对于图像数据的采集、处理和分析的需求日益增长,这不仅要求我们拥有高性能的相机硬件,还要求我们能够高效地集成和测试各种算法。我们探索了一种多源相机数据采集与算法集成测试方案,能够满足不同应用场景下对图像采集和算法测试的多样化需求,确保数据的准确性和算法的有效性。一、相机组成相机一般由镜头(Lens),图像传感器(Image
    康谋 2024-12-12 09:45 74浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 106浏览
  • 本文介绍瑞芯微RK3588主板/开发板Android12系统下,APK签名文件生成方法。触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,该开发板是核心板加底板设计,音视频接口、通信接口等各类接口一应俱全,可帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。工具准备下载Keytool-ImportKeyPair工具在源码:build/target/product/security/系统初始签名文件目录中,将以下三个文件拷贝出来:platform.pem;platform.
    Industio_触觉智能 2024-12-12 10:27 29浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-11 17:58 83浏览
  • 应用环境与极具挑战性的测试需求在服务器制造领域里,系统整合测试(System Integration Test;SIT)是确保产品质量和性能的关键步骤。随着服务器系统的复杂性不断提升,包括:多种硬件组件、操作系统、虚拟化平台以及各种应用程序和服务的整合,服务器制造商面临着更有挑战性的测试需求。这些挑战主要体现在以下五个方面:1. 硬件和软件的高度整合:现代服务器通常包括多个处理器、内存模块、储存设备和网络接口。这些硬件组件必须与操作系统及应用软件无缝整合。SIT测试可以帮助制造商确保这些不同组件
    百佳泰测试实验室 2024-12-12 17:45 27浏览
  • 首先在gitee上打个广告:ad5d2f3b647444a88b6f7f9555fd681f.mp4 · 丙丁先生/香河英茂工作室中国 - Gitee.com丙丁先生 (mr-bingding) - Gitee.com2024年对我来说是充满挑战和机遇的一年。在这一年里,我不仅进行了多个开发板的测评,还尝试了多种不同的项目和技术。今天,我想分享一下这一年的故事,希望能给大家带来一些启发和乐趣。 年初的时候,我开始对各种开发板进行测评。从STM32WBA55CG到瑞萨、平头哥和平海的开发板,我都
    丙丁先生 2024-12-11 20:14 68浏览
  • 全球智能电视时代来临这年头若是消费者想随意地从各个通路中选购电视时,不难发现目前市场上的产品都已是具有智能联网功能的智能电视了,可以宣告智能电视的普及时代已到临!Google从2021年开始大力推广Google TV(即原Android TV的升级版),其他各大品牌商也都跟进推出搭载Google TV操作系统的机种,除了Google TV外,LG、Samsung、Panasonic等大厂牌也开发出自家的智能电视平台,可以看出各家业者都一致地看好这块大饼。智能电视的Wi-Fi连线怎么消失了?智能电
    百佳泰测试实验室 2024-12-12 17:33 34浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦