【微处理器】最高性能RISC-V处理器和Arm比起来,究竟如何?

电子芯期天 2021-05-29 08:00

采用RISC-V架构的处理器不经意出现在日常电子产品中,似乎已经变得越来越稀松平常了:不仅是一些典型的MCU厂商开始拥抱RISC-V,如我们之前采访的泰凌微电子,以及已经推出RISC-V产品线的兆易创新;

而且还体现在一些业已成熟的产品中,如去年的中国IC领袖峰会上,我们与硅谷数模对话,了解到如今十分成熟的TCON芯片内部竟也不显山、不露水地加入了RISC-V小核心;还有像是前些年英伟达就开始在其GPU产品中选择RISC-V作为控制器;西数也在整个产品线上开始选择RISC-V核。

这让我们对于RISC-V指令集的处理器微架构也愈发感兴趣:去年10月,SiFive发布了首款RISC-V乱序CPU核心,U8系列处理器IP。SiFive在宣传中提到,U8系列是目前最高性能的RISC-V指令集核心IP(似乎晚于玄铁910),“基于超标量乱序管线,以及可配置的管线深度和发射序列宽度”。

SiFive在RISC-V的微架构IP授权中还是相当活跃的一家企业,其7系与8系IP核,作为RISC-V世界的高性能核心,是我们观察RISC-V当前发展情况的一个重要窗口,虽然微架构剖析大约并不能特别好地呈现指令集本身的特性,但通过它们与Arm的对比,也是了解RISC-V生态的机会。

最高性能的RISC-V核心,比起Arm如何?

我们首先有必要搞清楚,SiFive内部针对不同系列的产品的定位。在SiFive举行的一场名为"Embedding Intelligence Everywhere with SiFive 7 Series Core IP"的在线会议上,SiFive曾经对自家产品线进行过总结。SiFive的E系列核心,着眼在32bit嵌入式使用场景;64bit的S核心则偏向算力需求更大的场景;而U系列核心是性能最强的定位,面向高端计算。

若以数字为切分维度,SiFive的2系列是RISC-V处理器IP中效率最高,同时也最小型的处理器IP;3系列、5系列则在部署上更为广泛,用在一些多核配置和对实时处理能力要求较高的场景;7系列和8系列如上所述都着力于高性能。数字与字母组合,就构成了不同的产品,比如说E3面向中端定位的嵌入式应用提供32bit性能;S7显然是专注在性能方面的产品;U8则实现了可规模化配置的高性能核心,达成最高的每瓦性能。

在U8发布之前,SiFive的高算力产品主要就是U5、U7——这两者仍是顺序架构,对标的是Arm的低端及微控制器核心,在面对更为复杂的负载、要求算力的场景下还是有欠缺的。U8系列是弥补这个短板的产品。SiFive当时宣称,U8将极大扩展SiFive与RISC-V在终端产品中的生态系统生存能力。

在SiFive U8系列产品下,目前主要包括U84、U87两个核心IP。SiFive自己给的数据是,U84核心的性能是U74的3.1倍,IPC提升2.3倍(在最高频率提升1.4倍的情况下)。上面这张图对比中,在相同工艺的前提下,U84性能是U54的5.3倍;如果加上工艺造成的差别,则7nm的U84核心,性能达到了28nm的U54核心的7.2倍。这个数据其实一方面表明,RISC-V的性能潜力这些年还在挖掘过程中,所以相比更低端的产品能有如此巨量的性能与效率差距。

这是RISC-V自己内部在FPGA平台下跑U84 IP的成绩,比较的是SPECint2006成绩。

SiFive此前在新闻稿中给U8树立的直接竞争对手是Arm Cortex-A72,其中提及相比Arm Cortex-A72核心,SiFive U84提供可媲美的性能。不过在面积效益和每瓦性能方面,U84还是有优势,当然我们知道A72已经是Arm前两年的架构了。

同是7nm工艺的前提下,U84的每个核心占地面积在0.28mm²,四个核心加上2MB L2 cache构成一个簇,面积为2.63mm²。此前华为Krin 980的Cortex-A55小核心,每个核心配上各自128KB的L2 cache,面积为0.36mm²——要知道A72的性能是A55的两倍还多,显然在PPA方面,SiFive U84表现不错。

需要强调的是,U8系列作为IP在面向具体的芯片产品时还是有很大的可配置和扩展性的,U84是作为一个标准IP存在的,所以这里的探讨仅基于SiFive的标准IP,具体到实际产品仍然会有差别。

7系列与8系列微架构

或许很多人并不会将RISC-V这样一个指令集,在高性能领域去与Arm一决高下,毕竟RISC-V当前的主场也不在此——IoT产品对碎片化问题更不敏感,也不像手机那样对处理器性能有那么高的要求,RISC-V在很多情况下也偏向以微控制器的姿态存在。不过在我们看来,这依然是表现RISC-V阵营技术能力的重要组成部分。

RISC-V可查阅的资料当然还远没有Arm世界那么多,已经商用的RISC-V处理器——无论是MCU中的处理器,还是某些硬件中的控制器,公开的技术细节也并不多,详实程度自然不及遍地开花的Arm。我们从有限的资料中去了解SiFive的7系列与8系列处理器微架构,对于理解RISC-V生态还是有价值的。

如前文所述,U8系列是SiFive的首款乱序核心,U84流水线深度12级,后端3个执行单元——还是相当传统的乱序执行设计。这里的寄存器组(RegFile)设计还是颇为与众不同。

从前端来看,核心的取指单元(Fetch Queue)能够每周期以16字节从L1l获取指令,将其放到取指队列中。RISC-V ISA为可变指令编码长度,假定平均是32bit,则对应每周期4个指令。所以U8的解码器(decoder)也是4-wide设计,并将其传递到指令队列(Instruction Queue)中。

再往后,指令队列能够一次发射3个指令到重命名阶段(rename),这个宽度就比前面收窄了。外媒AnandTech此前也在针对这部分的评价中提到,取指阶段的宽度大于发射这种设计,旨在发生分支预测错误时,让前端能够跟上后端;但解码比发射更宽的这种设计,以前还从未见过。猜测这可能是微架构的某种平衡之策,也可能是为将来更宽发射的U8系列IP设计做准备的。从SiFive的官方介绍来看,发射队列数应该是可以由芯片设计商来配置扩展的。

重命名阶段的设计比较常规,包含一个重排序buffer,和三个分发引擎。然后就进入到执行后端了。

后端部分,SiFive只给了整数执行单元的情况,整体包含3条执行管线。每一条都有其各自的发射队列,填充进3条ALU管线。其中一条管线是常规的ALU,有一条则与分支单元共享了端口,还有一条更为复杂,可以执行整数乘法和除法操作。

U84这样的核心本身还没有SIMD、矢量指令支持,似乎是因为扩展指令还未完全就绪。SiFive解释说,今年年底这部分会就绪;可能U87就会具备这部分能力——目前我们从SiFive官网还未看到这方面的更新。

可扩展性

从构成SoC/MCU的更高层级来说,SiFive采用一种名为"Mix+Match"的大小核异构设计,共享一个L2可以配置至多9个核心。核心的搭配方式,可以是U8、U7、S2这些不同的核心搭配组合。

来源:WikiChip

参考早前的7系列,采用的是8+1设计,看起来和这次的设计比较相似,但搭配方式上可能会有些差别。WikiChip所做的这张图更清晰地表达了这种结构——包括核心、cache等,整体构成一个簇(Cluster)。其上还有自定义指令支持(Custom Instruction Extensions),每个核心都能实现特定指令的支持,实现某些特定工作负载的加速——这也是现在很多基于RISC-V指令微架构的能力。

7系列的介绍中曾提到,通过TileLink,可以将64个这样的簇放在一颗单芯片上。U8系列核心IP介绍中则只提到了使用TileLink,来连接第三方加速器IP实现core-to-core通信,或者ChipLink实现chip-to-chip通信。存储子系统部分详情不多,SiFive提到提供高带宽存储接口IP,对于HBM2E+这类需求有帮助,不过这部分工作似乎还在持续。

7系列的核心有可选配一种FIO端口(Fast I/O),直连到核心,作为核心以及大容量SRAM或第三方加速器之间的低延迟接口——这种FIO端口还与main core complex bus总线相连,其他核心也能看到SRAM或者第三方加速器。不知道这种FIO端口,与SiFive的TileLink技术是什么样的关系。

在可扩展性的问题上,U8系列还有一些特性:(1)对不同工艺节点的支持;(2)乱序设计可做配置,前文提到U84这种标准核心是12级流水线、3发射,实际上流水线深度、发射队列数等都是可以针对不同应用做具体调整的;(3)整数单元到浮点单元的跨发射(cross-issue)能力;(4)“可组合cache”达成实时操作支持。

如前文所述,SiFive的7系列与8系列在当今RISC-V生态中可能没有充足的代表性,不过如SiFive所言,这些高性能核心IP对于扩展RISC-V生态边界还是有相当价值的。即便就现在看来,Arm生态在中高端市场仍然占据着性能和技术上相当的优势。

另外作为IoT与嵌入式领域的重要组成部分,RISC-V如今在很多MCU产品中越来越占到一席之地。比如兆易创新首发全球RISC-V通用MCU(Bumblebee核心),即是对RISC-V生态构建的重要组成部分。


参考来源:

[1]Incredibly Scalable High-Performance RISC-V Core IP - SiFive

https://www.sifive.com/blog/incredibly-scalable-high-performance-risc-v-core-ip

[2]SiFive’s Approach to Embedding Intelligence Everywhere - SiFive

https://www.sifive.com/blog/sifives-approach-to-embedding-intelligence-everywhere


[3]SiFive Announces First RISC-V OoO CPU Core: The U8-Series Processor IP - AnandTech

https://www.anandtech.com/show/15036/sifive-announces-first-riscv-ooo-cpu-core-the-u8series-processor-ip/3


[4]SiFive Launches 7 Series, Their Highest Performance RISC-V Cores - Wichichip

https://fuse.wikichip.org/news/1775/sifive-launches-7-series-their-highest-performance-risc-v-cores/


[5]SiFive’s Approach to Embedding Intelligence Everywhere - SemiWiki

https://semiwiki.com/ip/sifive/285092-sifives-approach-to-embedding-intelligence-everywhere/


[6]RISC-V grows globally as an alternative to Arm and its license fees - VentureBeat

https://venturebeat.com/2019/12/11/risc-v-grows-globally-as-an-alternative-to-arm-and-its-license-fees/


往期精彩

1、超详细USB Type-C引脚信号及PCB布局布线介绍

2、超详细开关电源芯片内部电路解析;

3、70G硬件设计资料汇总分享;【友情推荐】

4、分享一份老工程师(某为工作15年)经常使用的pcb企业封装库包含3D库;【友情推荐】

5、【0基础学硬件】为什么在VCC入口串联一个小电阻?可以不加吗?

6、高薪工作机会分享。【找工作看这里】

关注【电子芯期天】后台回复关键字免费资料。获取PCB封装库规范、PCB设计设计规范、华为EMC基础知识、开关电源入门知识等资料。



电子芯期天 致力于分享各种电子电路开发设计资料及经验.
评论 (0)
  •   无人机电磁环境效应仿真系统:深度剖析   一、系统概述   无人机电磁环境效应仿真系统,专为无人机在复杂电磁环境下的性能评估及抗干扰能力训练打造。借助高精度仿真技术,它模拟无人机在各类电磁干扰场景中的运行状态,为研发、测试与训练工作提供有力支撑。   应用案例   目前,已有多个无人机电磁环境效应仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁环境效应仿真系统。这些成功案例为无人机电磁环境效应仿真系统的推广和应用提供了有力支持。   二、系统功能  
    华盛恒辉l58ll334744 2025-04-17 15:51 58浏览
  • 一、汽车智能化浪潮下的蓝牙技术革新随着智能网联汽车的快速发展,车载信息娱乐系统(IVI)正从单一的驾驶辅助向“第三生活空间”转型。蓝牙技术作为车内无线连接的核心载体,承担着音频传输、设备互联、数据交互等关键任务。然而,传统方案中MCU需集成蓝牙协议栈,开发周期长、成本高,且功能扩展性受限。WT2605C蓝牙语音芯片应势而生,以双模蓝牙SOC架构重新定义车用蓝牙系统的开发模式,通过“多、快、好、省”四大核心价值,助力车企快速打造高性价比的智能座舱交互方案。二、WT2605C芯片的四大核心优势1.
    广州唯创电子 2025-04-17 08:38 27浏览
  • 【摘要/前言】4月春日花正好,Electronica就在浪漫春日里,盛大启幕。2025年4月15-17日,慕尼黑上海电子展于上海新国际博览中心成功举办。伴随着AI、新能源汽车、半导体的热潮,今年的Electronica盛况空前。请跟随Samtec的视角,感受精彩时刻!【 Samtec展台:老虎的朋友圈技术派对】借天时、占地利、聚人和,Samtec 展台人气爆棚!每年展会与大家相聚,总能收获温暖与动力~Samtec展台位于W3展馆716展位,新老朋友相聚于此,俨然一场线下技术派对!前沿D
    电子资讯报 2025-04-17 11:38 33浏览
  • 一、行业背景与产品需求随着社会对清洁效率与用户体验要求的提升,洗地机行业迎来快速发展期。面对激烈的市场竞争,产品差异化成为制胜关键。传统洗地机普遍存在两大痛点:操作交互单一化与成本控制困境。尤其对于老年用户群体,缺乏语音状态提示和警示功能,导致操作门槛升高;而硬件方案中MCU与语音功能的耦合设计,则增加了系统复杂度与开发成本。WT588F/WTV/WT2003系列语音芯片的引入,为洗地机行业提供了低成本、高集成、强扩展性的解决方案,既满足用户友好性需求,又助力厂商实现硬件架构优化。二、方案核心亮
    广州唯创电子 2025-04-17 08:22 31浏览
  • 一、行业背景与需求随着智能化技术的快速发展和用户对便捷性需求的提升,电动车行业正经历从传统机械控制向智能交互的转型。传统电动车依赖物理钥匙、遥控器和独立防盗装置,存在操作繁琐、功能单一、交互性差等问题。用户期待通过手机等智能终端实现远程控制、实时数据监控及个性化交互体验。为此,将蓝牙语音芯片集成至电动车中控系统,成为推动智能化升级的关键技术路径。二、方案概述本方案通过在电动车中控系统中集成WT2605C蓝牙语音芯片,构建一套低成本、高兼容性的智能交互平台,实现以下核心功能:手机互联控制:支持蓝牙
    广州唯创电子 2025-04-18 08:33 91浏览
  • 近日,全球6G技术与产业生态大会(简称“全球6G技术大会”)在南京召开。紫光展锐应邀出席“空天地一体化与数字低空”平行论坛,并从6G通信、感知、定位等多方面分享了紫光展锐在6G前沿科技领域的创新理念及在空天地一体化技术方面的研发探索情况。全球6G技术大会是6G领域覆盖广泛、内容全面的国际会议。今年大会以“共筑创新 同享未来”为主题,聚焦6G愿景与关键技术、安全可信、绿色可持续发展等前沿主题,汇聚国内外24家企业、百余名国际知名高校与科研代表共同商讨如何推动全行业6G标准共识形成。6G迈入关键期,
    紫光展锐 2025-04-17 18:55 120浏览
  • 现阶段,Zigbee、Z-Wave、Thread、Wi-Fi与蓝牙等多种通信协议在智能家居行业中已得到广泛应用,但协议间互不兼容的通信问题仍在凸显。由于各协议自成体系、彼此割据,智能家居市场被迫催生出大量桥接器、集线器及兼容性软件以在不同生态的设备间构建通信桥梁,而这种现象不仅增加了智能家居厂商的研发成本与时间投入,还严重削减了终端用户的使用体验。为应对智能家居的生态割裂现象,家居厂商需为不同通信协议重复开发适配方案,而消费者则需面对设备入网流程繁琐、跨品牌功能阉割及兼容隐患等现实困境。在此背景
    华普微HOPERF 2025-04-17 17:53 49浏览
  • 一、行业背景与需求智能门锁作为智能家居的核心入口,正从单一安防工具向多场景交互终端演进。随着消费者对便捷性、安全性需求的提升,行业竞争已从基础功能转向成本优化与智能化整合。传统门锁后板方案依赖多颗独立芯片(如MCU、电机驱动、通信模块、语音模块等),导致硬件复杂、功耗高、开发周期长,且成本压力显著。如何通过高集成度方案降低成本、提升功能扩展性,成为厂商破局关键。WTVXXX-32N语音芯片通过“单芯片多任务”设计,将语音播报、电机驱动、通信协议解析、传感器检测等功能整合于一体,为智能门锁后板提供
    广州唯创电子 2025-04-18 09:04 98浏览
  •   北京华盛恒辉无人机电磁兼容模拟训练系统软件是专门用于模拟与分析无人机在复杂电磁环境中电磁兼容性(EMC)表现的软件工具。借助仿真技术,它能帮助用户评估无人机在电磁干扰下的性能,优化电磁兼容设计,保障无人机在复杂电磁环境中稳定运行。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为无人机电磁兼容模拟训练系统的推广和应用提供了有力支持。   系统功能   电磁环境建模:支持三维
    华盛恒辉l58ll334744 2025-04-17 15:10 41浏览
  • 自动驾驶技术的飞速发展,正在重新定义未来出行的边界。从感知到决策,从规划到控制,每一个环节都离不开海量、精准的高质量数据支撑。然而,随着传感器数量的增加和数据规模的指数级增长,行业正面临一系列挑战:多源传感器数据的时间同步难题、复杂数据格式的适配、测量技术的灵活性不足、设备集成周期冗长等,这些问题正成为自动驾驶研发与测试的“隐形瓶颈”。基于技术积累与行业洞察,本文分享一套创新的ADAS时空融合数据采集方案。通过硬件与软件的深度协同优化,能够很好地解决数据采集中的核心痛点,还为自动驾驶研发提供了高
    康谋 2025-04-17 09:54 40浏览
  •   无人机蜂群电磁作战仿真系统全解析   一、系统概述   无人机蜂群电磁作战仿真系统是专业的仿真平台,用于模拟无人机蜂群在复杂电磁环境中的作战行为与性能。它构建虚拟电磁环境,模拟无人机蜂群执行任务时可能遇到的电磁干扰与攻击,评估作战效能和抗干扰能力,为其设计、优化及实战应用提供科学依据。   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-17 16:29 67浏览
  •   无人机蜂群电磁作战仿真系统软件,是专门用于模拟、验证无人机蜂群在电磁作战环境中协同、干扰、通信以及对抗等能力的工具。下面从功能需求、技术架构、典型功能模块、发展趋势及应用场景等方面展开介绍:   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提供了有力支持。   功能需求   电磁环境建模:模拟构建复杂多样的电磁环境,涵盖各类电磁干扰源与
    华盛恒辉l58ll334744 2025-04-17 16:49 55浏览
  • 置信区间反映的是“样本均值”这个统计量的不确定性,因此使用的是标准误(standard error),而不是直接用样本标准差(standard deviation)。标准误体现的是均值的波动程度,而样本标准差体现的是个体数据的波动程度,两者并非一回事,就如下图所显示的一样。下面优思学院会一步一步解释清楚:一、标准差和标准误,究竟差在哪?很多同学对“标准差”和“标准误”这两个概念傻傻分不清楚,但其实差别明显:标准差(Standard Deviation,σ或s):是衡量单个数据点相对于平均值波动的
    优思学院 2025-04-17 13:59 23浏览
  • 1. 在Ubuntu官网下载Ubuntu server  20.04版本https://releases.ubuntu.com/20.04.6/2. 在vmware下安装Ubuntu3. 改Ubuntu静态IP$ sudo vi /etc/netplan/00-installer-config.yaml# This is the network config written by 'subiquity'network:  renderer: networkd&nbs
    二月半 2025-04-17 16:27 59浏览
  •   无人机电磁兼容模拟训练系统软件:全方位剖析   一、系统概述   北京华盛恒辉无人机电磁兼容模拟训练系统软件,专为满足无人机于复杂电磁环境下的运行需求而打造,是一款专业训练工具。其核心功能是模拟无人机在电磁干扰(EMI)与电磁敏感度(EMS)环境里的运行状况,助力用户评估无人机电磁兼容性能,增强其在复杂电磁场景中的适应水平。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为
    华盛恒辉l58ll334744 2025-04-17 14:52 33浏览
我要评论
0
1
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦