图灵奖得主DavidPatterson:为什么要有RISC-V

路科验证 2023-12-13 12:12

RISC-V(发音为“RISC five”)的目标是成为一款通用的指令集架构(Instruction Set Architecture,ISA):

• 它要适合设计各种规模的处理器,包括从最小的嵌入式控制器到最快的高性能计算机。

• 它要兼容各种流行的软件栈和编程语言。

• 它要适用于所有实现技术,包括 FPGA(Field-Programmable Gate Array,现场可编程逻辑门阵列)、ASIC(Application-Specific Integrated Circuit,专用集成电路)、全定制芯片,甚至未来的制造元件技术。

• 它能用于高效实现所有微体系结构,包括微程序或硬连线控制,顺序、解耦或乱序流水线,单发射或超标量等。

• 它要支持高度定制化,成为定制加速器的基础,以应对摩尔定律的放缓。

• 它要稳定,基础 ISA 不会改变。更重要的是,它不能像以往的公司专有 ISA 那样消亡,包括 AMD 的 Am29000、Digital 的 Alpha 和 VAX、Hewlett Packard1 的 PARISC、Intel 的 i860 和 i960、Motorola 的 88000,以及Zilog 的 Z8000。

RISC-V 是一款与众不同的 ISA,不仅因为它年轻(它诞生于 2010 年,而其他 ISA 大多诞生于 20 世纪 70 年代或 80年代),而且因为它开放。与过去几乎所有的架构不同,其未来不受任何一家公司的兴衰或心血来潮的决策所影响(过去许多 ISA 因此消亡)。相反,RISC-V 属于一个开放的、非营利性质的基金会。RISC-V 国际基金会的目标是维护 RISC-V 的稳定性,仅出于技术原因而缓慢谨慎地改进 RISC-V,并推动RISC-V 在硬件中流行起来,犹如 Linux 在操作系统中流行一般。图 1.1 列出了 RISC-V 国际基金会最大的企业会员,展示了 RISC-V 的繁荣。


模块化ISA和增量型ISA

Intel 曾将其未来押在高端微处理器上,但这还需要很多年时间。为与 Zilog 公司抗衡,Intel 开发了一款名为8086 的过渡产品。它本该朝生暮死,无任何后续产品,但事实并非如此。高端处理器姗姗来迟,等它最终面世时,性能却不如人意。因此,8086 架构得以延续——它演化为 32 位处理器,最终又演化为 64 位。其名称不断更替(80186、80286、i386、i486、Pentium),但底层指令集丝毫未减。                                                                                               ——Stephen P. Morse,8086 架构师 (Morse, 2017)


计算机体系结构的传统发展方式是增量型 ISA,这意味着新处理器不仅需要实现新的 ISA 扩展,还必须实现过去的所有扩展。其目的是保持向过去的二进制兼容性,使数十年前的二进制程序仍可在最新处理器上正确运行。出于市场营销的目的,新一代处理器的发布通常伴随着新指令的发布。这两点需求共同导致 ISA 的指令数量随时间流逝而大幅增长。图 1.2 展示了当今主流 ISA x86 的指令数量增长过程。x86 的历史可追溯到 1978 年,在漫长的生命周期中,它每个月大约增加 3 条指令。

x86 在 1978 年诞生时有 80 条指令,2015 年增长到 1 338 条,翻了 16 倍,并且仍在增长。但图中数据仍偏保守。一篇 2015 年的 Intel 博客指出,统计结果为 3600条指令 (Rodgers et al. 2017)。按这个数据,在 1978 年到 2015 年期间,x86 指令平均每 4 天增长 1 条。我们统计的是汇编语言指令,他们统计的也许是机器语言指令。增长的主要原因是 x86 ISA 通过 SIMD 指令实现数据级并行。

这种约定意味着 x86-32(我们用它表示 32 位地址版本的x86)的每款处理器都必须实现过去扩展的错误设计,即便它们已无意义。例如,图 1.3 列出了 x86 的 aaa(ASCII Adjustafter Addition)指令,该指令早已失去用处。

它以二进制编码十进制数(Binary Coded Decimal,BCD)的形式进行算术运算,但它已化为信息技术的历史尘埃。x86 还有 3 条类似的指令,分别用于减法(aas)、乘法(aam)和除法(aad)。它们都是单字节指令,因此一共占用宝贵操作码空间的 1.6%(4/256)。


打个比方,假设一家餐馆只提供价格固定的套餐,最开始只有汉堡加奶昔的小餐。随着时间的推移,套餐中加入了薯条,然后是冰淇淋圣代,还有沙拉、馅饼、葡萄酒、素食意大利面、牛排、啤酒,无穷无尽,最后变成饕餮盛宴。食客能在这家餐馆找到他们过去吃过的任何一种食物(尽管这样没什么意义)。然而,这对食客来说是一个坏消息,他们每次的餐费将随盛宴加量而不断上涨。

除年轻和开放之外,RISC-V 还是模块化的,这与过去几乎所有 ISA 都不同。其核心是一个名为 RV32I 的基础 ISA,可运行完整的软件栈。RV32I 已冻结,永不改变,这为编译器开发者、操作系统开发者和汇编语言程序员提供了稳定的指令目标。模块化特性源于可选的标准扩展,硬件可根据应用程序的需求决定是否包含它们。利用这种模块化特性能设计出面积小、能耗低的 RISC-V 处理器,这对于嵌入式应用至关重要。RISC-V 编译器得知当前硬件包含哪些扩展后,便可为该硬件生成最优代码。一般约定将扩展对应的字母加到指令集名称之后,以指示包含哪些扩展。例如,RV32IMFD 在必选基础指令集(RV32I)上添加了乘法(RV32M)、单精度浮点(RV32F)和双精度浮点(RV32D)扩展。如果软件使用了一条未实现的可选 RISC-V 扩展指令,硬件将发生自陷,并在软件层执行该指令的功能。此特性属于标准库的一部分。

继续用我们刚才的比方,RISC-V 提供的是一份菜单,而不是一顿应有尽有的自助餐。主厨只需烹饪食客需要的食物,而不是每次都烹饪一顿大餐,食客也只需为他们点单的食物付费。RISC-V 无须仅为市场营销的热闹而添加新指令。RISC-V国际基金会决定何时往菜单中添加新的选择,经过由软硬件专家组成的委员会公开讨论后,他们才会出于必要的技术原因添加指令。即使这些新的选择出现在菜单上,它们仍是可选的,不像增量型 ISA 那样成为未来所有实现的必要组成部分。



RISC-V 自 2010 年诞生以来迅速发展并普及。我们认为一本精巧的程序员指南将有助于推动它的发展,还能让初学者理解 RISC-V 指令集具有吸引力的原因,并了解它与传统指令集架构(ISA)的不同之处。

本书受到其他指令集架构书籍的启发,但由于 RISC-V 自身非常简洁,我们希望能写得比 500 多页的优秀书籍(如 See MIPS Run)更精巧我们把篇幅控制在这些优秀书籍的 1/3,至少在这个意义上我们成功了。实际上,书中前 10 章介绍了模块化RISC-V 指令集的每个组成部分,总共只用了 136 页,尽管平均每页插入了一张图片(共 97 张)。

阐释指令集设计原则后,我们展示了 RISC-V 架构师如何从过去 40 年的指令集中吸取经验教训,取其精华,去其糟粕。要评价一款 ISA,既要究其所取,也要究其所舍。

随后,我们通过一系列章节介绍这个模块化架构的每个组成部分。每章都包含一个 RISC-V 汇编语言程序,以展示该章所述指令的用法,从而帮助汇编语言程序员学习 RISC-V 代码。有时,我们还会用 ARM、MIPS 和 x86 列出同一个程序的代码,从而突出 RISC-V 的简洁性,以及在成本、功耗、性能之间权衡的优势。

为提升本书的趣味性,我们在页边加入约 50 段花絮,用于介绍关于正文内容的有趣评论我们还充分利用页边的空间,在页边加入约 110 张图片,用于强调好的 ISA设计示例。最后,我们为愿意钻研的读者在全书中加入约 30 段补充说明。如果你对某个主题感兴趣,可以深入研读这些可选部分。略过此部分不会影响你对书中其他内容的理解,所以,如果你不感兴趣,则可以放心跳过它们。我们为计算机体系结构爱好者援引约 30 篇论文和书籍,它们能够开阔你的视野。在编写本书的过程中,我们也从中获益匪浅!

按以下方式互动,即有机会获赠图书!

活动方式:在评论区留言互动,届时会在参与的小伙伴中

抽取3名幸运鹅赠送本期图书一本!

路科验证 专注于数字芯片验证的系统思想和前沿工程领域。路桑是Intel资深验证专家,主持验证架构规划和方法学研究,担任过亿门级通信芯片的验证经理角色。在工程领域之外,他在西安电子科技大学和西安交通大学客座讲授芯片验证课程。著有书籍《芯片验证漫游指南》。
评论
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 109浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 78浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 113浏览
  • 铁氧体芯片是一种基于铁氧体磁性材料制成的芯片,在通信、传感器、储能等领域有着广泛的应用。铁氧体磁性材料能够通过外加磁场调控其导电性质和反射性质,因此在信号处理和传感器技术方面有着独特的优势。以下是对半导体划片机在铁氧体划切领域应用的详细阐述: 一、半导体划片机的工作原理与特点半导体划片机是一种使用刀片或通过激光等方式高精度切割被加工物的装置,是半导体后道封测中晶圆切割和WLP切割环节的关键设备。它结合了水气电、空气静压高速主轴、精密机械传动、传感器及自动化控制等先进技术,具有高精度、高
    博捷芯划片机 2024-12-12 09:16 86浏览
  • 本文介绍瑞芯微RK3588主板/开发板Android12系统下,APK签名文件生成方法。触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,该开发板是核心板加底板设计,音视频接口、通信接口等各类接口一应俱全,可帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。工具准备下载Keytool-ImportKeyPair工具在源码:build/target/product/security/系统初始签名文件目录中,将以下三个文件拷贝出来:platform.pem;platform.
    Industio_触觉智能 2024-12-12 10:27 68浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 66浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 99浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 88浏览
  • 在智能化技术快速发展当下,图像数据的采集与处理逐渐成为自动驾驶、工业等领域的一项关键技术。高质量的图像数据采集与算法集成测试都是确保系统性能和可靠性的关键。随着技术的不断进步,对于图像数据的采集、处理和分析的需求日益增长,这不仅要求我们拥有高性能的相机硬件,还要求我们能够高效地集成和测试各种算法。我们探索了一种多源相机数据采集与算法集成测试方案,能够满足不同应用场景下对图像采集和算法测试的多样化需求,确保数据的准确性和算法的有效性。一、相机组成相机一般由镜头(Lens),图像传感器(Image
    康谋 2024-12-12 09:45 78浏览
  • 首先在gitee上打个广告:ad5d2f3b647444a88b6f7f9555fd681f.mp4 · 丙丁先生/香河英茂工作室中国 - Gitee.com丙丁先生 (mr-bingding) - Gitee.com2024年对我来说是充满挑战和机遇的一年。在这一年里,我不仅进行了多个开发板的测评,还尝试了多种不同的项目和技术。今天,我想分享一下这一年的故事,希望能给大家带来一些启发和乐趣。 年初的时候,我开始对各种开发板进行测评。从STM32WBA55CG到瑞萨、平头哥和平海的开发板,我都
    丙丁先生 2024-12-11 20:14 75浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-12 10:13 42浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-11 17:58 87浏览
  • 全球智能电视时代来临这年头若是消费者想随意地从各个通路中选购电视时,不难发现目前市场上的产品都已是具有智能联网功能的智能电视了,可以宣告智能电视的普及时代已到临!Google从2021年开始大力推广Google TV(即原Android TV的升级版),其他各大品牌商也都跟进推出搭载Google TV操作系统的机种,除了Google TV外,LG、Samsung、Panasonic等大厂牌也开发出自家的智能电视平台,可以看出各家业者都一致地看好这块大饼。智能电视的Wi-Fi连线怎么消失了?智能电
    百佳泰测试实验室 2024-12-12 17:33 56浏览
  • 应用环境与极具挑战性的测试需求在服务器制造领域里,系统整合测试(System Integration Test;SIT)是确保产品质量和性能的关键步骤。随着服务器系统的复杂性不断提升,包括:多种硬件组件、操作系统、虚拟化平台以及各种应用程序和服务的整合,服务器制造商面临着更有挑战性的测试需求。这些挑战主要体现在以下五个方面:1. 硬件和软件的高度整合:现代服务器通常包括多个处理器、内存模块、储存设备和网络接口。这些硬件组件必须与操作系统及应用软件无缝整合。SIT测试可以帮助制造商确保这些不同组件
    百佳泰测试实验室 2024-12-12 17:45 63浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 173浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦