开源的RISC-V,要颠覆GPU了?

原创 电子工程世界 2024-04-08 09:01

RISC-V一直以其开源特性而备受业界关注。不过,一直以来,RISC-V相关IP主要集中在CPU领域,而事实上,它也可以用在GPU领域。

 
你我都知道,GPU领域几乎被一两家企业所统治,这是因为GPU领域生态是最大的壁垒。加之专利门槛极高,GPGPU(通用GPU)IP在图形处理领域一直不温不火。
 
最近几年,业界开始探索通过扩展和改写RISC-V CPU指令集,来制造GPU。
 
付斌|作者
电子工程世界(ID:EEWorldbbs)|出品


 RISC-V GPU,有产品了 

 
对于RISC-V来说,GPU IP一直是一个痛。虽说Imagination曾经宣布其GPU IP将会支持RISC-V CPU,但真正将RISC-V做成GPU的却屈指可数。
 
真正使用RISC-V设计制造GPU的产品出现在2019年,那一年,一家成立于2007年的希腊IP厂商——Think Silicon推出业界首款基于RISC-V ISA的3D GPU NEOX V。
 
这家公司对于RISC-V GPU赛道极为执着,紧接着在2022年的Embedded World上,展出业界首款基于RISC-V的GPU,命名为NEOX G系列和A系列。
 
 
今年Embedded World,Think Silicon又展示了用在MCU上的GPGPU方案NEOX-GA100,也是业界首个基于RISC-V的GPGPU架构,同时该公司拥有RISC-V RV64架构的全部权利。
 
根据官网显示,作为轻量级3D图形系统,整个3D、VG和2.5D API需要不到150KB的内存和10mW的功率,非常适合从低功耗裸机到RTOS和基于Linux的高性能系统。此外,该产品也可以在不增加芯片成本的情况下实现AI应用。
 
NEOX-GA100架构,图源|Think Silicon
 
国内方面,也有相关产品发布。2023年11月,上海逸集晟(ezchip)发布了一款GPGPU核心IP——RVG-1。RVG-1是一个基于RISC-V架构,并且完整支持CUDA源码编译的软硬件一体解决方案。
 
官方信息显示,RVG-1在硬件上充分利用了RISC-V架构扩展指令的灵活性。基于RV32IMAF/RV64IMAFD基础指令集,增加了进程调度/管理指令和矩阵存取/计算指令的支持,并引入了多级缓存和存储控制,构建了一个可灵活配置核心算力/数量和缓存容量的GPGPU核心。目前在28纳米工艺下,该核心可以运行在800MHz,并且仍在持续优化中。
 
 
目前来看,RISC-V GPU IP厂商们的野心的目标都很大,一方面布局边缘端的低功耗GPGPU,另一方面布局科学计算、AI的大型GPGPU。 


 全世界都在研究RISC-V GPU架构 

 
事实上,全世界都不想看一两家厂商垄断市场,都在想办法做各种开源GPU架构,这其中既包含较老的指令集或是中间语言进行实现,有些则基于RISC-V CPU指令集进行改进和扩展来实现GPGPU的功能。
 
开源GPU汇总,图源|陈巍谈芯
 
2021年,乔治亚理工研究了一种支持CUDA的RISC-V GPU架构——Vortex。
 
 
前几日,一个成立于2022年的美国公司X-Silicon发布了其开放标准、低功耗的C-GPU架构。
 
根据介绍,C-GPU架构将打造成为开源、统一的RISC-V 矢量 CPU-with-GPU ISA 架构,C-GPU采用NanoTile架构,X-Silicon将这种CPU/GPU混合处理器称为“万能处理器”。其处理器专为动态内容最佳管理和渲染而设计,并超越传统GPU限制。
 
翻译翻译就是把基于RISC-V架构的CPU和GPU放在同一个核内。
 
X-Silicon的单核概念,图源|X-Silicon
 
国内方面,上海清华国际创新中心集成电路研究平台推出的首款基于RISC-V向量扩展(RVV)的GPGPU“Ventus(乘影)”,是国内首个开源GPGPU,也为后续协同企业开发国产全自主GPU商用产品的路上迈出关键一步。
 
根据官方信息显示,RVV GPGPU参考RISC-V CPU开发思路,在满足SIMT基础功能同时,汲取RISC-V向量扩展在功能定义和指令设计上优势,将二者有机结合,使乘影同时具备向量处理器工具链兼容性和GPGPU编程灵活性。
 
乘影架构解读,图源|陈巍谈芯
 
陈巍博士解读,乘影主体大框架借鉴GPGPU的结构,每个流多处理器(Streaming Multiprocessor,SM)主体结构接近于RISC-V。后端执行则直接使用处理器中常用ALU、FPU、LSU。为了让SM能够完成GPGPU工作,乘影里添加了SIMT-stack和SFU这类GPU中的常见功能模块。
 
 
2024年2月,芯瞳成功开源了一款基于RISC-V指令集的GPU处理器模型RVGPU,这是芯瞳在RISC-V + GPU方向持续研究取得的重要突破。
 
根据官方介绍,RVGPU采用SIMT(单指令多线程)技术,现已成功实现对CUDA(Compute Unified Device Architecture)的兼容支持,包括CUDA编译器和运行时环境。除此以外,RVGPU的架构指令CModel仿真模型允许开发者在模拟环境中模拟GPU的各种指令和行为。
 
RVGPU软件栈,图源|芯瞳半导体
 
综合来看,上述产品均基于LLVM开源工具链完成GPGPU编译器的开发,支持OpenCL开源并行编程框架。
 
可见,所有厂商都有着一个共同的目标,那就是建设一个开源GPU生态。
 
不过,总的来说,GPU是一个非常复杂的产品,绝不仅仅只是一个开源GPU就能够与现有玩家五五开的,未来还依赖大量的研发与投入。


 用RISC-V做GPU,有好也有坏 

 
用RISC-V做GPU,有人拍手叫好,也有人觉得多此一举。
 
觉得它好的人,认为RISC-V可以直接套用RISC-V的生态,不需要完全自建GPU生态,规避了与CUDA的专利对决。毕竟这是个开源的GPU IP,大家都加入到开源建设的大家庭,就能够弥补GPU生态不足,也不容易踩到知识产权的坑。
 
与此同时,每个SM核的独立性更好,可以执行比常规GPU CUDA核更复杂的计算。如果加上MMU,未来甚至可以在每个SM核上跑操作系统,非常有利于虚拟化。
 
觉得它不好的人,认为目前的RISC-V GPU产品,都是目前NVIDIA的GPU的形似物,设计没有什么太大差别,而HBM这样的器件八成是用不起的,其它诸如Nvidia GPU里面的Texture Unit也是缺失的。
 
更何况,CUDA这样的生态是很难跨越的鸿沟。有大佬曾言:“如果你看一下GPU的生态系统,就会发现工具链是由NVIDIA控制的,包括AMD在内的其他竞争对手都试图打破垄断,但失败了。通过扩展RISC-V标准指令集,几乎不可能与不断更新的NVIDIA生态系统兼容。另一方面,也很难重新开始,因为英伟达拥有先发优势。”
 
所以,对于大部分RISC-V GPU来说,支持CUDA生态至关重要,我们也看到许多厂商确实也是这样做的。因为虽然通过LLVM可能只需要重构compiler后端,但性能好不好就是另外一回事了。
 
还有比较激进的观点,认为从RISC-V开始做GPU,不如直接从白纸开始做。他们认为,要使基本的RISC-V指令集适应GPU任务,需要大量投资来定义自定义ISA扩展,构建高度复杂的微架构更改,并对开源工具进行大手术,使它们几乎与原始工具相似。这样一来,使用RISC-V的几乎所有潜在价值,都被定制架构比下去了。
 
就连上海交大也曾经说过,“我们想做的是一个独立完整的GPGPU架构和指令设计,而不依赖于现有RISC-V CPU开源指令,这样才能更完备地打造和融入原生的GPGPU生态 ,从而与现有的各种CPU系统无缝衔接。”所以因此,他们做了“青花瓷”这样一个定制的开源GPGPU架构。
 
但多一条路线,总归是好事。毕竟RISC-V CPU发展迅速,如果RISC-V CPU发展好,RISC-V GPU就能跟着“发财致富”。这条路好不好,就全看RISC-V能发展成什么样子了。
 


参考文献

[1] 知乎:https://www.zhihu.com/question/549317122
[2] 中国电子报:初入GPU赛道,RISC-V能否取得好表现?.2023.1.24.https://mp.weixin.qq.com/s/X3cexh0a4kgC8eZQMmo_og
[3] 乘影:https://opengpgpu.org.cn/
[4] AI芯天下:热点丨全球首款RISC-V 3D GPU即将亮相.2022.6.20.https://mp.weixin.qq.com/s/Obtc0LVcLHPIrkTlYjywXQ
[5] The Tech Outlook:https://www.thetechoutlook.com/press-release/think-silicon-to-showcase-its-latest-ultra-low-power-3d-graphics-and-ai-in-one-ip-architecture-at-embedded-world-2024/
[6] Think Silicon:https://www.think-silicon.com/
[7] Jon Peddie:https://www.jonpeddie.com/news/x-silicons-low-power-open-standard-vulkan-enabled-c-gpu/
[8] 芯瞳半导体:芯瞳开源基于RISC-V架构的GPU模型RVGPU.2024.2.23.https://mp.weixin.qq.com/s/K1RUIEo8BL88Rxmimc4GAw
[9] ezchip:ezchip发布基于RISC-V架构的CUDA兼容GPGPU核心——RVG-1.2023.11.20.https://mp.weixin.qq.com/s/4XYG8fPQ8a7w7mjNym3uVA


· END ·








电子工程世界 关注EEWORLD电子工程世界,即时参与讨论电子工程世界最火话题,抢先知晓电子工程业界资讯。
评论
  • 在半导体设计的复杂世界里,EDA(电子设计自动化,Electronic Design Automation)和 IP(知识产权,Intellectual Property)是两个极为重要的概念。它们虽然都服务于半导体设计流程,但在功能、性质和应用等方面存在显著差异。理解这些差异,对于深入了解半导体行业的运作至关重要。EDA:半导体设计的强大工具集EDA 是一系列软件工具的集合,旨在帮助工程师进行集成电路(IC)的设计、验证和制造。从最初的电路原理图设计,到复杂的芯片布局布线,再到最后的功能验证,
    Jeffreyzhang123 2024-12-30 14:26 70浏览
  • 2024年12月30日 调研咨询机构环洋市场咨询出版的《全球CPU渲染行业总体规模、主要厂商及IPO上市调研报告,2024-2030》主要调研全球CPU渲染总体规模、主要地区及国家的市场规模、主要企业规模和份额、主要细分市场规模、下游主要应用规模以及未来发展前景预测。统计维度包括收入、市场份额以及增速。同时也重点分析全球市场主要厂商(品牌)包括企业简介、总部、产地、CPU渲染产品介绍、规格/型号、收入、毛利率及市场份额、最新发展动态、优势与不足。历史数据为2019至2023年,预测数据为2024
    GIRtina 2024-12-30 16:36 94浏览
  • 在数字化时代,软件和操作系统(OS)犹如一对紧密协作的伙伴,共同构建了我们丰富多彩的数字世界。它们之间的关系错综复杂却又妙趣横生,深入理解这种关系,对于我们更好地使用和开发软件,以及推动整个信息技术产业的发展都有着至关重要的意义。操作系统:软件运行的基石操作系统,就像是计算机系统的大管家,它是计算机硬件与其他软件之间的桥梁。从底层的硬件资源管理,到为用户提供一个友好的操作界面,操作系统都扮演着不可或缺的角色。硬件资源管理是操作系统的核心职责之一。它负责分配和调度 CPU、内存、硬盘、显卡等硬件资
    Jeffreyzhang123 2024-12-30 15:04 73浏览
  • 近日,飞凌嵌入式为FET527N-C核心板适配了全新升级的Forlinx Desktop 22.04操作系统,为用户体验带来了诸多显著的提升——不仅能够享受到更加流畅、稳定的操作体验,还能充分利用Forlinx Desktop 22.04所提供的丰富功能与创新特性提升工作效率与应用兼容性。OK527N-C开发板运行Forlinx Desktop 22.041、系统与硬件双重赋能飞凌嵌入式FET527N-C核心板搭载全志T527N处理器,集成了8个ARM Cortex-A55高性能核,同时内置1个
    飞凌嵌入式 2024-12-30 14:00 40浏览
  • 在科技飞速发展的今天,智能硬件如同璀璨星辰,照亮了我们生活的各个角落。从清晨的第一缕阳光唤醒智能音箱,到夜晚智能家居系统营造的温馨氛围,智能硬件正以前所未有的速度改变着我们的生活方式,开启了一个全新的智能时代。智能硬件:科技融合的结晶智能硬件是将传感器、芯片、通信技术等多种科技元素深度融合的产物。它不再仅仅是冰冷的机器,而是具备了感知、思考和交互能力的智能伙伴。以智能手表为例,它不仅能准确记录时间,还能实时监测心率、运动步数、睡眠质量等健康数据。内置的传感器就像敏锐的 “触角”,时刻感知着我们的
    Jeffreyzhang123 2024-12-30 14:29 53浏览
  • 在神秘而复杂的电子世界里,电子测试与测量技术宛如一把神奇的密钥,帮助我们解锁其中的奥秘。它不仅仅是一门技术,更是连接理论与实践、推动电子产业不断向前发展的核心力量。电子测试与测量:独特的 “电子侦探”电子测试与测量技术,犹如一位敏锐的 “电子侦探”,深入电子系统的各个角落,探寻其中的真相。从微小的电子元件到庞大复杂的电子系统,它都能凭借一系列独特的工具和方法,对电子信号的各种参数进行精确的分析和判断。想象一下,在一个复杂的电路板上,无数电子元件紧密协作,如同一个繁忙的城市。而电子测试与测量技术就
    Jeffreyzhang123 2024-12-30 14:54 70浏览
  • 综述在当今科技驱动的时代,压力测量在众多领域中扮演着举足轻重的角色。压力变送器作为将压力信号转换为标准电信号的关键设备,其技术发展与应用效能直接关系到各行业的生产安全、效率提升与创新突破。本文将深入阐述芯佰微电子为应对压力变送器的现状与痛点所推出的芯片解决方案。 一、现状与痛点分析压力变送器作为工业自动化系统中的关键设备,广泛应用于石油、化工、电力、汽车、航空航天等领域,用于精确监测液体、气体及蒸汽等介质的压力。随着工业自动化的普及及对数据精度的要求不断提高,压力变送器的技术也在不断进
    芯佰微电子 2024-12-30 13:51 34浏览
  •  随着电子技术的进步,电路中的隔离需求日益增加。晶体管光耦作为一种非接触式信号传输器件,因其独特的隔离特性和可靠性,成为了现代电子设备和工业控制中不可或缺的元件。本文将带您深入了解晶体管光耦的结构、工作原理和核心特点。晶体管光耦的基本结构晶体管光耦,通常由两个主要部分组成:发光二极管(LED)和光敏晶体管。其物理结构简单却极具创新性:发光二极管(LED):电流通过时,LED会发出红外光。光敏晶体管:接收来自LED的红外光信号,从而引导电流在输出端导通。这种结构的最大特点在于输入与输出端
    晶台光耦 2024-12-30 16:15 76浏览
  • 本文介绍瑞芯微主板/开发板编译OpenHarmony源码后烧录镜像的教程,触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,树莓派卡片电脑设计,支持开源鸿蒙OpenHarmony3.2-5.0系统,适合鸿蒙开发入门学习。编译源码后镜像路径编译完OpenHarmony源码后,会在以下路径,生成散包镜像,如图所示:/out/XXX(产品名)/packages/phone/images这时我们将images文件夹拷贝至本地,进行散包烧录操作步骤。散包镜像烧录连接开发板
    Industio_触觉智能 2024-12-30 09:54 67浏览
  • C语言USB与SD的例程在接口类型、存储方式以及数据传输速度等方面存在区别,具体分析如下: 1. 接口类型   USB:USB(通用串行总线)是一种广泛使用的硬件接口标准,用于连接电脑与各种外围设备。USB协议支持多种数据传输模式,包括控制传输、中断传输、批量传输和同步传输。了解USB通信协议是开发任何USB相关软件的基础。    SD卡:SD卡(Secure Digital Memory Card)是一种基于半导体快闪记忆器的新一代记忆设备,常用于数码
    丙丁先生 2024-12-30 09:59 77浏览
  • 一、API 安全:现代企业的必修课在现代技术生态中,应用程序编程接口(API)扮演着不可或缺的角色。从数据共享到跨平台集成,API 成为连接企业系统与外部服务的桥梁。然而,伴随云计算的普及与微服务架构的流行,API 的使用量呈现爆发式增长,也使得它逐步演变为企业信息安全中的“高危地带”。API 的核心功能是促进数据流转和应用集成,这既是它的优势,也使其成为网络攻击的主要目标。许多企业依赖 API 进行敏感数据的交互,包括用户信息、财务记录和企业业务数据等。一旦 API 出现漏洞或被不法分子利用,
    艾体宝IT 2024-12-30 11:49 46浏览
  • 在电子世界的广袤领域中,微控制器(MCU,Microcontroller Unit)宛如一颗璀璨的明星,发挥着至关重要的作用。从简单的智能家居设备到复杂的工业控制系统,MCU 无处不在。今天,我们就一同深入了解 MCU 的基础以及常用的编程手段。MCU 基础:麻雀虽小,五脏俱全MCU 是一种将中央处理器(CPU)、存储器(如闪存、随机存取存储器 RAM)、输入输出接口(I/O 接口)、定时器 / 计数器等多种功能集成在一个芯片上的微型计算机系统。它就像是一个小型的电子大脑,能够接收外部信号,进行
    Jeffreyzhang123 2024-12-30 15:40 82浏览
  • 从简单的照明工具到会说话的艺术品。认知总是不断地被刷新、升级。曾经,汽车内部的按键灯、内饰灯仿佛一盏盏小夜灯,那些光点,虽不起眼,却总能在黑夜中给予驾驶员和乘客陪伴和指引。但时代在变,人们对美好生活,包括车生活的追求也在升级。那些传统的光点,渐渐地,已经满足不了大众对驾驶体验的期待。让“上车”等于“回家”。至此,一场关于内饰照明的革命悄然兴起。1、从简单的照明工具到会说话的艺术品“内饰氛围灯的主要应用方向就是营造轻松舒适的氛围。”艾迈斯欧司朗高级系统方案工程师钟文帅还因此总结了内饰氛围灯的四大发
    艾迈斯欧司朗 2024-12-30 15:55 91浏览
  • 随着Serdes传输速率的提升,交换机功耗和信号损失、系统集成度等问题愈发具有挑战, CPO新技术渗透率加速提升。根据LightCounting的数据显示,人工智能对网络速率的需求是当前的10倍以上。LightCounting预计CPO技术的出货将从800G和1.6T端口开始,在2024至2025年期间开始商用,2026至2027年开始规模上量,主要应用于超大型云服务商的数通短距场景。 CPO发展Roadmap 共封装光学CPO(Co-Packaged Optics)是一种将光引擎和交换芯片共
    hycsystembella 2024-12-29 16:22 103浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦