【了不起的芯片】CPU、GPU、GPGPU,计算三兄弟的前世今生

原创 新思科技 2022-11-04 16:57


2022新思科技科普类短视频栏目《了不起的芯片》全新上线!新思科技一直致力于打造“人人都能懂”的行业科普视频,传播更多芯片相关小知识,解答各类科技小问题。每周3分钟,多一些“芯”知识。


第一期,我们一起聊聊CPU、GPU、GPGPU的前世今生。




CPU、GPU、GPGPU,这些名词大家都耳熟能详,但大多数人或许并不知道,这几个词包含着人们对数字世界“快,更快”的追求。它们关乎到你会议是否延迟、游戏是否卡顿、程序是否顺畅……

今天我们就从CPU和GPU的不同,以及自GPU衍生而来的GPGPU,一起来看看IC时代下开发者们对“快”的追求是如何演进的。

CPU(Central Processing Unit),中央处理器应该是大家最熟悉的一个。它是我们电脑、手机等众多电子产品的“核心”,我们就称它为老大哥吧。不管你在看视频、玩游戏,还是聊天、上网课,其实都是靠它来统一指挥调度,发号施令。为了满足很强的通用性能处理各种不同的数据,CPU的内部结构设计十分复杂,这也奠定了其老大哥的地位,基本上复杂一点的电子产品都离不开它。

简单一点来说,我们可以把CPU,或者说CPU的核心,分成三部分:计算单元(ALU)、控制单元(CU)和缓存单元(Cache)。例如下图,我们可以看到存储和控制单元占据了相当大的比例,也就是图中1、3、5和6的部分。相较而言,2和7所代表的计算区域就比较有限。这款CPU已经是非常老旧的Intel 486了,现代CPU中缓存单元的面积只多不少。

来源:Wikimedia Commons(cc:https://creativecommons.org/licenses/by/3.0/deed.en)

迄今为止所有CPU都遵循老祖宗图灵定下的基本法:读取指令,进行解码,发出操作控制信号,然后再进行下一个工作。但随着计算机的普及,我们对于图形显示的要求越来越高,比如3D建模,大型游戏等,更丰富的网络生活,也要求电子产品实现更大的数据规模和更快的处理速度。如果让CPU一件一件来处理呢,大家可能就没办法这么开心地“网上冲浪”了。

尽管CPU的内部有各种各样的方法加速指令的执行,但越来越多的任务早已让CPU的那些小技俩江郎才尽。那怎么办,多堆几个CPU呢?Emmm……首先它太烧钱了(即便是最新款的CPU,它的物理核心数量也还是个位数哦),其次也有点大材小用。这时候聪明的开发者们就发现,既然CPU计算能力不足,我们就把计算单元都堆在同一块芯片上,让他们来主要负责大量重复运算的任务不就行了吗?所以GPU就出现了。

GPU(Graphics Processing Unit),就是图形处理器。它只有很少的控制单元和缓存,但是堆满了运算单元,能够处理以图形任务为代表的大规模并发运算。


图形渲染要对图像上的每一个像素点进行处理,而这些像素处理的过程和方式十分相似。这也是为什么GPU如此擅长图像处理。打个比方,CPU这个老大哥每天处理的指令包罗万象,但是图形图像处理属于单一重复工种,让老大哥费时费力来做这些显然不合适。于是GPU就像是老大哥招募来的一批小弟,能够同时处理大量重复的计算工作,这样老大哥可以高效地处理其他需要费脑子的活儿。也就是说CPU+GPU的强强联手,才让大家打游戏的时候能够纵享丝滑。

GPGPU(General-purpose computing on Graphics Processing Unit),从名字就可以看出来,它是GPU衍生出来的概念,指的是通用图形处理器。随着GPU的功能和运算能力越来越强大,开发者就想GPU这个超强运算能力,除了图形处理之外还能不能去做一些别的?于是,他们给GPU引入了通用可编程的功能。所以GPGPU能够利用GPU可并行计算的架构以及可编辑的特性来实现可编程高算力的能力。如果我们把GPU看作CPU的小弟,那GPGPU就算是特长生小弟了。

GPGPU的发展过程也伴随着人工智能产业大火,我们对算力的需求不断攀升且计算不断复杂化,通过去掉了图形显示部分,将其余部分全部投入了通用计算,GPGPU在医疗健康、深度学习、VR等算力密集领域大放异彩。

好像听明白了,又好像没那么明白?没关系,我们举个通俗的例子。

如果我们将芯片处理的问题比作数学题,图形处理这种大量重复的简单任务就是加减法运算,要分析指令、调取数据、控制操作等逻辑控制类任务就是高考数学题,通用计算密集型任务就像是IMO国际奥数题。那么相应的,GPU就是一群只会做简单运算的小学生,CPU是擅长逻辑控制的大学生,GPGPU就相当于一大群针对专门任务进行专项强化训练后的优秀奥赛选手。

很显然,如果脱离实际应用场景和成本来争论CPU、GPU、GPGPU哪个更厉害,这本身就是个伪命题。因为要处理的场景不同,所以三者设计的出发点也不一样。CPU、GPU和GPGPU在设计之初就都有EDA和IP的强大支持。如今市场上的大部分CPU和小型的GPU基本上都已经实现了IP化(同时有趣的是,在你笔记本里的x86 CPU里面还会套娃式的使用一些其他指令集CPU的IP)。大型的GPGPU目前也依然依赖EDA工具,特别是高效的后端数字工具来确保设计成功。

不同的处理器也许功能不同,但其终极目标是一致的,都是为了助力数字世界更快运作,三者各司其职又相互补充来协同工作,便就能给终端用户带来最佳的体验。



"image" data-miniprogram-servicetype="" _href="">                                                                                                                                                                                                                                                                                                                                 
                                                                                  

   

新思科技 新思科技(Synopsys, Inc.)以芯片产业的“根技术”推动AI、5G、高性能计算、智能汽车等前沿应用的核心技术发展。
评论
  • 本文介绍瑞芯微RK3588主板/开发板Android12系统下,APK签名文件生成方法。触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,该开发板是核心板加底板设计,音视频接口、通信接口等各类接口一应俱全,可帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。工具准备下载Keytool-ImportKeyPair工具在源码:build/target/product/security/系统初始签名文件目录中,将以下三个文件拷贝出来:platform.pem;platform.
    Industio_触觉智能 2024-12-12 10:27 29浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 83浏览
  • 应用环境与极具挑战性的测试需求在服务器制造领域里,系统整合测试(System Integration Test;SIT)是确保产品质量和性能的关键步骤。随着服务器系统的复杂性不断提升,包括:多种硬件组件、操作系统、虚拟化平台以及各种应用程序和服务的整合,服务器制造商面临着更有挑战性的测试需求。这些挑战主要体现在以下五个方面:1. 硬件和软件的高度整合:现代服务器通常包括多个处理器、内存模块、储存设备和网络接口。这些硬件组件必须与操作系统及应用软件无缝整合。SIT测试可以帮助制造商确保这些不同组件
    百佳泰测试实验室 2024-12-12 17:45 27浏览
  • 全球智能电视时代来临这年头若是消费者想随意地从各个通路中选购电视时,不难发现目前市场上的产品都已是具有智能联网功能的智能电视了,可以宣告智能电视的普及时代已到临!Google从2021年开始大力推广Google TV(即原Android TV的升级版),其他各大品牌商也都跟进推出搭载Google TV操作系统的机种,除了Google TV外,LG、Samsung、Panasonic等大厂牌也开发出自家的智能电视平台,可以看出各家业者都一致地看好这块大饼。智能电视的Wi-Fi连线怎么消失了?智能电
    百佳泰测试实验室 2024-12-12 17:33 34浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 63浏览
  • 在智能化技术快速发展当下,图像数据的采集与处理逐渐成为自动驾驶、工业等领域的一项关键技术。高质量的图像数据采集与算法集成测试都是确保系统性能和可靠性的关键。随着技术的不断进步,对于图像数据的采集、处理和分析的需求日益增长,这不仅要求我们拥有高性能的相机硬件,还要求我们能够高效地集成和测试各种算法。我们探索了一种多源相机数据采集与算法集成测试方案,能够满足不同应用场景下对图像采集和算法测试的多样化需求,确保数据的准确性和算法的有效性。一、相机组成相机一般由镜头(Lens),图像传感器(Image
    康谋 2024-12-12 09:45 74浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-12 10:13 25浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 69浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-11 17:58 83浏览
  • 铁氧体芯片是一种基于铁氧体磁性材料制成的芯片,在通信、传感器、储能等领域有着广泛的应用。铁氧体磁性材料能够通过外加磁场调控其导电性质和反射性质,因此在信号处理和传感器技术方面有着独特的优势。以下是对半导体划片机在铁氧体划切领域应用的详细阐述: 一、半导体划片机的工作原理与特点半导体划片机是一种使用刀片或通过激光等方式高精度切割被加工物的装置,是半导体后道封测中晶圆切割和WLP切割环节的关键设备。它结合了水气电、空气静压高速主轴、精密机械传动、传感器及自动化控制等先进技术,具有高精度、高
    博捷芯划片机 2024-12-12 09:16 80浏览
  • 首先在gitee上打个广告:ad5d2f3b647444a88b6f7f9555fd681f.mp4 · 丙丁先生/香河英茂工作室中国 - Gitee.com丙丁先生 (mr-bingding) - Gitee.com2024年对我来说是充满挑战和机遇的一年。在这一年里,我不仅进行了多个开发板的测评,还尝试了多种不同的项目和技术。今天,我想分享一下这一年的故事,希望能给大家带来一些启发和乐趣。 年初的时候,我开始对各种开发板进行测评。从STM32WBA55CG到瑞萨、平头哥和平海的开发板,我都
    丙丁先生 2024-12-11 20:14 68浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 106浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 108浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦