【了不起的芯片】CPU、GPU、GPGPU,计算三兄弟的前世今生

原创 新思科技 2022-11-04 16:57


2022新思科技科普类短视频栏目《了不起的芯片》全新上线!新思科技一直致力于打造“人人都能懂”的行业科普视频,传播更多芯片相关小知识,解答各类科技小问题。每周3分钟,多一些“芯”知识。


第一期,我们一起聊聊CPU、GPU、GPGPU的前世今生。




CPU、GPU、GPGPU,这些名词大家都耳熟能详,但大多数人或许并不知道,这几个词包含着人们对数字世界“快,更快”的追求。它们关乎到你会议是否延迟、游戏是否卡顿、程序是否顺畅……

今天我们就从CPU和GPU的不同,以及自GPU衍生而来的GPGPU,一起来看看IC时代下开发者们对“快”的追求是如何演进的。

CPU(Central Processing Unit),中央处理器应该是大家最熟悉的一个。它是我们电脑、手机等众多电子产品的“核心”,我们就称它为老大哥吧。不管你在看视频、玩游戏,还是聊天、上网课,其实都是靠它来统一指挥调度,发号施令。为了满足很强的通用性能处理各种不同的数据,CPU的内部结构设计十分复杂,这也奠定了其老大哥的地位,基本上复杂一点的电子产品都离不开它。

简单一点来说,我们可以把CPU,或者说CPU的核心,分成三部分:计算单元(ALU)、控制单元(CU)和缓存单元(Cache)。例如下图,我们可以看到存储和控制单元占据了相当大的比例,也就是图中1、3、5和6的部分。相较而言,2和7所代表的计算区域就比较有限。这款CPU已经是非常老旧的Intel 486了,现代CPU中缓存单元的面积只多不少。

来源:Wikimedia Commons(cc:https://creativecommons.org/licenses/by/3.0/deed.en)

迄今为止所有CPU都遵循老祖宗图灵定下的基本法:读取指令,进行解码,发出操作控制信号,然后再进行下一个工作。但随着计算机的普及,我们对于图形显示的要求越来越高,比如3D建模,大型游戏等,更丰富的网络生活,也要求电子产品实现更大的数据规模和更快的处理速度。如果让CPU一件一件来处理呢,大家可能就没办法这么开心地“网上冲浪”了。

尽管CPU的内部有各种各样的方法加速指令的执行,但越来越多的任务早已让CPU的那些小技俩江郎才尽。那怎么办,多堆几个CPU呢?Emmm……首先它太烧钱了(即便是最新款的CPU,它的物理核心数量也还是个位数哦),其次也有点大材小用。这时候聪明的开发者们就发现,既然CPU计算能力不足,我们就把计算单元都堆在同一块芯片上,让他们来主要负责大量重复运算的任务不就行了吗?所以GPU就出现了。

GPU(Graphics Processing Unit),就是图形处理器。它只有很少的控制单元和缓存,但是堆满了运算单元,能够处理以图形任务为代表的大规模并发运算。


图形渲染要对图像上的每一个像素点进行处理,而这些像素处理的过程和方式十分相似。这也是为什么GPU如此擅长图像处理。打个比方,CPU这个老大哥每天处理的指令包罗万象,但是图形图像处理属于单一重复工种,让老大哥费时费力来做这些显然不合适。于是GPU就像是老大哥招募来的一批小弟,能够同时处理大量重复的计算工作,这样老大哥可以高效地处理其他需要费脑子的活儿。也就是说CPU+GPU的强强联手,才让大家打游戏的时候能够纵享丝滑。

GPGPU(General-purpose computing on Graphics Processing Unit),从名字就可以看出来,它是GPU衍生出来的概念,指的是通用图形处理器。随着GPU的功能和运算能力越来越强大,开发者就想GPU这个超强运算能力,除了图形处理之外还能不能去做一些别的?于是,他们给GPU引入了通用可编程的功能。所以GPGPU能够利用GPU可并行计算的架构以及可编辑的特性来实现可编程高算力的能力。如果我们把GPU看作CPU的小弟,那GPGPU就算是特长生小弟了。

GPGPU的发展过程也伴随着人工智能产业大火,我们对算力的需求不断攀升且计算不断复杂化,通过去掉了图形显示部分,将其余部分全部投入了通用计算,GPGPU在医疗健康、深度学习、VR等算力密集领域大放异彩。

好像听明白了,又好像没那么明白?没关系,我们举个通俗的例子。

如果我们将芯片处理的问题比作数学题,图形处理这种大量重复的简单任务就是加减法运算,要分析指令、调取数据、控制操作等逻辑控制类任务就是高考数学题,通用计算密集型任务就像是IMO国际奥数题。那么相应的,GPU就是一群只会做简单运算的小学生,CPU是擅长逻辑控制的大学生,GPGPU就相当于一大群针对专门任务进行专项强化训练后的优秀奥赛选手。

很显然,如果脱离实际应用场景和成本来争论CPU、GPU、GPGPU哪个更厉害,这本身就是个伪命题。因为要处理的场景不同,所以三者设计的出发点也不一样。CPU、GPU和GPGPU在设计之初就都有EDA和IP的强大支持。如今市场上的大部分CPU和小型的GPU基本上都已经实现了IP化(同时有趣的是,在你笔记本里的x86 CPU里面还会套娃式的使用一些其他指令集CPU的IP)。大型的GPGPU目前也依然依赖EDA工具,特别是高效的后端数字工具来确保设计成功。

不同的处理器也许功能不同,但其终极目标是一致的,都是为了助力数字世界更快运作,三者各司其职又相互补充来协同工作,便就能给终端用户带来最佳的体验。



"image" data-miniprogram-servicetype="" _href="">                                                                                                                                                                                                                                                                                                                                 
                                                                                  

   

新思科技 新思科技(Synopsys, Inc.)以芯片产业的“根技术”推动AI、5G、高性能计算、智能汽车等前沿应用的核心技术发展。
评论 (0)
  • Sub-GHz,即工作频段低于1GHz的无线通信技术,常见频段有315MHz、433MHz、868MHz与915MHz等。其可借助无线电波在自由空间传播的特性,把数据调制到射频载波上进行传输,达成物联网设备间的无线通信,是物联网设备实现高效、稳定、无缝交互的“通信基石”。典型射频信号(无线电波)收发电路简示在工业自动化、智慧城市、智慧农业与智能家居等物联网领域中,LoRa、Wi-SUN、Z-Wave、Sigfox等工业级通信协议大多运行在Sub-GHz频段。而正是通过Sub-GHz射频技术,传感
    华普微HOPERF 2025-03-07 11:39 106浏览
  • 深圳触觉智能SOM3506核心板现已上市,搭载瑞芯微RK3506B/J超低功耗处理器(1.5GHz三核A7+M0),低功耗满载仅0.7W,支持40℃~85℃工作环境,即日起宽温级59元/工业级68元,特价开售!芯片介绍RK3506是瑞芯微Rockchip在2024年第四季度全新推出的Arm嵌入式芯片平台,三核Cortex-A7+单核Cortex-M0多核异构设计,CPU频率达1.5Ghz, M0 MCU为200Mhz。RK3506适用场景简介工业控制‌:RK3506适用于工业控制、工业通信、人机
    Industio_触觉智能 2025-03-07 10:03 109浏览
  •        深夜的公园里,当路灯熄灭后,传统监控摄像头只能拍出模糊的黑白画面,仿佛老式胶片电影里的场景。而搭载为旌瑶光ISP的摄像头,却能像猫科动物一样,在几乎全黑的环境中捕捉到行人衣服的颜色、树叶的纹理,甚至快速跑动的宠物狗毛发细节。这种从“黑白默片”到“全彩4K电影”的跨越,背后是为旌瑶光ISP对传统红外补光技术的颠覆性创新。一、传统方案之困:被红外光“绑架”的夜视世界        传统安防摄像头依赖红外
    中科领创 2025-03-07 16:50 202浏览
  • 一、系统概述MYD-LD25X搭载的Debian系统包含以太网、WIFI/BT、USB、RS485、RS232、CAN、AUDIO、HDMI显示和摄像头等功能,同时也集成了XFCE轻量化桌面、VNC远程操控、SWITCH网络交换和TSN时间敏感网络功能,为工业设备赋予“超强算力+实时响应+极简运维”的体验!类别名称描述源码TF-AArm Trusted Firmware 2.8OP-TEEOP-TEE 3.19BootloaderU-boot 2022.10KernelLinux Ke
    米尔电子嵌入式 2025-03-07 14:08 160浏览
  • 文/Leon编辑/cc孙聪颖2025年全国两会进行时,作为“十四五”规划收官之年,本届两会释放出坚定目标、稳中求进、以进促稳等信号。其中,企业家们的建议备受关注,关系到民营经济在2025年的走向。作为国内科技制造业的“老兵”,全国人大代表、TCL集团创始人及董事长李东生在本届两会中提出三份代表建议,包括《关于优化中国科技制造业融资环境的建议》、《关于加强AI深度伪造欺诈管理的建议》和《关于降低灵活就业人员社会保险参保门槛的建议》,表现出对科技制造、AI发展和劳动者保障方面的关注。会后,李东生接受
    华尔街科技眼 2025-03-06 19:41 96浏览
  • 深圳触觉智能RK3506开发板现已上市,开启预售!搭载瑞芯微RK3506B/J超低功耗工业处理器(1.5GHz三核A7+M0,主频1.5GHz);支持1280×1280显示、双百兆网口、星闪无线三模,板载高达2路CAN FD与5路串口。RK3506适用场景简介工业控制‌:RK3506适用于工业控制、工业通信、人机交互等应用场景。其多核异构架构(3xCortex-A7+Cortex-M0)和外设接口丰富,支持Buildroot、Yocto系统,适合轻量级HMI应用‌。‌工业通信‌:RK3506均支
    Industio_触觉智能 2025-03-07 10:04 88浏览
  • 服务器应用环境与客户需求PCIe 5.0高速接口技术的成熟驱动着生成式AI与高效能运算等相关应用蓬勃发展。在随着企业对服务器性能的要求日益严苛,服务器更新换代的周期也持续加快。在此背景下,白牌与DIY(Do It Yourself)服务器市场迎来了新的发展契机,但同时也面临着更趋复杂的技术挑战。传统上,白牌与DIY服务器以其高度客制化与成本效益优势受到市场青睐。然而,随着PCIe 5.0等高速技术的导入,服务器系统的复杂度大幅提升,对组装技术与组件兼容性也就提出更高的要求。举个简单的例子来说,P
    百佳泰测试实验室 2025-03-06 17:00 124浏览
  • 在企业管理和职场环境中,权力是一个常被提及却又让人感到微妙的话题。有人觉得它充满吸引力,有人却对它避之不及。然而,不管你对权力的态度如何,理解它、掌握它,甚至善用它,都是职场成功的重要一环。今天,我们就来深入探讨权力的本质,特别是个人权力和社会权力的区别,以及如何在职场中逐步建立属于自己的影响力。权力的两种面貌:你掌控自己,还是掌控他人?说到权力,首先要区分它的两种类型。个人权力是你对自己生活的掌控感。比如,你能自由决定自己的职业方向,不用总是请示他人。这种权力让人感到踏实和满足,是我们在生活中
    优思学院 2025-03-07 15:56 129浏览
  • 多人同时共享相同无线网络,以下场景是否是您熟悉的日常?姐姐:「妈~我在房间在线上课,影音一直断断续续的怎么上课啊!」奶奶:「媳妇啊~我在在线追剧,影片一直卡卡的,实在让人生气!」除此之外,同时间有老公在跟客户开在线会议,还有弟弟在玩在线游戏,而妈妈自己其实也在客厅追剧,同时间加总起来,共有五个人同时使用这个网络!我们不论是在家里、咖啡厅、餐厅、商场或是公司,都会面临到周遭充斥着非常多的无线路由器(AP),若同时间每位使用者透过手机、平板或是笔电连接到相同的一个网络,可想而知网络上的壅塞及相互干扰
    百佳泰测试实验室 2025-03-06 16:50 115浏览
  • 近年来,越来越多的企业在5S管理的基础上,开始追求6S、7S甚至8S管理,仿佛S越多,管理就越先进,企业就越优秀。于是,6S增加了“安全”,7S又加上了“节约”,8S甚至引入了“学习”……看似更加全面,实则很多企业只是机械地增加S,却忽略了管理的核心目标:提升效率、降低浪费、优化工作环境。优思学院认为,5S本身已经是一套成熟的精益管理工具,它的核心理念不仅简单高效,而且易于实施和推广。如果企业只是为了赶时髦,盲目增加S,而没有真正理解5S的本质,那么这些额外的“S”很可能会变成管理上的负担,而不
    优思学院 2025-03-07 12:43 123浏览
  • ASL6328芯片支持高达 6.0 Gbps 运行速率的交流和直流耦合输入T-MDS 信号,具备可编程均衡和抖动清理功能。ASL6328 是一款单端口 HDMI/DVI 电平转换 / 中继器,具有重新定时功能。它包含 TypeC双模式 DP 线缆适配器寄存器,可用于识别线缆适配器的性能。抖动清理 PLL(锁相环)能够消除输入抖动,并完全重置系统抖动容限,因此能更好地满足更高数据速率下 HDMI 抖动合规性要求。设备的运行和配置可通过引脚设置或 I2C 总线实现。自动断电和静噪功能提供了灵活的电
    QQ1540182856 2025-03-06 14:26 108浏览
  • ​CS6212是一款可分别用于USB Type-C主机/显示端口源应用的带重定时的有源开关。这设备符合USB 3.2标准版本1.0和USB Type-C标准上的VESA DisplayPort Alt模式 1.0版,支持通过GPIO或12C进行灵活的模式切换。此设备支持USB 3.2第2x1代 运行速度高达10Gbps,DisplayPort 1.4运行速度高达HBR3 8.1Gbps。CS6212管脚分布及功能定义:CS6212支持重定时器训练,并支持USB 3.2标准中定义的状态状态机(RT
    QQ1540182856 2025-03-07 10:09 97浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦