AI芯片与未来:DPU、GPU、NPU、ASIC和FPGA

智能计算芯世界 2023-04-15 00:00

目前用于深度学习最广泛的芯片当属擅长并行计算的 GPU,而随着深度学习对算力要求的不断提升,各家公司开始研发生产专用于深度学习、DNN 的运算芯片或基于 FPGA 架构的半定制芯片,代表产品有 Google 研发的张量计算处理器 TPU、寒武纪研发的神经网络计算处理器 NPU 以及 Intel 旗下的 Altera Stratix V FPGA。目前各类芯片各有优劣,未来或将出现GPUFPGA、“XPU”分别对应不同算力要求、产品结构的运算芯片市场。

下载链接:
AI技术芯片与未来(DPU、GPU、NPU、ASIC、FPGA)
《70+篇半导体行业“研究框架”合集》
203份重磅ChatGPT专业报告
《人工智能AI大模型技术合集》
《AIGC政策、安全和未来发展》
1、网信办发文,高度重视AIGC安全
2、规范性政策或促进AIGC产业长期健康发展
《46份智能网卡和DPU合集》
医疗AI产业:AI大模型+医疗龙头公司
商汤日日新大模型发布,目标瞄准AGI时代

以昇思为基,盘古生态引领中国AI未来

当前市场上主要有通用类(GPUDPU)、FPGA(半定制)、ASIC(全定制)三大类 AI 计算芯片。其中 GPU 目前市场使用率最高,商业化较为成熟,全球最主要的供应商是英伟达。而以 FPGA ASIC 架构研发出的 AI 芯片种类较多,目前尚处于发展探索阶段,例如较为知名的 NPUTPU 就是以 ASIC 架构为基础设计的。

1. GPU:通用性最强,AI 计算时代霸主

GPU,源于图形处理的 AI 计算芯片。GPUGraphics Processing Unit),即图形处理器,又称显示核心、视觉处理器、显示芯片,起初是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器,是一种由大量运算单元组成的大规模并行计算架构,专为同时处理多重任务而设计。大数据时代,GPU 被广泛应用于数据中心、矿机、深度学习等领域。GPU 芯片采用统一渲染架构,计算通用性最强,可以适用于多种算法,在算法尚未定型的领域,GPU是最佳选择。

GPU AI 计算市场销售额占比最大,霸主地位稳固。目前大多数领域,AI 计算算法尚在不断探索、优化阶段,GPU 仍是最佳选择。根据智研咨询数据显示,截至 20218 月,全球人工智能的计算力主要是以 GPU 芯片为主,2020 年销售额市场份额占比约为 42.3%,市场规模约为 38 亿美元,预测到 2024 年销售额占比提升至 51.4%,届时全球人工智能 GPU 芯片市场规模将达 111 亿美元。

2. FPGA:半定制芯片,灵活性高

FPGA 是一种半定制芯片。FPGAFieldProgrammable Gate Array),现场可编程门阵列,用户可以根据自身的需求进行重复编程。FPGA 的优点是既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点,对芯片硬件层可以灵活编译,功耗小于 CPUGPU;缺点是硬件编程语言较难,开发门槛较高,芯片成本、价格较高。FPGA GPUCPU 更快是因为其具有定制化的结构。

CPU GPU 都属于冯·诺依曼结构,在该结构中,执行单元可以执行任意指令,这需要有指令存储器、译码器、各种指令的运算器等和共享内存。而 FPGA 的每个逻辑单元的功能在重编程时就已经确定,不需要指令和共享内存。但这也是 FPGA 的缺点,当处理的任务重复性不强、逻辑较为复杂时,FPGA 效率就会低于使用冯·诺依曼结构的处理器。

3. ASIC:专用性最强,追求极致性能

ASIC 是一种为专门目的而设计的芯片(全定制)。ASIC特殊应用集成电路芯片,是一种根据特定算法定制的芯片架构,其定制程度相比于 GPU FPGA 更高。ASIC 算力水平一般高于 CPUGPUFPGA,但初始投入大,专业性强缩减了其通用性,算法一旦改变,计算能力会大幅下降,需要重新定制。

算力需求增加,ASIC 前景广阔。随着数据量的不断增加和芯片工艺的极限到来,对算力的诉求越来越难以被满足。在此背景下,对于一些特定的领域,其数据量庞大,算法逐渐固定,使用专为特定算法设计的 ASIC 芯片成为了许多公司的首选。AI 计算市场上比较火的 TPUNPU 等,都是 ASIC 专用芯片。

4. DPUGPU 之后分担 CPU 算力又一芯片

DPU 是一个全新的,用于在数据中心承担网络和存储等服务的处理器。DPU(Data Processing Unit),数据中心处理器是最新发展起来的专用处理器,主要是用来加速数据中心的安全、网络和存储任务。它是继 CPUGPU 之后,数据中心场景中的第三颗重要的算力芯片,为高带宽、低延迟、数据密集的计算场景提供计算引擎。DPU 将卸载 CPU原本承担的网络、存储、安全、管理等服务,释放 CPU 算力,同时对安全隐私进行高级别的加密。在 2021 4 月的 GTC 大会上,英伟达总裁黄仁勋推出了 NVIDIA BlueField-3 DPU 及其配套软件生态架构 DOCA

DPU 的提出能够有效解决 CPU Memory 之间传输带宽的瓶颈。随着数据量的增加,CPU Memory 之间的数据传输带宽成了瓶颈。根据 Fungible AWS 的统计,在大型数据中心中,流量处理占到了计算的 30%左右。数据中心在节点间交换效率和可靠性以及节点内 I/O 切换效率比较低,DPU 的出现是为了试图解决这种松耦合的关系,从这方面加快整体运算速度。目前来看 DPU 只是提供更安全高效的网络、存储等加速服务,但未来或将真正的以数据中心为运算单元,依靠 DPU 实现紧耦合结构提升整体效率。

5. NPU TPU:深度学习 ASIC 加速芯片

NPU 是一种参考人体神经突触的 ASIC 芯片。随着深度学习神经网络的兴起,CPUGPU 逐渐难以满足深度学习的需要,专门用于神经网络深度学习的处理器NPU(Neural Processing Unit)应运而生。NPU 采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。区别于 CPU 以及 GPU 所遵循的冯诺依曼架构,NPU 参考人体的神经突触结构,将存储与运算结为一体。

NPU 显著提高了深度学习芯片的运算速度。深度学习芯片主要分为训练芯片和推理芯片。深度学习神经网络算法像人一样,需要学习知识(训练),之后就可以把学习到的知识运用到工作中去(推理)。训练过程需要大量的数据样本进行计算,而推理过程需要用少数的数据快速得出推理结果。NPU 在电路层模拟人类神经元和突触,相比于 GPU的冯诺依曼结构,NPU 通过突触权重实现存储计算一体化,提高运行效率,因此 NPUGPU 更擅长推理。

TPU,专门为 Google Tensorflow 框架设计的 ASIC 芯片。张量处理器(Tensor Processing Unit)是 Google 为机器学习定制的 ASIC 芯片,专为 Google 的深度学习框架TensorFlow 而设计。Google 2016 年的 Google I/O 年会上首次公布了 TPU,不过在此之前 TPU 已在 Google 内部的一些项目中使用了一年多,如 Google 街景服务、RankBrain以及其旗下 DeepMind 公司的围棋软件 AlphaGo 等都用到了 TPUTPU 只完成推理过程,训练过程由 GPU 完成。

新计算模式不断出现,底层架构持续创新

AI 计算蓬勃发展,新计算模式不断出现。随着各大厂商对 AI 芯片的不断研究,芯片的计算性能不断提升,芯片种类不断增多。截至 2021 8 月,GPU AI 计算市场份额最大,但 FPGAASIC 的发展迅速,有望取代一部分 GPU 的业务。与此同时,DPU的不断运用也将有效改善和加速网络数据传输计算速度,协同 CPUGPU 高效运行。

当前 CPU 依然处于计算芯片中的核心地位,GPUDPU 目前也只能卸载 CPU 部分功能,加快 CPU 处理、运算的效率,并没有根本动摇 CPU 地位。目前在人工智能、深度学习和云计算等领域以 CPU+GPU 为主要场景,CPU+FPGACPU+NPU 等模式不断推出,未来有望出现更先进的模式。

下载链接:

多模态AI研究框架(2023)

大模型算力需求驱动AI服务器行业高景气(2023)

“机器人+” 系列:机器人研究框架(2023)

《70+篇半导体行业“研究框架”合集》
183份重磅ChatGPT专业报告
《人工智能AI大模型技术合集》

1、大模型算力需求驱动AI服务器行业高景气(2023) 2、多模态大模型技术演进及研究框架 3、大模型遇到金融:海内外金融领域大模型对比 4、大模型如何影响网安行业的未来 5、大模型应用百花齐放,AI发展进入新时代 6、详解大模型训练与推理对算力产业链的需求影响 7、训练大模型发展前景及思考和探讨—华为诺亚方舟实验室 8、人工智能通用大模型(ChatGPT)的进展、风险与应对 9、ChatGPT引发的大模型时代变革 10、中国大模型发展白皮书(2023年) 11、中国大模型发展白皮书—元能力引擎筑基智能底座(2023年) 12、“源1.0”大模型技术白皮书

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。



免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。

电子书<服务器基础知识全解(终极版)>更新完毕。
获取方式:点击“小程序链接”即可查看182页 PPT可编辑版本和PDF阅读版本详情。

服务器基础知识全解PPT(终极版)

服务器基础知识全解PDF(终极版)


温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。

智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 478浏览
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 488浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 88浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 439浏览
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 445浏览
  • 随着通信技术的迅速发展,现代通信设备需要更高效、可靠且紧凑的解决方案来应对日益复杂的系统。中国自主研发和制造的国产接口芯片,正逐渐成为通信设备(从5G基站到工业通信模块)中的重要基石。这些芯片凭借卓越性能、成本效益及灵活性,满足了现代通信基础设施的多样化需求。 1. 接口芯片在通信设备中的关键作用接口芯片作为数据交互的桥梁,是通信设备中不可或缺的核心组件。它们在设备内的各种子系统之间实现无缝数据传输,支持高速数据交换、协议转换和信号调节等功能。无论是5G基站中的数据处理,还是物联网网关
    克里雅半导体科技 2025-01-10 16:20 432浏览
  • 在不断发展的电子元件领域,继电器——作为切换电路的关键设备,正在经历前所未有的技术变革。固态继电器(SSR)和机械继电器之间的争论由来已久。然而,从未来发展的角度来看,固态继电器正逐渐占据上风。本文将从耐用性、速度和能效三个方面,全面剖析固态继电器为何更具优势,并探讨其在行业中的应用与发展趋势。1. 耐用性:经久耐用的设计机械继电器:机械继电器依靠物理触点完成电路切换。然而,随着时间的推移,这些触点因电弧、氧化和材料老化而逐渐磨损,导致其使用寿命有限。因此,它们更适合低频或对切换耐久性要求不高的
    腾恩科技-彭工 2025-01-10 16:15 97浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 163浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 458浏览
  • 电动汽车(EV)正在改变交通运输,为传统内燃机提供更清洁、更高效的替代方案。这种转变的核心是电力电子和能源管理方面的创新,而光耦合器在其中发挥着关键作用。这些不起眼的组件可实现可靠的通信、增强安全性并优化电动汽车系统的性能,使其成为正在进行的革命中不可或缺的一部分。光耦合器,也称为光隔离器,是一种使用光传输电信号的设备。通过隔离高压和低压电路,光耦合器可确保安全性、减少干扰并保持信号完整性。这些特性对于电动汽车至关重要,因为精确控制和安全性至关重要。 光耦合器在电动汽车中的作用1.电池
    腾恩科技-彭工 2025-01-10 16:14 71浏览
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 457浏览
  • 随着全球向绿色能源转型的加速,对高效、可靠和环保元件的需求从未如此强烈。在这种背景下,国产固态继电器(SSR)在实现太阳能逆变器、风力涡轮机和储能系统等关键技术方面发挥着关键作用。本文探讨了绿色能源系统背景下中国固态继电器行业的前景,并强调了2025年的前景。 1.对绿色能源解决方案日益增长的需求绿色能源系统依靠先进的电源管理技术来最大限度地提高效率并最大限度地减少损失。固态继电器以其耐用性、快速开关速度和抗机械磨损而闻名,正日益成为传统机电继电器的首选。可再生能源(尤其是太阳能和风能
    克里雅半导体科技 2025-01-10 16:18 319浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦