在AI加速来临时代，NPU助力大算力应用落地-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

随着芯片技术的不断进步，NPU将会越来越小、越来越节能，以适应更多的应用场景，为我们带来更多便利和智能化体验。而在韩国政府的支持下，三星为代表的IDM企业联动产业链合作，以推进“K-云计算”（韩国云计算）项目为导向，或许能做出更有性价比的产品，满足未来智能计算的多元化场景。

2023年初以来，由ChatGPT掀起AI领域技术革命，正加速AI应用方面落地，也成为业界关注和探讨的热点方向。而这一场生成式人工智能（AIGC）热潮催生了庞大的算力需求，而神经网络处理器（NPU）在大算力应用场景的应用优势正被业界广泛看好。

近日，据韩联社报道，韩国政府拟与AI芯片、云计算企业联合，组建团队研发高算力、低能耗的神经网络处理器（NPU）推理芯片，同时启动了“K-云计算”（韩国云计算）项目。该项目吸引了三星电子、SK海力士等芯片龙头以及部分AI芯片初创企业、云计算企业参会，其直接目的是与英伟达竞争，但避开英伟达主导的图形处理单元（GPU）市场。

目前，NPU这一赛道实际上也涌入了众多芯片企业，相关的竞品也很多，但大算力需求正给NPU带来更多的市场机会。可以说，在AI加速来临的时代，高算力、多样算力需求将推动AI芯片大爆发，NPU必然是代表之一。

什么是NPU？

NPU（Neural network Processing Unit），即神经网络处理器，可以在电路层模拟人类神经元和突触，并且用深度学习指令集直接处理大规模的神经元和突触，一条指令完成一组神经元的处理。相比于CPU和GPU的冯诺伊曼结构，NPU通过突触权重实现存储和计算一体化，从而提高运行效率。

实际上，AI芯片有多种类型，比如GPU、FPGA（现场可编程门阵列）和ASIC（专用集成电路）等。而NPU属于ASIC芯片的一种类型，因为其是为特定应用场景（如神经网络和深度学习）而设计的定制芯片。NPU专门用于处理神经网络、深度学习和机器学习等人工智能任务，其在AI和深度学习领域的应用广泛，如自动驾驶汽车、智能手机、智能家居设备、语音识别和自然语言处理等。而近年来涌现的TPU、NPU、VPU、BPU等令人眼花缭乱的芯片也均属ASIC。

不同于GPU和FPGA的灵活性，ASIC是定制化的，一经制造完成便不能更改，因此其开发成本高昂且周期长。但ASIC在性能和功耗上都要优于前两者，例如TPU比同时期的GPU平均提速15-30倍，能效比提升30-80倍。

另外，NPU的出现，是业界非常看好AI算法在解决现实问题比传统算法有更多可能性，能够突破传统算法的很多瓶颈，因此AI算法将在未来的成为主流的解决问题的算法，而这么大的算力缺口自然需要有专用的ASIC，因而NPU应运而生。不过，GPU在近几年专门针对AI算法加强了并行计算单元，因此除CPU外，GPU、NPU、FPGA等芯片作为AI算法的硬件加速器在不同的应用场景和深度学习算法中发挥着各自的优势。

大算力助力AI落地

随着摩尔定律放缓，通用处理器架构难以满足人工智能的密集型计算需求。因此，在这种趋势下，专用芯片成为面向特定需求提升算力和能效比的新思路。

其中，NPU是面向机器学习和人工智能领域的专用加速芯片。相比CPU、GPU等通用芯片，NPU在电路层模拟了人类神经元和突触，针对AI计算涉及的大量神经网络模型进行特殊优化，能够以更高的效率、更低的能耗处理人工神经网络、随机森林等机器学习算法和深度学习模型。

今年4月，三星半导体已成功量产第一代WarBoy NPU芯片，采用三星14nm制程工艺。据悉，WarBoy是一款专为人工智能设计的神经元网络芯片，速度是普通GPU的十倍。除了三星之外，苹果、OPPO等也在研发应用NPU，主要于面部识别、拍摄物体及环境识别、影像处理等，为消费者带来3D动画表情、人脸解锁、AI场景识别、无损实时RAW计算等一系列新体验。

目前，大部分运用训练AI大型语言模型的硬件设备都来自英伟达，例如英伟达A100加速显卡，能够提供高达19.5TFlops的单精度浮点性能。在大算力需求不断上升的趋势下，GPU不仅成本高昂，且供应不足，而NPU不仅可以减少AI领域研发的成本，也能减少不必要的资源浪费。

因此，天风证券也认为，随着GPU的功耗过高等弊端的显现，类GPU架构的定制化大算力AI芯片（ASIC）或将存在市场，未来GPU与ASIC两者可能将产生替代竞争。不过，随着人工智能逐渐向平板电脑、台式机、家居、汽车等更多领域渗透，NPU在算力、精度以及灵活性和兼容性存在技术与应用挑战。

AI计算芯片成为新风口

随着人工智能的热潮和AI算法的广泛应用，深度学习已成为当前AI研究的重点，在自动驾驶领域，环境感知、传感器融合、控制决策等都会涉及到深度学习。随着人工智能技术栈和行业应用的发展，NPU一方面支持越来越多的模型，包括GPT-4采用的Transformer模型；另一方面，也从AIoT走向消费电子、自动驾驶等更多领域。

以华为NPU为例，相比传统标量、矢量运算模式，华为自研架构NPU采用3D Cube针对矩阵运算做加速，因而单位时间计算的数据量更大，单位功耗下的AI算力也更强，相对传统的CPU和GPU实现数量级提升，实现更优能效。

从具体应用场景来看，NPU将主要应用于图像识别、自然语言处理、智能驾驶等领域。在图像识别领域，NPU能够快速处理各种复杂的图像数据，以实现精准的图像识别和分类等功能。在自然语言处理领域，NPU能够识别各种自然语言数据，以实现智能对话、自动翻译等功能。在智能驾驶领域，NPU则能够快速处理各种传感器数据，以实现自动驾驶、智能导航等功能。总体而言，NPU能够加速神经网络计算，以实现各种复杂数据处理任务的快速和高效。

从未来发展前景来看，NPU 作为一种专门针对神经网络计算的硬件器件，具有广泛的应用前景。未来随着深度学习技术的不断发展，NPU 将会越来越重要，成为未来计算机体系结构的核心组成部分之一。

另外，随着AI应用场景的不断扩大，比如智慧医疗、智慧零售等，NPU将会在更多领域发挥重要作用。同时，随着芯片技术的不断进步，NPU将会越来越小、越来越节能，以适应更多的应用场景，为我们带来更多便利和智能化体验。而在韩国政府的支持下，三星为代表的IDM企业联动产业链合作，以推进“K-云计算”（韩国云计算）项目为导向，或许能做出更有性价比的产品，满足未来智能计算的多元化场景。

责编：Jimmy.zhang

阅读全文，请先

您可能感兴趣

【ICCAD2024】AI时代，先进数字芯片设计下的国产EDA新路径

面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战，国产EDA仍需不断探索和创新。

美国最高法院驳回英伟达上诉请求，被控诉涉嫌误导投资者

股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动，而非游戏销售，导致投资者对公司的盈利来源和风险敞口产生错误认知。

为什么说机器人的“ChatGPT时刻”将至？从ROSCon看当代机器人开发…

今年初的GTC上，黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...

华为Mate 70 RS拆解：麒麟9020芯片现身

华为Mate 70系列中的Mate 70搭载了麒麟9010芯片，而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日，百万粉丝的网红博主@杨长顺维修家对华为Mate 70 RS进行了拆解……

英特尔开始从外部寻找新CEO：陈立武等在候选名单上

常情况下，英特尔的CEO在65岁时退休，而现年63岁的基辛格突然被退休，让市场感到意外。为了确保平稳过渡，英特尔董事会立即着手寻找新的CEO人选……

英特尔宣布CEO基辛格退休，立即生效

虽然英特尔CEO基辛格突然退休的消息令市场感到意外，但投资者似乎将其解读为利好信号，英特尔甚至股价一度上涨。

“一碰交互，共触未来”ITMA峰会盛大开启近场交互新生态

目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。

中科院微电子所在忆阻神经-模糊硬件及应用探索方面取得新进展

中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……

直角照明轻触开关为复杂电子应用提供定制性和多功能性

C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。

投身国产浪潮向上而行，英韧科技再获“中国芯”认可

投资20亿！路芯半导体掩膜版生产项目首批工艺设备机台入厂

来源：苏州工业园区12月17日，江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来，专注于半导体掩膜版的研发与生产，掌握130nm至28n

拜登拟对成熟制程芯片启动301调查

来源：观察者网12月18日消息，自12月2日美国发布新一轮对华芯片出口禁令以来，不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称，根据知情人士以及该报查阅

京东方晶芯MLED项目，已完成设备搬入

12月18日，珠海京东方晶芯科技举行设备搬入仪式。插播：加入LED显示行业群，请加VX：hangjia188在10月31日，珠海京东方晶芯科技有限公司发布了Mini/Micro LED COB显示产品

AI日报丨超级AI独角兽来了！拿下100亿美元融资，估值升至620亿美元

“ 洞悉AI，未来触手可及。”整理 | 美股研究社在这个快速变化的时代，人工智能技术正以前所未有的速度发展，带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势，为您提供深度的

自动驾驶业务增长6倍，Uber被市场明显错杀，即将迎来50%上涨空间！

“ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务，Uber ( NYSE: UBER ) 的股价在短短几周内从 202

高科视像、新视通等持续扩大COB产能

近期，高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播：加入LED显示行业群，请加VX：hangjia188■ 高科视像：MLED新型显示面板生产项目（二期）招标12月18日，山西高科

超60GW！飙升12倍，储能机会来了?

又一地，新型储能机会来了？■ 印度：2032储能增长12倍，超60GW据印度国家银行SBI报告，印度准备大幅提升能源存储容量，预计到2032财年将增长12 倍，超60GW左右。这也将超过可再生能源本身

面板大厂引入AI，每年节省10亿！

LG Display 12月18日表示，为加强OLED制造竞争力，自主开发并引进了“AI（人工智能）生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表

开讲在即|TI模拟+嵌入式处理器产品技术方案助力新能源系统设计，提升系统稳定性与可靠性

点击蓝字关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播

【倒计时3天】2024RT-Thread开发者大会，本周六见！

亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天！还没报名的小伙伴，抓紧报名噢，12月21日不见不散！大会时间与地点时间：2024年12月21日 9:30-1

文章评论

最新
热门

换一换

EE直播

更多>

在AI加速来临时代，NPU助力大算力应用落地

什么是NPU？

大算力助力AI落地

AI计算芯片成为新风口

杂志声明