Transformer 模型和 NPU IP 可针对边缘应用进行协同优化-电子工程专辑

 Transformer 模型正在风靡 AI 世界，超级智能聊天机器人和搜索查询以及图像和艺术生成器都证明了这一点。它们也基于神经网络技术，但编程的方式与更常见的卷积方法截然不同。现在，Transformer 开始进入边缘应用。一个非常明确的诱因是这些方法普遍应用于以下各种应用：ViT（视觉转换器）、音频和自然语言处理 (NLP)，与传统的基于 CNN/RNN 的模型更受限制的应用不同。

Transformer 模型正在风靡 AI 世界，超级智能聊天机器人和搜索查询以及图像和艺术生成器都证明了这一点。它们也基于神经网络技术，但编程的方式与更常见的卷积方法截然不同。现在，Transformer 开始进入边缘应用。一个非常明确的诱因是这些方法普遍应用于以下各种应用：ViT（视觉转换器）、音频和自然语言处理 (NLP)，与传统的基于 CNN/RNN 的模型更受限制的应用不同。OEM 已发现基于单一计算平台来满足多种需求（从 ADAS 的行人检测到信息娱乐应用基于语音的控制）所带来的明显的成本、培训以及维护优势。视觉转换器网络的有效性是任何替代策略中的关键测试，因为基于 CNN 的视觉已经很成熟，尽管仅限于预定义的模式。

对系统构建者来说，额外的诱因在于过去几年中大量的 Transformer 研究，且其功能已经取得了非常迅速的进步。除此之外，还有迹象表明这些系统可能适合自我监督学习，就像我们在大型语言模型 (LLM) 中看到的那样，很明显，这就是为什么系统 OEM 迫切需要跟上这一趋势的原因。

（资料来源：CEVA）

市场潜力

没有人预测卷积模型 (CNN) 会走到尽头。从家庭自动化到汽车和工业应用等诸多应用领域中，这些模型已经非常成熟。但在新兴应用领域，它们的通用性不如 Transformer。围绕明确的技术领先者制定 10 年产品开发计划（包括 Transformer 选项），同时仍然保留 CNN 以用于其已经得到充分证明的应用领域，是一个明显的优势。

全球边缘计算市场之前预计在 2022 年达到 447 亿美元，并预测到 2030 年之前以 17.8% 的复合年增长率增长到超过 1400 亿美元。这为边缘 AI 系统构建者提供了巨大的机遇，但鉴于边缘应用的多样性，除非他们能在一个通用的计算平台下统一大部分开发工作，否则这也是一个挑战。目前已经有一些视觉和语言 Transformer 边缘应用，而且越来越多的 Transformer 正迁移到边缘，例如，Qualcomm 最近宣布对开源 Llama2 语言模型提供设备上的支持，与 OpenAI 的 GPT4 展开竞争。这表明对于战略 OEM 领导者来说，机会已经成熟。

让 Transformer 适应边缘的关键挑战

我们通常听到的基于云的 Transformer 模型非常庞大，不适合边缘部署。实用的边缘模型要小得多，但是，就像 CNN 模型一样，必须对其进行压缩，才能在可接受的功率范围内提供有效的性能。然而，Transformer 加速器结构与卷积结构有很大不同，需要采用不同的压缩方法。

CEVA 有幸与 CERN 合作，对大型强子对撞机 (LHC) 中使用的 CMS 探测器中的粒子射流探测神经网络进行原型设计。在我们的联合研究中，我们评估了 CNN 和基于 Transformer 的模型。此应用需要超低延迟，因此需要采用高效的模型才能避免丢失事件。为实现该目标，我们的联合研究提出了一种基于数学的模型精简和量化方法。

量化（用 16 位、8 位甚至 4 位固定小数点取代浮点运算）是 CNN 优化中的一种常见方法。精简方法可识别许多冗余或对网络性能贡献很小的网络参数，因此能够有选择性地删除不必要的连接或参数。

通常，固定的硬件平台限制了这种调优选项。我们的研究允许通过在每一层进行 AI 处理器调优和 Transformer 模型调优来实现软件/硬件协同优化，并尽可能实现最佳性能。我们根据对各种计算机视觉和自然语言处理基准的评估得出结论，这种优化方法优于现有的最先进方法，可在压缩率和性能之间实现完美的平衡。

（资料来源：CEVA）

Transformer 可服务于许多日常应用

CERN 论文还指出，使用这种原则性协同优化技术，可以在日常边缘设备中发挥最先进的性能，并满足其低延迟和低功耗等运行要求。很明显，沿着这些思路构建的 Transformer 模型可以提供与基于 CNN 的系统相媲美的性能，或者更适用于大型数据集。研究表明，这种系统也可能更不容易受失真和攻击影响，这要归功于它们使用的全局注意力机制。使用自我监督学习 (SSL) 的应用也非常有前景，例如预测图像的被遮挡部分可能有什么或用自然背景替换抢镜对象。

在音频领域，人们已经在更通用的声场分析方面开展积极研究，用于识别重要的声音和语音（例如将语音转换为文本）以及语音合成。基于 Transformer 的自然语言处理已经被广泛认可为是一项重大进步，并且在语音识别之后自然而然地发展起来。想象一下，在无需连接到云端的前期下，您能够在边缘设备中获取部分主体功能甚至是全部功能！

在未来十年不断寻求智能边缘应用的竞争优势的过程中，产品 OEM 需要兼顾性能调优选项的灵活性和基础计算平台的稳定性，而不是依赖于切换 NPU 核心架构或培训来跟上不断变化的市场需求。Transformer 模型与可扩展、可配置的 NPU 硬件的协同优化可确保这种灵活性和稳定性。这相当划算。

阅读全文，请先

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

处理器/DSP 人工智能

返回列表

上一篇： 不再浪费：无线物联网应对全球粮食浪费危机 下一篇： AI加速芯片新品助推，HBM3/3e将成明年HBM市场主流

iPad mini 6升级消息: 大全面屏、侧边指纹、USB-C接口、支持5G iPad mini 5发布未有新的产品替代升级，时隔3年，第六代iPad mini将要推出。近期有用户收到苹果中国的使用调查问卷提出目前iPad mini显示屏尺寸是否小？
华为P50系列方案有变、MatePad Pro 2发售时间或是7月华为P50，是一台值得期待的新手机吗？从产品本身的架构来看，P50确实没有前卫到让人叹为观止——别的不说，没有屏下摄像头一点，就足以说明大多数问题了。作为华为目前阶段更接近“绝唱”的旗舰机，如果想要在P50身上寻找彻底超越预期、不着边际的黑科技幻想，那么结果必然是令人失望的。
贾跃亭的法拉第未来:FF91将与消费者见面,未公布体验具体时间有段时间没有出现关于贾跃亭的新闻了，在“出走”美国后，风波总算是平息了下来。然而今天贾跃亭的PPT造车新进展消息：FF官方微博发布消息称，“FF 91，纽约见！
vivo展示概念手机，摄像头模块化设计斩获红点设计概念大奖今天vivo对外展示了一款概念手机，和谷歌Project Ara的模块化类似，这款概念手机将摄像头模块化处理，主机与摄像头分离。这一设计斩获了2020年红点设计概念大奖。
Surface Duo用户遭遇USB-C端口破裂，都是这个原因开售还没多久的微软 Surface Duo 双屏 Android 智能机，已经在机身做工和预装软件的体验上遭到了许多早期用户的吐槽。Reddit 网友 Algreimann 表示，其手上的 Surface Duo 设备，已经发生了 USB-C 端口周围塑料破裂的问题。
特斯拉电池剩余多少充电最佳,低电量无法充电原因是与国家电网不这么奇葩？特斯拉汽车在较低电量下国家电网是无法正常充电？特斯拉目前不会配合国家电网修改或者升级充电协议，而且没有这个操作吗？正常情况下电动汽车锂电池剩余多少电量充电最佳，锂电池、包括特斯拉在内，都是最好在电量接近20%时就要充电，对锂电池寿命有好处。
华为Mate40系列手机今晚发布，将有哪些亮点？Mate40是否值得买？北京时间10月22日20点，华为将召开Mate40系列全球发布会。目前，在包括华为官方、数码博主等大量爆料后，Mate 40系列新机逐渐揭开“神秘的面纱”。Mate40配置和设计有哪些亮点？
华为智能汽车具体使用三元锂电池哪种类型的能量密度型号？造车新势力根本上不具备成熟的电控技术，这方面各大汽车厂和零配件巨头都还在逐渐研发完善技术阶段，以三元锂电池为代表的有特斯拉，还有蔚来、小鹏等国内造车新势力。可见采用这
评测:酷睿i7对比苹果M1处理视频Handbrake转码速度谁更快? 全民短视频时代下更多用户追求的是性能与速度，苹果的M1推出被声称世界上顶级处理器，于是有有了和酷睿i7-1195G7视频处理性能测试结果对比，酷睿i7更适合主流用户对于视频、照片编辑处理工作
三星Galaxy S21系列欧版价格出炉,国行Ultra 512G顶配过万元值得看完参数配置，三星Galaxy S21系列你觉得怎样，近日欧洲版本价格也出来了，国行版Galaxy S21 Ultra 512GB顶配版本售价达到了1529欧元（约合人民币12200元）这个价格，大家还能接受吗？S21配合上多配色和骁龙888的性能、能效提升，三星新品还香吗？

2024过去了，细数中国工业经济这一年这一年的成绩单足够亮眼，但来之不易。
功得电子再获2025精品奖　以创新技术与永续承诺引领安全新标竿功得电子以“确保各类电子设备安全运行”为核心使命，服务领域涵盖电动车、AI与数据中心、医疗保健、电信、通讯及可再生能源等产业。
Vision Pro重塑VR/MR市场格局，应用领域从视听娱乐向多元生产力工 2024年VR与MR头戴装置出货量约为960万台，年增8.8%。全年出货情况反映出市场三个主要趋势：一是低价产品成主流；二是应用从娱乐扩展至多元生产力工具；三是OLEDoS成为高端近眼显示产品技术首选。未来几年这三大趋势将持续影响全球VR与MR产业生态发展......
因高世代面板产线建设推动，预计2027年OLED笔电渗透率将超过5% 尽管预估2025年的增速有限，但随着苹果计划在MacBook系列中导入OLED显示技术，预计将带动2026年底面板厂OLED高世代产线投入营运，从而推升2027年OLED笔电渗透率突破5%......
GB200机柜供应链仍需时间优化，预计出货高峰将延至2Q25至3Q25之间由于GB200 Rack在高速互通界面、热设计功耗（TDP）等设计规格皆明显高于市场主流，供应链业者需要更多时间持续调校、优化，预期最快将于2025年第二季后才有机会放量......
IDC 2023年中国协作机器人市场份额报告发布协作机器人是指能够与人类在共同工作空间进行互动和协同作业的机器人，从产品形态来看，由协作机器人本体（多关节机械手或多自由度的机器装置）及控制系统组成……
“一碰交互，共触未来”ITMA峰会盛大开启近场交互新生态目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。
中科院微电子所在忆阻神经-模糊硬件及应用探索方面取得新进展中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
汽车行业云基建向智算换代升级，汽车云市场稳定增长自动驾驶技术向端到端演进，车企对于高阶智能算力的需求快速提升，智能算力规模从百PFLOPS向千PFLOPS演进。
新蓝牙6.0协议扩展应用范围芯科科技蓝牙产品经理Parker Dorris通过本文讨论了蓝牙6.0（Bluetooth 6.0）版本中添加的最新功能。

热门评论
最新评论

换一换

Transformer 模型和 NPU IP 可针对边缘应用进行协同优化

市场潜力

让 Transformer 适应边缘的关键挑战

Transformer 可服务于许多日常应用

杂志声明