AI小芯片携手MCU拥抱低功耗SiP-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

新创公司Femtosense与韩国ABOV Semiconductor携手打造系统级封装，采用了Femtosense的低功耗AI加速器chiplet——稀疏处理单元(SPU)，以及ABOV的Arm Cortex-M0+微控制器chiplet…

硅谷 AI 芯片初创公司 Femtosense 与韩国微控制器制造商 ABOV Semiconductor 合作，打造了一款系统级封装产品，该产品采用 Femtosense 的低功耗 AI 加速器芯片组——稀疏处理单元 (SPU)，以及 ABOV 的 Arm Cortex-M0+ 微控制器芯片组。两家公司都将在音频应用中推广和销售这款新的 AI MCU，尤其是需要低成本、低功耗语音控制的消费电子产品和白色家电。

Femtosense 首席执行官 Sam Fok 向 EE Times 表示，Femtosense 与 ABOV 合作的部分原因是这家韩国公司与三星的联系。

Femtosense执行长Sam Fok

“如果你有三星家电，那么很有可能 ‘ABOV 的’ MCU 已经投入使用，用于控制洗衣机电机、微波炉显示屏或其他设备，”他说。“将他们在供应链和供应商名单中的优势与我们带来的差异化 AI 能力结合起来是明智之举。”

Fok 表示，基于嵌入式芯片的解决方案（实际上只是系统级封装 (SiP) 或多芯片模块 (MCM)）提供了与芯片为更大设计带来的一些相同的好处。

“这种方法的好处是，你可以非常轻松地重新混合这些产品，你可以将我们的 SPU 与 ‘ABOV]’产品组合中的不同微控制器相结合，”他说。“在这种情况下，我们将我们的 SPU 与非常低功耗、低成本的 MCU 配对，以创建最具成本效益的 AI MCU 之一。”

Fok 表示，这可能是两家公司合作的几种基于芯片的组合中的第一个，并补充说，除了灵活性之外，芯片方法还能提供更好的产品上市时间。

Femtosense与ABOV的AI微控制器是一款包含两个chiplet的SiP。(来源：Femtosense)

“除了灵活性之外，你并不是在进行 SoC 练习，而是在制作一个全新的芯片，”他说，“这是一个封装练习，甚至不是一个非常先进的封装练习，因此你可以随着市场的发展快速扭转这些产品。AI 市场仍在发展，人们希望在什么产品中拥有哪些功能，尤其是对于消费电子产品而言。”

“（多芯片模块）并不妨碍（未来）生产单个集成芯片，”他补充道，并指出，如果特定的 MCU/NPU 组合在经济和竞争力上看起来是正确的选择，那么该公司可以继续推进并制造 SoC。

Fok说，作为一家初创公司，保持敏捷性很有帮助。初创公司需要能够快速响应客户的反馈，而将公司产品中的不同芯片组合在一起可能只需几个月的时间。这两个芯片也位于不同的工艺节点上。他指出，嵌入式闪存不适用于一些更先进的节点，这些节点需要高晶体管数量或高 SRAM 数量芯片，例如 NPU。

“买家实际上并不关心——他们关心的是：它是否便宜，是否好用，是否具备能力。”

Femtosense 之前提供芯片和 IP，现在正在将小芯片添加到其产品组合中。据 Fok 称，坚持使用相同的底层架构有助于控制设计成本。虽然需要认证，但后续产品的速度会更快。

“市场存在既定的现状，你可以利用它，也可以尝试用自己的产品来打破现状，”他说。“许多终端客户都有完善的供应链，并且有非常严格的标准，这些标准在开始时可能对你不透明。这些因素有助于建立合作伙伴关系。”

还需要硅、IP 和小芯片等实际工程方面的原因，比如在空间极其受限的应用中，只能容纳一个芯片。

“你可以说我不会提供该应用，也可以说只要它不会蚕食我们其他产品的需求，我不会无缘无故地拒绝业务，” Fok说。“在这方面保持灵活性是件好事。”

权重和激活稀疏性

Femtosense 的 SPU 旨在利用权重和激活的稀疏性。该团队主要来自神经形态计算领域，致力于提高算法和硬件效率。

Fok 表示：“我们发现市场存在一个空白，没有人充分利用 ‘稀疏性’。市场上有一些产品在一定程度上利用了稀疏性 — 通常，问题是如何在使用脉动阵列的同时利用稀疏性，因此您将拥有大量结构，这可能会也可能不会让您充分利用这些优势。”

在设计 SPU 时，Femtosense 选择了尽可能小的块大小，以便用户充分利用尽可能多的稀疏性。这包括对数据相关激活稀疏性的硬件支持（如果激活为零，则不必费心在下一个神经元中计算答案）。

稀疏权重矩阵可以在内存中压缩以节省空间，然后 SPU 的自定义指令可以处理压缩信息而无需解压缩。SPU 支持将权重矩阵压缩高达 90%。

Femtosense 的稀疏化过程激励网络在训练期间考虑操作和连接的成本。

Fok 表示：“量化可能只会使用无限可能性中的 256 个值。稀疏性就像在空间或时间中进行 ‘量化’，分别具有权重和激活稀疏性。我拥有所有这些可以使用的神经元和连接，也许我在训练期间需要它们，但在推理期间我不需要它们全部，所以我将激励网络将尽可能多的值归零，仅使用其中的一部分，然后在硬件中仅调动资源来服务这些区域。”

和量化一样，稀疏化也可能过度，从而降低预测准确性。但 Fok 坚持认为，合理利用稀疏化可以真正提高效率。“这需要测试才能找到正确的平衡，就像量化一样，”他说。

Femtosense 希望利用权重和激活稀疏性将稀疏网络加速至 100 倍。这可能意味着在较小的硬件上运行较大的网络，或同时运行多个网络。（来源：Femtosense）

Fok 指出，如果权重稀疏性（修剪）可以实现 10 倍，激活稀疏性也可以实现 10 倍，那么这些值可以成倍增加，从而实现 100 倍的能效提升。他表示，在实践中，客户已经能够在 SPU 的 1 MB SRAM 中以可接受的质量运行需要大约 7 MB 内存的应用程序，在某些情况下甚至可以减少占用空间以同时运行多个模型。

SPU 专为音频和语音应用而设计（但支持所有时间序列传感器数据），具有三种精度模式 - INT16 激活、INT8 权重、INT8 激活和权重或 INT8 激活和 INT4 权重。Femtosense 的软件工具可以帮助进行量化以及模型优化、稀疏化、修剪和编译。

Fok 指出，SPU 还可以非常高效地运行密集矩阵，因为 SPU 的架构最大限度地减少了数据移动并最大限度地提高了并行性。

“这是人们已有工作负载的简单入口，”他说。“然后，如果他们想运行两个可能不适合的工作负载，或者添加更大的模型以获得更多功能，或者通过更少的错误激活获得更好的性能，诸如此类的事情，那么[稍后]他们就应该花精力进行额外的微调或将稀疏性纳入训练模型。我们希望在人们已有工作负载的情况下，轻松采用现有的东西，同时解锁更多功能。”

SPU 的原始计算效率为 500 GOPS/W（在 200 MHz 下，具有 INT4 权重、INT8 激活），但在最大稀疏度水平下可以实现有效 50 TOPS/W。SPU 芯片组有两个内核，每个内核都有四个独立的 16 路并行矢量处理 ALU 和 1 MB SRAM。

Femtosense/ABOV AI MCU 的工程样品现已上市，预计于 2024 年底实现商业量产。

(参考原文：Femtosense Combines AI Chiplet with MCU for Audio SiP，by Sally Ward-Foxton)

本文同步刊登于台湾版《电子工程专辑》杂志2024年10月刊

责编：Amy.wu

阅读全文，请先

您可能感兴趣

2025年中国PC显示器市场十大洞察

对于未来行业发展的增长趋势、行业特征和渠道特点等方面，IDC 总结并给出了2025年中国PC 显示器市场十大洞察……

中科院微电子所在SRAM存内计算领域取得新进展

该存内计算芯片采用全数字设计，能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效，团队提出了一种……

西门子获评IDC MarketScape制造执行系统领导厂商

西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商，该报告针对制造业的MES软件厂商进行了综合性评估。

Arm发布芯粒系统架构首个公开规范，加速芯片技术演进

Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范，进一步推动芯粒技术的标准化，并减少行业的碎片化。

超3.2GWh！多企又获储能订单

插播：汇聚南网科技、天合光能、新能安、华友能源、皇鼎储能、住友商社、永光新能源、厦门国贸，以及南瑞继保、智光储能、精控能源、钧能科技等业内20位重量级嘉宾，行家说储能·2025新型储能趋势与工商储应用

又一OLED材料厂商拟出售

1月23日，艾森股份发布公告称，公司正筹划以发行股份及支付现金的方式购买棓诺（苏州）新材料有限公司（以下简称“棓诺新材”）控股权并募集配套资金。该公司相关股票自2025年1月24日起停牌，预计停牌时间

北汽集团：今年陆续在所有车型上布局自动驾驶技术

据央视新闻报道，北京汽车集团有限公司党委书记、董事长张建勇 1 月 23 日介绍，2024 年中国新能源汽车产销量超过了 1000 万辆，连续 10 年保持了全球第一的位置。在自动驾驶方面，北汽集团今

谷歌拟2.5亿美元购买部分HTCXR业务

1月23日，HTC宣布与谷歌（Google LLC）签署协议，谷歌将斥资2.5亿美元与HTC达成一项重要交易，部分HTC的XR研发团队成员将加入谷歌。根据协议条款，谷歌将获得HTC非专属的XR知识产权

维信诺联合APSYSTEMS业内首创：固态激光退火技术驱动AMOLED量产新变革

近日，维信诺在显示技术领域取得重大突破，在业界率先采用固态激光退火（SLA）技术，成功实现非晶硅薄膜向多晶硅薄膜的转化，并实现量产品成功点亮，预计在今年2月底将实现SLA技术的大规模量产。这一创举标志

三星显示申请OLEDoS商标，准备量产

有猜测称，三星显示器将很快开始采用红、绿、蓝 (RGB) OLEDoS（硅基 OLED）方法商业化下一代显示器。据专利信息搜索服务Kipris 1月24日报道，三星显示器近期申请了一个名为Arcpix

消息称马斯克是英特尔的潜在买家

上周SemiAccurate 曾报道称，一家神秘公司正在探索全面收购英特尔的可能性。表示有 90% 的把握认为有关英特尔被收购的消息是“真实的”，已从另一位“地位很高的消息人士”处获得了证实。虽然没有

芯片巨头，豪发15个月年终奖！

去年有望创下历来最佳业绩的SK海力士，已决定向员工发放每月本薪1,500%的绩效奖金，相当于15个月的年终，创下自家有史以来最高的奖金水准，显示其高频宽存储器（HBM）业务正得益于人工智能（AI）热潮

立讯精密收购闻泰科技产品集成业务，智能手机ODM行业重组加速

要点原始设计制造商（ODM）/ 独立设计公司（IDH）产业格局受到地缘政治冲突的影响。闻泰科技已剥离受影响的业务，并专注于半导体业务。立讯精密收购了闻泰的ODM业务，改善了自身的业务布局。随着ODM

赛力斯扭亏为盈，造车新势力分化加剧

近日，赛力斯发布2024 年年度业绩预盈公告，预计 2024 年度实现营业收入1442亿元到1467亿元，同比增长302.32%到309.30%；归属于上市公司股东的净利润预计将达到55亿元至60亿元

文章评论

最新
热门

换一换

EE直播

更多>

AI小芯片携手MCU拥抱低功耗SiP

权重和激活稀疏性

杂志声明