新创公司Femtosense与韩国ABOV Semiconductor携手打造系统级封装,采用了Femtosense的低功耗AI加速器chiplet——稀疏处理单元(SPU),以及ABOV的Arm Cortex-M0+微控制器chiplet…

硅谷 AI 芯片初创公司 Femtosense 与韩国微控制器制造商 ABOV Semiconductor 合作,打造了一款系统级封装产品,该产品采用 Femtosense 的低功耗 AI 加速器芯片组——稀疏处理单元 (SPU),以及 ABOV 的 Arm Cortex-M0+ 微控制器芯片组。两家公司都将在音频应用中推广和销售这款新的 AI MCU,尤其是需要低成本、低功耗语音控制的消费电子产品和白色家电。

Femtosense 首席执行官 Sam Fok 向 EE Times 表示,Femtosense 与 ABOV 合作的部分原因是这家韩国公司与三星的联系。

Femtosense执行长Sam Fok

“如果你有三星家电,那么很有可能 ‘ABOV 的’ MCU 已经投入使用,用于控制洗衣机电机、微波炉显示屏或其他设备,”他说。“将他们在供应链和供应商名单中的优势与我们带来的差异化 AI 能力结合起来是明智之举。”

Fok 表示,基于嵌入式芯片的解决方案(实际上只是系统级封装 (SiP) 或多芯片模块 (MCM))提供了与芯片为更大设计带来的一些相同的好处。

“这种方法的好处是,你可以非常轻松地重新混合这些产品,你可以将我们的 SPU 与 ‘ABOV]’产品组合中的不同微控制器相结合,”他说。“在这种情况下,我们将我们的 SPU 与非常低功耗、低成本的 MCU 配对,以创建最具成本效益的 AI MCU 之一。”

Fok 表示,这可能是两家公司合作的几种基于芯片的组合中的第一个,并补充说,除了灵活性之外,芯片方法还能提供更好的产品上市时间。

Femtosense与ABOV的AI微控制器是一款包含两个chipletSiP。(来源:Femtosense)

“除了灵活性之外,你并不是在进行 SoC 练习,而是在制作一个全新的芯片,”他说,“这是一个封装练习,甚至不是一个非常先进的封装练习,因此你可以随着市场的发展快速扭转这些产品。AI 市场仍在发展,人们希望在什么产品中拥有哪些功能,尤其是对于消费电子产品而言。”

“(多芯片模块)并不妨碍(未来)生产单个集成芯片,”他补充道,并指出,如果特定的 MCU/NPU 组合在经济和竞争力上看起来是正确的选择,那么该公司可以继续推进并制造 SoC。

Fok说,作为一家初创公司,保持敏捷性很有帮助。初创公司需要能够快速响应客户的反馈,而将公司产品中的不同芯片组合在一起可能只需几个月的时间。这两个芯片也位于不同的工艺节点上。他 指出,嵌入式闪存不适用于一些更先进的节点,这些节点需要高晶体管数量或高 SRAM 数量芯片,例如 NPU。

 “买家实际上并不关心——他们关心的是:它是否便宜,是否好用,是否具备能力。”

Femtosense 之前提供芯片和 IP,现在正在将小芯片添加到其产品组合中。据 Fok 称,坚持使用相同的底层架构有助于控制设计成本。虽然需要认证,但后续产品的速度会更快。

“市场存在既定的现状,你可以利用它,也可以尝试用自己的产品来打破现状,”他说。“许多终端客户都有完善的供应链,并且有非常严格的标准,这些标准在开始时可能对你不透明。这些因素有助于建立合作伙伴关系。”

还需要硅、IP 和小芯片等实际工程方面的原因,比如在空间极其受限的应用中,只能容纳一个芯片。

“你可以说我不会提供该应用,也可以说只要它不会蚕食我们其他产品的需求,我不会无缘无故地拒绝业务,” Fok说。“在这方面保持灵活性是件好事。”

权重和激活稀疏性

Femtosense 的 SPU 旨在利用权重和激活的稀疏性。该团队主要来自神经形态计算领域,致力于提高算法和硬件效率。

Fok 表示:“我们发现市场存在一个空白,没有人充分利用 ‘稀疏性’。市场上有一些产品在一定程度上利用了稀疏性 — 通常,问题是如何在使用脉动阵列的同时利用稀疏性,因此您将拥有大量结构,这可能会也可能不会让您充分利用这些优势。”

在设计 SPU 时,Femtosense 选择了尽可能小的块大小,以便用户充分利用尽可能多的稀疏性。这包括对数据相关激活稀疏性的硬件支持(如果激活为零,则不必费心在下一个神经元中计算答案)。

稀疏权重矩阵可以在内存中压缩以节省空间,然后 SPU 的自定义指令可以处理压缩信息而无需解压缩。SPU 支持将权重矩阵压缩高达 90%。

Femtosense 的稀疏化过程激励网络在训练期间考虑操作和连接的成本。

Fok 表示:“量化可能只会使用无限可能性中的 256 个值。稀疏性就像在空间或时间中进行 ‘量化’,分别具有权重和激活稀疏性。我拥有所有这些可以使用的神经元和连接,也许我在训练期间需要它们,但在推理期间我不需要它们全部,所以我将激励网络将尽可能多的值归零,仅使用其中的一部分,然后在硬件中仅调动资源来服务这些区域。”

和量化一样,稀疏化也可能过度,从而降低预测准确性。但 Fok 坚持认为,合理利用稀疏化可以真正提高效率。“这需要测试才能找到正确的平衡,就像量化一样,”他说。

Femtosense 希望利用权重和激活稀疏性将稀疏网络加速至 100 倍。这可能意味着在较小的硬件上运行较大的网络,或同时运行多个网络。(来源:Femtosense)

Fok 指出,如果权重稀疏性(修剪)可以实现 10 倍,激活稀疏性也可以实现 10 倍,那么这些值可以成倍增加,从而实现 100 倍的能效提升。他表示,在实践中,客户已经能够在 SPU 的 1 MB SRAM 中以可接受的质量运行需要大约 7 MB 内存的应用程序,在某些情况下甚至可以减少占用空间以同时运行多个模型。

SPU 专为音频和语音应用而设计(但支持所有时间序列传感器数据),具有三种精度模式 - INT16 激活、INT8 权重、INT8 激活和权重或 INT8 激活和 INT4 权重。Femtosense 的软件工具可以帮助进行量化以及模型优化、稀疏化、修剪和编译。

Fok 指出,SPU 还可以非常高效地运行密集矩阵,因为 SPU 的架构最大限度地减少了数据移动并最大限度地提高了并行性。

“这是人们已有工作负载的简单入口,”他说。“然后,如果他们想运行两个可能不适合的工作负载,或者添加更大的模型以获得更多功能,或者通过更少的错误激活获得更好的性能,诸如此类的事情,那么[稍后]他们就应该花精力进行额外的微调或将稀疏性纳入训练模型。我们希望在人们已有工作负载的情况下,轻松采用现有的东西,同时解锁更多功能。”

SPU 的原始计算效率为 500 GOPS/W(在 200 MHz 下,具有 INT4 权重、INT8 激活),但在最大稀疏度水平下可以实现有效 50 TOPS/W。SPU 芯片组有两个内核,每个内核都有四个独立的 16 路并行矢量处理 ALU 和 1 MB SRAM。

Femtosense/ABOV AI MCU 的工程样品​​现已上市,预计于 2024 年底实现商业量产。

(参考原文:Femtosense Combines AI Chiplet with MCU for Audio SiP,by Sally Ward-Foxton)

本文同步刊登于台湾版《电子工程专辑》杂志2024年10月

责编:Amy.wu
阅读全文,请先
您可能感兴趣
自托管加密钱包是一种数字工具,它让用户可以完全掌控加密货币的私钥,特别是像比特币这样的数字资产。对于初次接触加密货币的用户来说,了解如何购买比特币是使用自托管钱包的第一步......
12月11-12日,“上海集成电路2024年度产业发展论坛暨第三十届集成电路设计业展览会”(ICCAD-Expo 2024)将在上海世博展览馆隆重举行。
NS800RT系列实时控制MCU凭借更加高效、功能更强大的实时控制能力和丰富的外设,使工程师能够在光伏/储能逆变器、不间断电源、工业自动化、协作机器人、新能源汽车大/小三电、空调压缩机等系统中,实现皮秒级别的PWM控制,从而显著提升系统运行精度和效率。
“仲恺发布”消息显示,11月19日,“小米&聚飞联合实验室”启动仪式在惠州仲恺高新区举行。作为惠州首个与小米合作成立的联合实验室,未来该实验室将以Mini背光技术创新为主要方向,进一步强化双方在显示终
芯片超人现有1600平米芯片智能仓储基地,现货库存型号1000+,品牌高达100种,5000万颗现货库存芯片,总重量10吨,库存价值高达1亿+。同时,芯片超人在深圳设有独立实验室,每颗物料均安排QC质
★欢迎星标 果壳硬科技★“撒尿!撒尿!”旁边的两个小孩不断调整口音,力求最标准地喊出“撒尿”两个字。终于,桌上的机器狗缓缓抬起一只后腿,做出了狗狗撒尿的动作。与机器狗同出一家的桌面机器猫,同样能执行“
文|Grace2024年最火的细分市场,非方盒子莫属。今年前10个月,越野类SUV销量同比增长了100%,且还在持续加速。方盒子市场从蓝变红的过程中,既有越野老炮儿推陈出新,也有新玩家另辟蹊径入局,如
我是芯片超人花姐,入行20年,有40W+芯片行业粉丝。有很多不方便公开发公众号的,关于芯片买卖、关于资源链接等,我会分享在朋友圈。扫码加我本人微信👇近期电子人关注的焦点——德国慕尼黑电子展,在前两天结
对于点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,本月初,小鹏P7+正式上市,包含限定版在内一共有三款车型,售价区间为17.88-21.88万元,超高的性价比让鹏P7+成为小鹏汽车的又一
11月18日,福建兆元光电有限公司(以下简称“兆元光电”)与厦门大学福建省半导体光电科技经济融合服务平台签署战略合作协议,双方将就Mini/Micro LED新型显示关键技术研发进行深入合作,推动Mi
  近日,合景智慧建设(广东)有限公司再传捷报,中标怡合达自动化股份有限公司(股票代码301029)装修工程项目,专业、品质、服务带来了五六年的持续合作,感谢怡合达管理层的信任与支
三星电子劳资双方经过长时间谈判达成的临时工资谈判协议在工会投票中被否决。三星电子全国工会于今日(21日)将劳资协商方案提交工会成员投票,结果确认以41.36%赞成、58.64%反对的结果被否决。这一临
面板价格观察--11月下旬版昨日(11月20日),TrendForce集邦咨询公布了11月下旬面板报价,TrendForce集邦咨询表示:2024年11月下旬,电视、笔记本面板价格保持稳定;显示器面板