我们使用的传感和计算设备无处不在,而且会不断增多,设备始终处于工作状态,因此功率变得越来越重要。最好的例子就是放在办公桌上、口袋里以及散布家中各处的声控设备。关键词捕捉是目前各种神经拟态技术的一个目标。
硅耳蜗
2020年,神经拟态工程学Misha Mahowald奖的获得者是Shih-Chii Liu教授及其团队,他们一直致力于研究低延迟、低功率传感器,用于语音检测。苏黎世神经科学研究所(INI)的Shi-Chii Liu及其团队开发的动态音频传感器拓展了这一市场(图1)。传感器的核心是一个生物仿真硅耳蜗。首先,它利用一组模拟带通滤波器将输入的声音滤入到各个频道,并在输出侧对其进行半波整流。这组电路仿真耳朵中毛细胞的功能。
图1:A.在常见的音频系统中,声音首先通过模数转换器转换成数字信号,然后使用数字快速傅立叶变换(FFT)和带通滤波(BPF)提取信号特征。这些信号由数字信号处理器(DSP)运行语音端点检测(VAD)或自动语音识别算法进行处理。B.在苏黎世INI的动态音频传感器中,接收信号为模拟音频频带,其特征和变化被并行编码成一系列的异步尖峰信号(事件),随后进行处理。
这一过程类似于生物学中让不同通道为大脑的处理做好准备。在人耳中,神经节细胞将信号快速编码为一串化学离子;在硅耳蜗中,则被转换成电尖峰信号。这一步可以通过使用常用的IF神经元模型或异步增量调制器(ADM)来完成:ADM将信号与两个阈值进行比较,并在信号超过阈值时发送事件——相当于信号特征提取器。因为忽略了不变的信号,从而减少了传递到下一级的冗余信息。
从功率的角度来看,在没有任何活动时,硅耳蜗几乎不会消耗任何电量,随着活动的增加,尖峰信号的数量也随之增加。对于一直在听却很少进行处理的应用而言,这是一个巨大的优势;而当应用一直需要对相关内容进行解码时,则没有明显的功耗优势。
由于这种音频传感器的功耗只有几微瓦,系统设计人员在设计中可以将其作为一个很有用的选择,以便提高电源效率。此外,该音频传感器是在连续时间内工作,尖峰之间的距离可近可远,因此它也支持非常高的动态范围。
语音识别
这项工作的关键是证明硅耳蜗的有用性,具体而言,就是由硅耳蜗产生的事件串流可以用于语音端点检测(关键词识别的第一阶段)等实际应用中。Liu和她的团队成功地做到了,他们使用事件输出来创建2D数据帧,尖峰信号到达的直方图在5ms的帧上按频率排列。这即是类耳蜗图,可以由神经网络读入并解码其含义。
“IEEE ISSCC社群对在传感器上使用深度网络非常感兴趣,音频边缘计算正在兴起,深度网络出现得非常及时。”Liu说,“现在已经有很多利用低功耗专用集成电路(ASIC)进行关键词识别的论文,但这些论文都采用类似频谱图的常规功能。我们的一个目标是要证明混合方案(混合模拟信号设计)可以提供更低的功率,减少响应延迟。”
去年INI发布了一段视频,展示了数字识别系统。该系统现在仍处于开发初期,还不是绝对可靠。Liu的团队成员还有Minhao Yang、Chang Gao、Enea Ceolini、Adrian Huber、Jithendar Anumula、Ilya Kiselev和Daniel Neil,多年来他们还研究了传感器融合,将音频和视频信息结合起来,以进行更可靠的分类。他们一直遵循初期的设计准则来决定什么时候应该选择模拟传感器,什么时候应使用数字传感器。
图2:Misha Mahowald是地址事件表示法(AER)的发明者之一,“神经拟态工程奖”就是以她的名字命名的。
他们的另一个目标是提高数据采集系统(DAS)的电源效率和性能,包括利用源极跟随器实现带通滤波器,以及设计模拟特征提取器。
减少模拟电子器件易变性的影响是另一个重要的研究领域。为了解决这个问题,Liu及其团队设计了一个硬件仿真器。他们表示,与Cadence Virtuoso这样的商用软件相比,该仿真器可以更快地测试这些问题。使用软件而非硬件来训练二进制神经网络进行分类,能够准确预测多种测试芯片的分类性能。Liu及其团队正在考虑在系统中增加噪音来测试其易变性,使设计过程更加稳健。
Mahowald奖
Liu是神经拟态工程学的早期研究者之一,她在加州理工Carver Mead的实验室工作过,是苏黎世神经信息学研究所的创始人之一,当时研究组许多人员离开加州前往苏黎世。Mahowald(图2)也曾在该实验室工作。
在获得该奖项时,Liu说:“我们很荣幸能够获得这个奖项,特别是与这么多神经拟态工程学的优秀研究人员一起。这项工作建立在数十年早期硅耳蜗设计的基础上,是Dick Lyon、Carver Mead、Lloyd Watts、Rahul Sarpeshkar、Eric Vittoz和Andre van Schaik的工作的延续。
谈到神经拟态工程学的重要性,她说:“即便摩尔定律走到尽头,数字计算的能效仍比生物学的落后,只有其千分之一。因此,DAS这类混合模拟电子系统能达到什么样的效率比以往任何时候都更加重要。”
编译:Jenny Liao, EDN China
本文授权编译自EETimes,本文为《电子技术设计》2021年4月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里。
原文参考链接:Allowing Machines to Listen, and Understand