AlphaGo击败围棋世界冠军李世石后,超级计算机便宣告攻克了围棋这一穷举法不可能征服的领域,人工智能(AI)再次成为科技界最热门的话题之一。对于不少该领域的科学家而言,人工智能的终极目标之一就是用机器实现人脑的全部功能,而作为人脑的最小细胞单位——神经元,可能会是一个最好的入手点。
8月3日,据外媒报道,IBM苏黎世研究中心宣布,他们制造出世界上首个人造纳米尺度随机相变神经元,可用于制造高密度、低功耗的认知学习芯片,实现高速无监督学习。
IBM这项发明在人工智能研究领域意义非凡。首先,这种相变神经元是由目前完全已知的材料组成。此外,由于其尺寸最小能到纳米量级,因而信号传输速度极快,同时功耗较低,这就使得随机(stochasticity)相变神经元具有生物神经元的特性,随机性意味着在相同的输入信号下,多个相变神经元的输出会有所不同。这意味着人工神经元可以在低功率情况下用来检测模式(pattern)以及发现大数据中的互相关联情况。
人造神经元论文的第一作者:托马斯•图玛(Tomas Tuma)
目前,IBM已经构建了由500个该神经元组成的阵列,并让该阵列以模拟人类大脑的工作方式进行信号处理。
生物学上,神经元又称神经细胞,是构成神经系统结构和功能的基本单位。每个神经元可以有一或多个树突,可以接受刺激并将兴奋传入细胞体。每个神经元只有一个轴突,可以把兴奋从胞体传送到另一个神经元或其他组织,如肌肉或腺体。正式这样的构造给了科学家灵感,他们从中启发,利用相变材料作为记忆储存来模拟生物大脑存储和处理数据的功能。
据介绍,IBM相变神经元的整个架构包括输入端(类似生物神经元的树突)、神经薄膜(类似生物神经元的双分子层)、信号发生器(类似生物神经元的神经细胞主体)和输出端(类似生物神经元的轴突)。信号发生器和输入端之间还有反馈回路以增强某些类型的输入信号。
而神经薄膜是整个神经元产生作用的关键物质,它类似生物神经细胞中的液态薄膜,,它的物理机理类似于电阻和电容:它阻止电流直接通过,但同时又在吸收能量。当能量吸收到一定程度,它就向外发射自己产生的信号。这信号沿着轴突传导,被其他神经元接收。然后再重复这一过程。
人造神经元研发团队,图片来源:IBM
在IBM制造的神经元中,液态薄膜被一小片神经薄膜取代。神经薄膜是由锗锑碲复合材料(也称GST材料)制成的,该材料也是可重写蓝光光盘的主要功能材料。锗锑碲复合材料是一种相变材料,即它可以以两种状态存在:晶体态和无定形态。通过激光或电流提供能量,两种状态之间可以互相转变。在不同状态下,相变材料的物理特性截然不同:锗锑碲复合材料在无定形态下不导电,而在晶体态下导电。
在人工神经元中,锗锑碲薄膜起初是无定形态的。随着信号的到达,薄膜逐渐变成结晶态,即逐渐变得导电。最终,电流通过薄膜,制造一个信号,并通过该神经元的输出端发射出去。在一定的时间后,锗锑碲薄膜恢复为无定形态。这个过程周而复始。
生物神经元与人造神经元对比图,图片来源:IBM
由于生物体内各种噪声的存在,生物神经元是随机的(Stochastic)。IBM研究人员表示,人工神经元同样表现出了随机特性,因为神经元的薄膜在每次复位后,其状态有轻微的不同,因此随后的晶态化过程略有不同。因此,科学家无法确切地知道每次人工神经元会发射什么信号。
首先,人工神经元采用了成熟的材料,历经几十亿次工作而不损坏(寿命长),体积极小(有报道说是90纳米,但从下图中看应该在300纳米左右,而论文中表示未来有望达到14纳米)。因此,这是一种性能非常棒的器件。
人工神经元网络。图中的银色方块是放大后的相变神经元,该神经元网络还没有配备工业标准的输入输出接口。图片来源:IBM
其次,人工神经元跟生物神经元的工作方式非常类似。当大批人工神经元组成并行计算机后,它也许可以和人类一样进行决策和处理感官信息。IBM表示,他们的人工神经元技术和目前发展中的另外一种人工神经元器件——忆阻器互为补充。
目前,IBM制造了10乘10的神经元阵列,将5个小阵列组合成一个500神经元的大阵列,该阵列可以用类似人类大脑的工作方式进行信号处理。事实上,人工神经元已经表现出和人类神经元一样的“集体编码”特性。此外,它的信号处理能力已经超过了奈奎斯特-香农采样定理规定的极限。科学家表示:“这一突破标志着人类在认知计算应用中超密度集成神经形态技术,以及高效节能技术上的发展又向前迈进重要的一步。”
集体编码的意义在于,每个神经元有2种状态,可以表示1比特信息,那么N个神经元就可以表示2N比特信息。神经元数量足够多时,能表示的信息量将极其惊人。
IBM研究人员计划构建包含几千个相变神经元的单一芯片,并编写能充分利用相变神经元芯片随机特性的软件。
IBM 苏黎世研究院在Nature Nanotechnology上发表了题为“随机相变神经元(Stochastic phase-change neurons)”的相关论文。论文链接
论文的共同作者——Manuel Le Gallo(IBM 苏黎世研究院研究学者、ETH Zurich在读PHD)在最近接受的采访中提到“我们的方法是非常有效率的,特别是在处理大量数据的时候。”雷锋网翻译了具体的采访内容:
(原文链接:http://www.leiphone.com/news/201608/ftksmSoqwgvBCdN5.html)
Q:人工神经元到底是如何工作的呢?
Manuel Le Gallo:神经元有一个特别的功能,我们称之为“整合和发射”。神经元就像一个蓄电池一样——如果你不断向神经元发送多重输入信息,这个神经元将会整合所有的输入信息。根据输入信息的总量和强度,膜电位将达到一定的阈值,然后神经元就会进行“发射”或者“脉冲放电”动作。这样的一个蓄电池可以用来执行令人惊讶的复杂计算任务。
Q:人类大脑的运行方式是如何启发人工神经元的发展呢?
Manuel Le Gallo:人工神经元是模仿真正的生物神经元建立的。人工神经元没有神经元那样完全相同的功能,但是可以通过使用这些神经元实现接近真正大脑一般的运算结果。通常人工神经元是基于CMOS的电路进行搭建,这也是我们所使用的电脑中的标准晶体管技术。我们研究中主要使用非CMOS设备(如相变装置),在降低功耗和提高区域密度的情况下实现了同样的功能。
Q:你对这项工作有什么贡献?
Manuel Le Gallo:在我过去的三年的表征和模型工作中,我们团队由此对相变设备的物理特征有了相当的了解。这对于在相变设备上设计神经元并理解它们的功能是至关重要的。另外,我还负责文章中部分实验数据的工作,并对结果的分析以及解释做出了贡献。
Q:人工神经元能够被应用在哪种情况下?
Manuel Le Gallo:在我们的文章中,我们演示了其如何在多重事件流中检测其互相关系。
Q:事件指代的是?
Manuel Le Gallo:事件可以是Twitter数据、天气数据或者互联网上收集到的传感数据等。
Q:是什么使得神经形态计算比传统计算更有效率呢?
Manuel Le Gallo:在传统计算中有一个单独的内存和逻辑单元,每当要执行计算时必须先访问内存、获取数据,然后将数据传输到逻辑单元,再返回计算。当得到一个结果时,必须把它返回到内存当中,且这个过程不断地来回进行。因此如果你正在处理庞大数据的话,这将成为相当麻烦的问题。
而在神经网络中,计算和存储是同地协作的。你不需要建立逻辑区与内存区之间的传输渠道,只需要在不同的神经元之间建立适当的连接,我们认为这是我们的方法(特别是用于处理大量的数据)将会更有效的主要原因。
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。