广告

拥有“神经元”的TrueNorth芯片将商用

2015-11-09 阅读:
IBM TrueNorth芯片以模拟人脑的神经元与突触为基础,希望让电脑也能拥有接近人脑的辨识能力。IBM目前正积极与移动设备业者接洽,试图将TrueNorth芯片技术推向商业应用……

OPTION_5:HP

IBM TrueNorth芯片以模拟人脑的神经元与突触为基础,希望让电脑也能拥有接近人脑的辨识能力。IBM的仿神经元芯片利用电力突触(spike)进行资料编码,因此较其他深度学习(deep learning)技术更为省电。IBM目前正积极与移动设备业者接洽,试图将TrueNorth芯片技术推向商业应用。

据MIT Technology Review报导,IBM利用美国国防部先进研究计划局(DARPA)资金研发的TrueNorth芯片,只有邮票般大小,并拥有100万个硅“神经元”,与2.56亿个连接神经元的突触,功耗比相同大小的传统处理技术少了1,000倍以上。

为什么要做TrueNorth?

因为自 2008 年以来,美国国防部研究机构 DARPA 给了 IBM 5300 万美元。TrueNorth 是 IBM 参与 DARPA 的研究项目 SyNapse 的最新成果。SyNapse 全称是 Systems of Neuromorphic Adaptive Plastic Scalable Electronics(自适应可塑可伸缩电子神经系统,而 SyNapse 正好是突触的意思),其终极目标是开发出打破冯·诺依曼体系的硬件。

为什么要打破冯·诺依曼体系?

冯·诺依曼体系是传统计算机的基础。这种体系的特点是存放信息和程序指令的内存与处理信息的处理器是分离的。由于处理器是按照线序执行指令的,所以必须不断与内存通过总线反复交换信息—而这个会成为拖慢速度和浪费能量的瓶颈。尽管后来采用了多核芯片和缓存技术,但是这些只能提高速度而不能降低太多能耗,而且没办法实时处理,因为通信是瓶颈—内存和 CPU 的大量通信要通过总线进行。因此,近几十年来研究人员一直在致力于寻找突破原有体系的技术。

人类大脑的神经元《电子工程专辑》

模仿大脑

模仿人类大脑是科学家寻求突破的方向。人类大脑的神经元尽管传导信号的速度很慢,但是却拥有庞大的数量(千亿级),而且每个神经元都通过成千上万个突触与其他神经元相连,形成超级庞大的神经元回路,以分布式和并发式的方式传导信号,相当于超大规模的并行计算,从而弥补了单神经元处理速度的不足。人脑的另一个特点是部分神经元不使用时可以关闭,从而整体能耗很低。

在了解了人脑的这种机理之后,研究人员开始了在软硬件上对人脑的模拟。在硬件方面,近年来主要是通过对大型神经网络进行仿真,如 Google 的深度学习系统Google Brain,微软的Adam等。但是这些网络需要大量传统计算机的集群。比方说 Google Brain 就采用了 1000 台各带 16 核处理器的计算机,这种架构尽管展现出了相当的能力,但是能耗依然巨大。

而 IBM 则是在芯片上的模仿。

拥有“神经元”的TrueNorth芯片将商用《电子工程专辑》

集成度和能效令人印象深刻

这种芯片把数字处理器当作神经元,把内存作为突触,跟传统冯诺依曼结构不一样,它的内存、CPU 和通信部件是完全集成在一起。因此信息的处理完全在本地进行,而且由于本地处理的数据量并不大,传统计算机内存与 CPU 之间的瓶颈不复存在了。同时神经元之间可以方便快捷地相互沟通,只要接收到其他神经元发过来的脉冲(动作电位),这些神经元就会同时做动作。

2011 年的时候,IBM 首先推出了单核含 256 个神经元,256×256 个突触和 256 个轴突的芯片原型。当时的原型已经可以处理像玩 Pong 游戏这样复杂的任务。不过相对来说还是比较简单,从规模上来说,这样的单核脑容量仅相当于虫脑的水平。

不过,经过 3 年的努力,IBM 终于在复杂性和使用性方面取得了突破。4096 个内核,100 万个“神经元”、2.56 亿个“突触”集成在直径只有几厘米的方寸(是 2011 年原型大小的 1/16)之间,而且能耗只有不到 70 毫瓦,IBM 的集成的确令人印象深刻。

本文下一页:TrueNorth芯片结构、功能、物理形态

{pagination}

IBM的TrueNorth芯片结构、功能、物理形态

这样的芯片能够做什么事情呢?IBM 研究小组曾经利用做过 DARPA 的NeoVision2 Tower数据集做过演示。它能够实时识别出用 30 帧每秒的正常速度拍摄自斯坦福大学胡佛塔的十字路口视频中的人、自行车、公交车、卡车等,准确率达到了 80%。相比之下,一台笔记本编程完成同样的任务用时要慢 100 倍,能耗却是 IBM 芯片的 1 万倍。

跟传统计算机用 FLOPS(每秒浮点运算次数)衡量计算能力一样,IBM 使用 SOP(每秒突触运算数)来衡量这种计算机的能力和能效。其完成 460 亿 SOP 所需的能耗仅为 1 瓦—正如文章开头所述,这样的能力一台超级计算机,但是一块小小的助听器电池即可驱动。

通信效率极高,从而大大降低能耗这是这款芯片最大的卖点。TrueNorth 的每一内核均有 256 个神经元,每一个神经有分别都跟内外部的 256 个神经元连接。

但是相比之下,人脑有上千亿个神经元,每个神经元又有成千上万的突触,那样一个神经网络就更加无法想象了。IBM 的最终目标就是希望建立一台包含 100 亿个神经元和 100 万亿个突触的计算机—这样的计算机要比人类大脑的功都强大 10 倍,而功耗只有一千瓦,而且重量不到两升(我们大脑的大小)。

拥有“神经元”的TrueNorth芯片将商用《电子工程专辑》

有了TrueNorth芯片技术,移动设备在不需透过云端运算的情况下,也能用极低的电力运行影像或语音辨识等高阶机器智能软件。IBM资深副总裁John Kelly表示,该公司已与电脑系统领导厂商展开接洽,针对TrueNorth芯片在移动市场与物联网市场发展的各种可能性进行讨论。

TrueNorth芯片架构不同于既有的运算芯片,需要全新的软体编写方式。此外,TrueNorth芯片利用电力开关,模拟生物神经元的突触信号进行资料编码,因此和Google、Facebook、微软(Microsoft)等厂商利用软体研发的深度学习神经网路也有所不同。

IBM集成16块TrueNorth芯片的电路板《电子工程专辑》
IBM集成16块TrueNorth芯片的电路板

仿突触神经元芯片目前还未展露出能与深度学习匹敌的影像语音辨识能力,在Facebook研发深度学习的Yann LeCun对IBM神经网路技术实用性感到质疑。负责IBM仿神经芯片技术研发的Dharmendra Modha则认为,若要提升神经网路在芯片上的功率效率,突触将是关键。

Modha的团队已着手尝试将训练完成的深度学习神经网路移植到TrueNorth芯片上。Modha表示,TrueNorth芯片将作为一个基板,各种不同的神经网路都可绘制在TrueNorth芯片上,支援即时、超低功耗、超低容量的应用。

据加拿大蒙特利尔大学(University of Montreal)的研究结果显示,要将深度学习的仿神经元网路移植到使用突触的仿神经元硬体上,比一般预期中更为容易,而影像处理的准确度也不会受到影响。

就在IBM寻找整合二种技术的最佳方法时,Google与高通(Qualcomm)都已开始尝试将人工神经网路与深度学习技术,应用在移动设备与车辆上。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
相关推荐
    广告
    近期热点
    广告
    广告
    可能感兴趣的话题
    广告
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了