电子工程专辑讯 时隔八年,IBM加利福尼亚研究员推出了一款新的类脑芯片NorthPole “北极”,这是IBM在2014年推出的TrueNorth“真北“的扩展版。
类脑芯片是指参考人脑神经元结构和人脑感知认知方式来设计的芯片,类脑计算是一种全新的基于神经系统的智能数据存储和运算方式,类似于大脑的方式存储多样化的数据,实时处理复杂问题的功能,不同于传统存储技术的单一存储功能,类脑计算不仅可以实现存储功能,还可以处理数据。
目前人工智能的研究还处于“弱人工智能“阶段,类脑芯片则相当于“强人工智能”范畴了。相关研究也就是从结构和功能上更靠近人脑的路径。
NorthPole相关研究论文发表于10月19日出版的《Scientific》杂志。
PCIe 卡上的NorthPole芯片(图片来源IBM网站)
在架构上,NorthPole模糊了计算和存储之间的界限,IBM研究院的Dharmendra Modha表示,“在单个内核级别,NorthPole 显示为接近计算的内存,而在芯片外部,在输入输出级别,它显示为活动内存。这使得 NorthPole 易于集成到系统中,并显著降低了主机上的负载。”
在性能上,NorthPole在ResNet-50图像识别和YOLOv4物体检测模型的测试中,展示了更高的能源效率、空间效率,和目前市场上任何其他芯片相比,延时更低,并且比TrueNorth快约4,000倍。以ResNet-50型号作为基准,跟目前市场上的12nm GPU和14nm CPU相比,NorthPole 的能源效率能提高 25 倍,在延迟以及计算所需的空间方面也表现出色。
NorthPole采用12nm工艺技术,在 800 平方毫米的面积内包含 220 亿个晶体管和256个内核,“这是一个芯片上的整个网络,”Modha说。
目前,现代计算机以冯·诺依曼架构为基础,其内存和处理单元都是相互独立,以总线为数据通道。NorthPole的最大区别之一就是设备的所有内存都是在芯片内部,不是单独连接。Modha表示,如果没有冯·诺依曼瓶颈,该芯片可能比市场上已有的其他芯片更快的处理AI推理。
冯·诺依曼架构的优点是善于处理串行逻辑和数学问题,但内存和处理器之间的数据传输会受到总线能力的限制。但北极芯片的劣势是,数据传输只能从芯片本身中的内存中调取,一旦芯片必须从另外的地方访问芯片,那该芯片上的所有加速将被削弱,所有优势“化简为零”。另外一种称为“横向扩展”的方法可以让NorthPole支持更大的神经网络,方法是将它们分解为适合 NorthPole 模型内存的较小子网,并将这些子网连接到多个 NorthPole 芯片上。
不过Modha指出,我们不能在此上(NorthPole 芯片)运行GPT-4,但我们可以满足企业所需的许多模型,NorthPole只是为了推理。
据悉,NorthPole的一个重要应用领域就是图像识别,通过运行由AI驱动的图像识别算法,该芯片可以快速准确地识别出图像的物体和特征,比如安全监控、智能交通、医疗诊断等。IBM 研究人员还表明,NorthPole可以经济地运行人工智能来进行语音识别和自然语言处理。这对推动AI技术的广泛应用具有重要意义,如医疗、自动驾驶、物联网等领域提供更快速和高效的解决方案。
目前最先进的工艺技术是2nm,Modha可能在未来几年除了基本的架构创新之外,NorthPole 还可以实施几代芯片处理技术,以不断提高效率和性能。
全球学者、企业等关于类脑计算的研究一直在持续,只能说还是处于研究阶段,具有较大的发展空间,也能推动AI的发展。自2014年IBM推出第二代TrueNorth;2017 年英特尔发布首款自主学习的神经拟态研究芯片,名为“Loihi”; 2019年Neuralink发布自研的N1脑部传感器芯片,2020年又发布了第二代设备LINK V0.9。中国企业以及学界也有深入研究类脑芯片,中科院、清华、北大,相继成立“脑科学与类脑智能研究中心”。 清华团队推出天机芯片,“天机芯”把人工通用智能的两个主要研究方向,即基于计算机科学和基于神经科学这两种方法,集成到一个平台,可以同时支持机器学习算法和现有类脑计算算法。
但类脑芯片仍然处于起步阶段,最早是在2009年初,美国国防部高级研究项目局开始投入SyNAPSE项目,该项目被IBM公司接手,目标是建立一个完整的类脑计算系统。IBM Almaden研究中心延用了传统的数字器件,也就是基于“神经突触核心“构建类脑芯片,并通过大量的实时应用来验证它的可行性。该研究还在2011年12月刊登在了《Scientific American》杂志。
后来IBM提出了全新的计算机架构——TrueNorth,设计了仿真模拟器Compass,在超级计算机上模拟突触核心网络运行,来验证该架构的可行性。在2014年的8月,《Scientific》杂志就刊登了IBM研发的系统级类脑芯片,该新型类脑芯片能在降低功耗的情况下,处理速度也得到大幅提升。
IBM的计算机架构TrueNorth是基于“神经突触核“网络的计算机芯片,其关键单元就是神经突触核心,突触是学习和记忆的关键,”突触“作为数据通路可以进行通信,且通信网络只是由事件驱动。TrueNorth架构拥有了处理器、内存和通信的基本架构,和人脑中的神经元和突触处理问题的方式一致,可以基于事件驱动并行完成运算、存储和通信。因此具有低功耗、并行性、通用性、广泛联系行、时空性和多模式性,可以完成大型复杂任务,能比传统计算机要高效。
在基于研究和发展上,从核心到架构再到模拟器,IBM在2014年发布了系统及的类脑芯片TrueNorth,据悉,当时TrueNorth采用三星28nm技术,5.4亿个晶体管仅占用4.3平方米的面积。当时TrueNorth在能耗、速度上均高于市面上的传统芯片。
但回到实际情况上,类脑芯片的突触电路在实现集成加工上是比较困难的,传统冯·诺依曼架构下的芯片以及存储方式更易实现。
本文参考:类脑计算新发展——“TrueNorth”神经元芯片、IBM官网