一种新型的神经网络更具可解释性

点击蓝字 关注我们

SUBSCRIBE to US


ISTOCK


人工神经网络(https://spectrum.ieee.org/what-is-deep-learning)——受生物大脑启发的算法——是现代人工智能的核心,在聊天机器人和图像生成器之后。但是,由于它们有很多神经元,它们可能是黑匣子(https://www.nature.com/articles/d41586-024-01314-y),用户无法解释它们的内部运作。


研究人员现在创造了一种全新的方法来制造神经网络,在某些方面超越了传统系统。支持者说,这些新网络更容易解释,也更准确,即使它们更小。他们的开发人员表示,学习简洁地表示物理数据的方式可以帮助科学家发现新的自然规律。


“It’s great to see that there is a new architecture on the table.”

—Brice Ménard, Johns Hopkins University


约翰斯·霍普金斯大学的物理学家Brice Ménard表示,在过去的十年或更长时间里,工程师们大多通过反复试验来调整神经网络设计。他研究神经网络是如何运作的,但没有参与这项于4月发布在arXiv上的新工作(https://arxiv.org/abs/2404.19756)。“很高兴看到一种新的架构出现了,”他说,尤其是一种根据第一性原理设计的架构。


思考神经网络的一种方式是类比神经元或节点、突触或这些节点之间的连接。在传统的神经网络中,称为多层感知器(MLP),每个突触学习一个权重——一个决定这两个神经元之间连接强度的数字。神经元分层排列,使得来自一层的神经元从前一层神经元获取输入信号,并根据其突触连接的强度进行加权。然后,每个神经元对其输入的总和应用一个简单的函数,称为激活函数。


在新的架构中,突触扮演着更复杂的角色。他们不是简单地学习两个神经元之间的连接有多强,而是学习这种连接的全部性质——将输入映射到输出的函数。与传统架构中神经元使用的激活函数不同,这个函数可能更复杂——实际上是一个“样条”或几个函数的组合——并且在每个实例中都是不同的。另一方面,神经元变得更简单——它们只是将所有先前突触的输出相加。新的网络被称为Kolmogorov-Arnold网络(KANs),以两位研究函数如何组合的数学家的名字命名。其想法是,KAN在学习表示数据时将提供更大的灵活性,同时使用更少的学习参数。


“It’s like an alien life that looks at things from a different perspective but is also kind of understandable to humans.”

—Ziming Liu, Massachusetts Institute of Technology


研究人员在相对简单的科学任务上测试了他们的KAN。在一些实验中,他们采用了简单的物理定律,例如两个相对论速度物体相互通过的速度。他们使用这些方程来生成输入输出数据点,然后,对于每个物理函数,在一些数据上训练一个网络,并在其余数据上进行测试。他们发现,增加KAN的大小比增加MLP的大小更快地提高了它们的性能。在求解偏微分方程时,KAN的精度是MLP的100倍,MLP的参数是KAN的100倍。


在另一个实验中,他们训练网络根据节点的其他属性预测拓扑节点的一个属性,称为它们的签名。MLP使用约300000个参数实现了78%的测试准确率,而KAN仅使用约200个参数就实现了81.6%的测试准确度。


更重要的是,研究人员可以直观地绘制出KAN,并查看激活函数的形状以及每个连接的重要性。无论是手动还是自动,它们都可以削减弱连接,并用更简单的激活函数(如正弦或指数函数)替换一些激活函数。然后,他们可以将整个KAN总结为一个直观的单行函数(包括所有组件激活函数),在某些情况下可以完美地重建创建数据集的物理函数。

 

“未来,我们希望它能成为日常科学研究的有用工具(https://spectrum.ieee.org/ai-for-science),”麻省理工学院的计算机科学家、该论文的第一作者Ziming Liu说,“给定一个我们不知道如何解释的数据集,我们只需将其交给KAN,它就可以为你生成一些假设(https://www.nature.com/articles/d41586-023-03596-0)。你只需盯着大脑(KAN图),如果你愿意,你甚至可以对它进行手术。这就像一个外星生命,从不同的角度看待事物,但对人类来说也是可以理解的。”

 

数十篇论文已经引用了KAN的预印本。“我看到它的那一刻似乎非常激动人心,”阿根廷圣安德烈斯大学计算机科学本科生Alexander Bodner说。在一周内,他和三位同学将KAN与卷积神经网络(CNN)相结合,卷积神经网络是一种流行的图像处理架构。他们测试了卷积KAN对手写数字或衣服碎片进行分类的能力(https://arxiv.org/abs/2406.13155)。最好的一个与传统CNN的性能大致相当(两个网络在数字上的准确率均为99%,在服装上的准确度均为90%),但使用的参数减少了约60%。数据集很简单,但Bodner说,其他具有更强计算能力的团队已经开始扩大网络规模。其他人正在将KAN与transformers相结合,transformers是一种在大型语言模型中流行的架构。


KAN的一个缺点是每个参数的训练时间更长,部分原因是它们无法利用GPU。但他们需要更少的参数。Liu指出,即使KAN不取代处理图像和语言的巨型CNN和转换器,在许多较小规模的物理问题上,训练时间也不会成为问题。他正在研究如何让专家将他们的先验知识插入到KANs中——比如通过手动选择激活函数——并使用简单的界面轻松地从中提取知识。他说,有一天,KAN可以帮助物理学家发现高温超导体或控制核聚变的方法(https://spectrum.ieee.org/tag/superconductors)。


微信号|IEEE电气电子工程师学会

新浪微博|IEEE中国

 · IEEE电气电子工程师学会 · 


后量子密码学之路

VR和元宇宙的安全性

识别深度伪造

对人类意识的重视回归网络安全视野

IEEE电气电子工程师学会 IEEE是全球最大的专业技术协会之一,一直致力于推动电气电子技术在理论方面的发展和应用方面的进步。IEEE在全球160多个国家有超过四十万名会员。
评论
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 91浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 65浏览
  • 在电子技术快速发展的今天,KLV15002光耦固态继电器以高性能和强可靠性完美解决行业需求。该光继电器旨在提供无与伦比的电气隔离和无缝切换,是现代系统的终极选择。无论是在电信、工业自动化还是测试环境中,KLV15002光耦合器固态继电器都完美融合了效率和耐用性,可满足当今苛刻的应用需求。为什么选择KLV15002光耦合器固态继电器?不妥协的电压隔离从本质上讲,KLV15002优先考虑安全性。输入到输出隔离达到3750Vrms(后缀为V的型号为5000Vrms),确保即使在高压情况下,敏感的低功耗
    克里雅半导体科技 2024-11-29 16:15 119浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 57浏览
  • 光耦合器作为关键技术组件,在确保安全性、可靠性和效率方面发挥着不可或缺的作用。无论是混合动力和电动汽车(HEV),还是军事和航空航天系统,它们都以卓越的性能支持高要求的应用环境,成为现代复杂系统中的隐形功臣。在迈向更环保技术和先进系统的过程中,光耦合器的重要性愈加凸显。1.混合动力和电动汽车中的光耦合器电池管理:保护动力源在电动汽车中,电池管理系统(BMS)是最佳充电、放电和性能监控背后的大脑。光耦合器在这里充当守门人,将高压电池组与敏感的低压电路隔离开来。这不仅可以防止潜在的损坏,还可以提高乘
    腾恩科技-彭工 2024-11-29 16:12 119浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 76浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 70浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 69浏览
  • 国产光耦合器正以其创新性和多样性引领行业发展。凭借强大的研发能力,国内制造商推出了适应汽车、电信等领域独特需求的专业化光耦合器,为各行业的技术进步提供了重要支持。本文将重点探讨国产光耦合器的技术创新与产品多样性,以及它们在推动产业升级中的重要作用。国产光耦合器创新的作用满足现代需求的创新模式新设计正在满足不断变化的市场需求。例如,高速光耦合器满足了电信和数据处理系统中快速信号传输的需求。同时,栅极驱动光耦合器支持电动汽车(EV)和工业电机驱动器等大功率应用中的精确高效控制。先进材料和设计将碳化硅
    克里雅半导体科技 2024-11-29 16:18 163浏览
  • 艾迈斯欧司朗全新“样片申请”小程序,逾160种LED、传感器、多芯片组合等产品样片一触即达。轻松3步完成申请,境内免费包邮到家!本期热荐性能显著提升的OSLON® Optimal,GF CSSRML.24ams OSRAM 基于最新芯片技术推出全新LED产品OSLON® Optimal系列,实现了显著的性能升级。该系列提供五种不同颜色的光源选项,包括Hyper Red(660 nm,PDN)、Red(640 nm)、Deep Blue(450 nm,PDN)、Far Red(730 nm)及Ho
    艾迈斯欧司朗 2024-11-29 16:55 163浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦