10月8日,瑞典皇家科学院做出了一个出人意料的决定,他们将2024年诺贝尔物理学奖授予了美国普林斯顿大学的约翰·J·霍普菲尔德(John J. Hopfield)和加拿大多伦多大学的杰弗里·E·辛顿(Geoffrey E. Hinton),以表彰他们在利用人工神经网络实现机器学习方面的奠基性发现和发明。获奖者将共享1100万瑞典克朗(约合745万元人民币)奖金。
人工智能技术的灵感最初来源于大脑结构。在人工神经网络中,大脑的神经元由具有不同值的节点。这些节点通过类似于突触的连接相互影响,例如通过在同时具有高数值的节点之间建立更强的连接,可以对网络进行训练。诺贝尔奖委员会表示,今年的获奖者利用物理学工具开发出的人工神经网络方法,为当今强大的机器学习奠定了基础。
获奖者自己都感到意外
这一决定不仅在物理学界引起轰动,也在人工智能领域产生了巨大反响,就连被称为“AI教父”的辛顿本人感到意外,他在诺贝尔物理学奖颁布时线上接受媒体采访,被问及现在的感受时说:“我大吃一惊(flabbergasted),不知道会发生这种事。”
“我现在待在加利福尼亚州的一家廉价旅馆里面,这里的网络和电话信号都不太好,我本来打算今天去做核磁共振(MRI)检查的,但现在我不得不取消了!” 辛顿在新闻发布会上接受电话连线时说。
辛顿回忆了自己成果的发现过程,并致敬了所有的合作者,讲述了他们是如何一步一步实现了基于玻尔兹曼机的学习算法。当被问到他自己在用什么AI工具时,辛顿表示他自己在用GPT-4,但不完全相信GPT-4的答案,但一旦自己有什么不知道,就会去问一下GPT-4。
两位科学家的贡献
约翰·霍普菲尔德:物理学家的AI之路
霍普菲尔德是一位著名的物理学家、生物学家和神经科学家,1933年7月15日出生于美国伊利诺伊州芝加哥,1958年在美国康奈尔大学获得物理学博士学位(导师为 Albert Overhauser)。他在贝尔实验室理论组工作了两年,随后在加利福尼亚大学伯克利分校(物理学)、普林斯顿大学(物理学)、加州理工学院(化学和生物学)和普林斯顿大学任教,现在是霍华德-普莱尔分子生物学名誉教授。35 年来,他一直与贝尔实验室保持着密切联系。
霍普菲尔德因对联想神经网络的研究而广为人知,该模型现在被称为霍普菲尔德网络(Hopfield Neural Network,HNN)。
1982年,霍普菲尔德发明了一种神经网络模型,用于解释大脑如何回忆记忆。他解释了神经元系统如何相互作用以产生稳定的记忆,以及神经元系统如何应用简单的过程来根据部分信息完成整个记忆。HNN对物理学、生物学和计算机科学等不同领域产生了显著影响,通过构建能够模拟人脑某些功能的人工神经网络,机器现在可以使用这些过程来存储“记忆”,这项技术进步掀起了深度学习技术的研究浪潮。
他最有影响力的论文包括:描述极化子的 “The Contribution of Excitons to the Complex Dielectric Constant of Crystals”(1958 年);描述长程电子转移量子力学的 “Electron transfer between biological molecules by thermally activated tunneling”(1974 年);"Kinetic Proofreading:1974年);“神经网络和具有突发性集体计算能力的物理系统”(1982年)(被称为Hopfield网络),以及与D. W. Tank 合著的 “优化问题中决策的神经计算”(1985 年)。他目前的研究和近期发表的论文主要集中在如何将动作电位定时和同步用于神经生物学计算。
杰弗里·辛顿:深度学习之父
辛顿1947年12月6日出生于英国温布尔登,是逻辑学家 George Boole 的曾曾孙,George Boole 的工作布尔代数(Boolean algebra)是现代计算机科学的基础之一。辛顿的父亲是英国昆虫学家 Howard Hinton,叔叔是著名经济学家 Colin Clark,国民生产总值(GDP)这个术语的提出者。
辛顿本人是计算机科学家和认知心理学家,因在人工神经网络方面的工作而闻名,他是图灵奖得主,并获得了“深度学习教父”的称号。1978年,他在英国爱丁堡大学获得人工智能学博士学位,在卡内基梅隆大学任教五年后,他成为加拿大高等研究院的研究员,并进入多伦多大学计算机科学系任教,现为该系名誉教授。他于 2013 年 3 月加入谷歌,并担任Vector 研究所的首席科学顾问。2013年至2023年在谷歌大脑和加拿大多伦多大学工作,现任是加拿大多伦多大学物理学教授。
他在霍普菲尔德研究的基础上,发明了一种可以自主查找数据属性的方法,从而执行识别图片中特定元素、分类或创建新的模式示例等任务。辛顿的研究包括玻尔兹曼机(Boltzmann machine),可以独立发现数据属性的方法,这对于现在使用的大型人工神经网络来说已经变得很重要;其他包括反向传播算法、分布式表示、时滞神经网络、专家混合、变分学习等,对深度学习的发展起到了关键作用。
1986年,辛顿与合作者撰写了一篇广泛引用的论文《通过反向传播误差来学习》(Learning representations by back-propagating errors),推广了用于训练多层神经网络的反向传播算法。他与学生Alex Krizhevsk、Ilya Sutskever(前OpenAI首席科学家)合作设计了卷积神经网络“Alexnet”,并在2012年的ImageNet挑战赛中以远超第二名的成绩夺冠,将 ImageNet 数据集上的视觉识别错误率降到了 15.3%,仅有此前的一半,这是计算机视觉领域的一次重大进展。
不过,辛顿认为自己不可担当“反向传播之父”这个称号。在 2018 年的一次采访中,辛顿表示“ David E. Rumelhart 提出了反向传播的基本思想,所以这是他的发明。”
追溯起来,学界普遍认可现代反向传播算法在 1970 年由芬兰硕士生 Seppo Linnainmaa 首次发表, Paul Werbos 在 1974 年提出用它来训练神经网络。尽管 Geoffrey Hinton 并不是第一个提出这种方法的人,但他对推广反向传播起到了很重要的作用,也是第一个使用反向传播学习词嵌入的人。
2015 年,为了纪念人工智能 60 周年,深度学习三巨头约舒亚·本希奥(Yoshua Bengio)和扬·莱坎(中文名杨立昆,Yann LeCun)与辛顿在 Nature 上发表了综述论文《Deep learning》。
卷积神经网络获得了巨大的成功,但也并不适合所有的任务。2017 年 10 月和 11 月,Hinton 发表了两篇关于胶囊神经网络主题的研究论文,提出了胶囊网络(CapsNet)作为 CNN 模型的替代。胶囊是深度学习的新概念,与 CNN 和传统的神经网络相比,它产生了不错的效果。CNN 分类器在对抗干扰数据时并不稳健,而胶囊网络被证明对不良数据的适应力更强,而且还能适应输入数据的仿射变换。
因在深度学习方面的贡献,“深度学习三巨头”也一起获得了2018年图灵奖,该奖通常被称为“计算机界的诺贝尔奖”。
辛顿是英国皇家学会会士,也是美国国家工程学院和美国艺术与科学学院的外籍会员。他获得过诸多奖项,包括大卫・鲁梅尔哈特奖、 IJCAI 卓越研究奖、 基廉工程奖(有“加拿大诺贝尔奖”之称的国家最高科学奖)、 IEEE Frank Rosenblatt 奖、 NSERC Herzberg 金奖、 IEEE 詹姆斯·克拉克·麦克斯韦金奖、 NEC C&C 奖、本田奖和图灵奖。
在几十年的研究生涯中,辛顿称得上“桃李满天下”。他曾培养的知名学者包括:Peter Dayan、Sam Roweis、Richard Zemel、Brendan Frey、Radford M. Neal、Ruslan Salakhutdinov、Ilya Sutskever、Yann LeCun 和 Zoubin Ghahramani。
辛顿著名的“徒子徒孙”们
关于诺贝尔物理学奖
诺贝尔物理学奖设立于1895年,是阿尔弗雷德·诺贝尔在1895年的遗嘱中首先提到的奖项领域,旨在表彰在物理学领域做出最杰出发明或发现的人,被普遍认为是在物理学领域能够取得的最高荣誉。
根据诺贝尔奖官网数据,从1901年到现在,诺贝尔物理学奖共颁发了118次,在1916年、1931年、1934年、1940年、1941年和1942年没有颁发该奖。共有226名科学家获奖。 其中,47次的物理学奖授予单一获奖者,33次的物理学奖由两位获奖者共同获得,38次的物理学奖由三位获奖者分享。
历届获奖人中不乏改变物理界的大咖,例如阿尔伯特·爱因斯坦、埃尔温·薛定谔、李政道和杨振宁等。值得注意的是,美国物理学家约翰·巴丁是唯一一位分别在1956年和1972年两次获得诺贝尔物理学奖的人。
迄今为止,最年轻的诺贝尔物理学奖得主是英国物理学家劳伦斯·布拉格,他在1915年获奖时只有25岁。最年长的诺贝尔物理学奖得主则是美国科学家阿瑟·阿什金,他在2018年获得诺贝尔奖时已96岁。
在诺奖上百年的历史中,只有5名女性曾获得诺贝尔物理学奖,分别是法国著名波兰裔科学家玛丽·居里(1903年获诺贝尔物理学奖,1911年获诺贝尔化学奖)、美国物理学家玛丽亚·格佩特-梅耶因(1963年获奖)、加拿大科学家唐娜·斯特里克兰(2018年获奖)、美国科学家安德烈娅·盖兹(2020年获奖)、法国物理学家安妮·卢利尔(2023年获奖)。
物理学奖,为何颁给了AI?
此次将诺贝尔物理学奖授予霍普菲尔德和辛顿,标志着物理学与计算机科学的交叉融合达到了新的高度。他们利用物理学工具开发了今天机器学习技术的基础方法,这些方法不仅推动了物理学的发展,也为其他科学领域带来了革命性的变化。例如,在粒子物理、材料科学和天体物理学等领域,人工神经网络已经成为重要的研究工具。
虽然人工智能和机器学习已经成为当今社会的热门话题,但将诺贝尔物理学奖授予这一领域的科学家仍然是非常罕见的。关于网上对物理学奖为何颁发给AI科学家的疑惑,也有专家进行了解读。
中国科学院自动化研究所研究员、联合国人工智能高层顾问机构专家曾毅在接受《新京报》采访时说,两位获奖者开创了第三次人工智能的研究热潮。人工神经网络是20世纪80年代以来人工智能领域兴起的研究热点,它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。
清华大学计算机系教授邓志东认为,霍普菲尔德的Hopfield网络和辛顿的反向传播算法为现代深度学习技术的发展奠定了基础。这些技术不仅在科学研究中发挥了重要作用,还在实际应用中产生了广泛影响,如图像识别、自然语言处理等领域。
“表面上这次奖项相关领域是机器学习与人工智能,但是从更广泛的意义上讲,我认为本次诺贝尔物理学奖实际上授予了理论物理学。” 曾毅认为,霍普菲尔德和辛顿两位获奖者的研究背景都起源于物理学。从人工智能的视角观察,两位最核心的科学贡献是将起源于理论物理、生物物理两个学科的理论成功应用于构建人工智能科学理论。
从多学科交叉的视角观察,两位获奖者都是理论物理、人工智能、神经科学的研究者。他们的主要研究成果深深地根植于他们从计算视角对理论物理与神经科学,特别是学习与记忆的物理与神经科学原理的观察、假设、建模与实践,而研究成果更是双双贡献于大脑智能和人工智能基础科学理论的形成,并在人工智能与机器学习领域取得了显著的实践效果与广泛的应用。这说明理论物理研究及其与神经科学、心理学等学科的交叉研究对人工智能科学理论取得里程碑式的进展具有重要的意义与启发。
曾毅说,与诸多获得诺贝尔奖的科学成果一样,霍普菲尔德辛顿两位获奖者的科学贡献都经受住了时间和实践的检验。受理论物理与生物物理启发的人工神经网络理论与模型成为现代人工智能最重要的理论基础之一,特别是近两年,更在诸多科学领域取得了显著和广泛的应用效果,正在改变甚至颠覆诸多学科的研究范式,因此在这个时间点获得了更多关注,“人工神经网络虽然在物理学领域还不足与基础物理学定律的贡献相媲美,却是对世界可能产生重大影响的人工智能科学的基础性贡献。”
结语:AI教父的“AI威胁论”
诺贝尔物理学奖委员会主席埃伦-蒙斯(Ellen Moons)表示,获奖者的工作已经产生了巨大的效益。在物理学领域,人工神经网络被应用于广泛的领域,例如开发具有特定属性的新材料等。今年的诺贝尔物理学奖,不仅是对两位科学家个人成就的认可,更是对整个人工智能领域贡献的肯定。
在技术创新方面,霍普菲尔德和辛顿的研究成果推动了机器学习和深度学习技术的发展,这些技术已经在多个领域取得了重大突破,如自动驾驶、医疗诊断、金融分析等。
辛顿在获奖后的采访中表示,人工智能将对人类社会产生巨大影响,它将与工业革命相媲美。“但它不是在体力上超越人类,而是在智力上超越人类。我们不知道比我们更聪明的东西是什么样子。”然而,在伦理与风险上,辛顿对人工智能潜在风险的担忧也引起了广泛关注。
2023年5月,辛顿宣布从谷歌辞职,以便能够“自由地谈论人工智能的风险”。 他在今年3月的一场采访中直言,开始对自己一生从事的工作感到有些后悔:“我用平常的借口来安慰自己:就算我没做,别人也会做的……很难想象,你能如何阻止坏人利用它(AI)来做坏事。”
他表示,自己在2023年4月与作为上司的谷歌首席科学家杰夫·迪恩(Jeff Dean)展开过讨论,称AI有可能带来事关人类生存的危机;迪恩希望能挽留他留在谷歌研究AI的安全对策,但为了不受公司利益限制,辛顿还是选择了离开。
辛顿认为,AI的危险之处在于,其真的有可能采用对人类有害的手段来实现被设定的目标,并且AI之间还可能会在未来出现竞争关系:“面对通过竞争变得更聪明的AI,我们人类将会落后。很多人主张,要防止AI失控,只要关掉电源开关即可。但超越人类智慧的AI可以用语言操纵我们,或许会试图说服我们不要关掉开关。”
他指出,制定安全准则需要人工智能应用领域的竞争者之间进行合作,以避免最坏的结果。这一观点得到了许多专家的支持,强调了在技术发展的同时,必须重视伦理和社会责任。