点击蓝字 关注我们
SUBSCRIBE to US
DEEPMIND
瑞士洛桑联邦理工学院(EPFL)在等离子体物理学和等离子体控制方法方面拥有几十年的经验。DeepMind是一家在2014年被Google收购的科学发现公司,致力于 “解决智能问题,推动科学和人类发展”。
据了解,来自EPFL和DeepMind的一组研究人员使用了一种称为深度强化学习(RL)的人工智能来控制托卡马克的磁线圈,这是一种用于聚变研究的环形反应堆,也是通过聚变发电的主要候选反应堆之一。托卡马克在强磁场中的热等离子体中产生聚变反应,所有这些都由磁线圈结构控制。虽然人工智能以前曾被用于核聚变研究,比如事后分析,但这是人工智能首次被用于直接控制托卡马克。这是RL在托卡马克控制中的首次实验性应用,暗示了人工智能未来应用的前景,以帮助实现更高的聚变效率。
“我们在这方面还处于起步阶段,”DeepMind控制团队负责人、新论文作者Martin Riedmiller说。他表示,在未来,人工智能和聚变研究人员之间的对话可能会导致开发出实现和维持聚变反应的全新方式。
RL算法的工作原理是使用一个反复试验的系统,猜测什么能起作用,从而得出一个最有效的解决方案。为了训练他们的算法,研究人员对算法进行了聚变物理的数学模拟。
EPFL的研究员、论文的另一位作者Frederico Felici说:“我们用来模拟聚变反应堆的基本物理模型的实际质量确实有了很大的提高。”
研究人员使用了一种被称为actor-critic的训练方法,其中一个神经网络根据其是否产生高质量的解决方案来评估数据,而另一个神经网络则获取该数据并使用它来控制融合反应。
研在使用模拟环境对算法进行训练后,研究人员在EPFL用实际托卡马克——可变构型托卡马克(也称Tokamak à Configuration Variable或TCV)进行了测试。首先,研究人员使用传统的控制方法来形成等离子体,并确定其位置和电流。然后,他们将控制权“移交”给RL系统。因为改变实际的融合过程可能是危险的和破坏性的,所以该算法根本不受实际反应的训练,只接受模拟训练——研究人员在论文中写道,这是从训练到现实世界的“零射击”转换。
Chris Hansen是华盛顿大学的一位资深研究科学家,他从事聚变和等离子科学的研究,并没有参与这项研究,他表示:“非常重要的是能够证明我们使用模拟环境构建这个模型,并将其应用于实际实验。希望[算法]从第一天起就起作用。”
研究人员最初通过启动实验来测试该系统,增加了等离子体的不稳定性,并将其恢复到等离子体的初始状态。在这项基本测试之后,该小组对不同的等离子体配置进行了实验。本质上,他们能够将等离子体“雕刻”成不同的形状,从而更好地研究什么样的结构对聚变最有效。该团队创造了更典型的细长椭圆形形状,一个昵称为“雪花”的形状,以及一个侧面看起来像三角形的形状。他们还首次在反应器中形成了两个独立的等离子体“液滴”模式。
DEEPMIND
Felici说:“形状对等离子体约束的质量有着根本性的影响,因此等离子体在多大程度上保持了内部的热量,以及等离子体在多大程度上容易发生任何不稳定事件。”像中断这样的事件,即等离子体逃逸磁场,会中断反应,甚至可能造成损害。
这种基于RL的控制方法比其他融合控制方法简单,但不一定更有效。例如,通常控制托卡马克的方法是使用几个独立的控制器串联工作。新方法用一个控制器取代了这个系统。
在未来,研究人员希望找到方法来模拟和研究不同等离子体结构的内部动力学,而不仅仅是反应堆线圈的磁控制。他们补充说,使用RL也有一些固有的缺点。毕竟,任何深度学习系统都是一个“黑匣子”。因为系统得出结论的方式并不明显,所以如果出现问题,就没有明确的方法来知道发生了什么。然而,RL作为一种等离子体控制方法,在实际控制这一不稳定系统方面显示出明显的优势,这就是为什么研究人员继续表现出如此乐观的态度,以及为什么他们将在最初的成功基础上继续改进。
Hansen说:“看到这项技术在未来的发展真的很令人兴奋。”该小组的研究结果于近日发表在了《自然》杂志上。
微信号|IEEE电气电子工程师
新浪微博|IEEE中国
· IEEE电气电子工程师学会 ·
往期推荐
推荐阅读
全息技术“量子飞跃” 可用于间接医学成像等
03-1 CHARLES Q. CHOI
哈佛大学研发可广泛调谐且紧凑的太赫兹激光器即将问世
03-03 PAYAL DHAR
准粒子用于每秒产生数百万个真正的随机数
03-02 DEXTER JOHNSON
研究人员探索音乐疗法帮助中风患者康复
03-07 MICHELLE HAMPSON