在NVIDIA和Scripps Research的帮助下,橡树岭国家实验室研究人员使用Summit超级计算机将搜索时间从数年缩短至数小时。
正在家中远程办公的Ada Sedova,有时甚至穿着睡衣。她利用世界上功能最强大的超级计算机来寻找一个微小的分子,这种分子可以阻止人们感染新型冠状病毒。
橡树岭国家实验室(Oak Ridge National Laboratory)的生物物理学研究员Sedova表示:“我比以往任何时候都做得更多。出于对大流行的担忧,我将许多私人时间投入到这项工作中。”
通过她的辛勤付出,团队最终在短短24小时内执行了20亿次分子测试。
Sedova在寻求一个配位体,它是一种体积小于几十个原子的有机分子。合适的配位体会将自身与冠状病毒的蛋白质结合,从而阻止其感染健康细胞。
但问题在于,要检查的配位体和蛋白质数量非常庞大,且它们的形状会随着原子力的变化不断改变。在数十亿种可能的化合物中找到合适的配位体仿佛大海捞针。
在湿实验室(用于开展基于实验药剂的传统实验的实验室)中将全部可能性尝试一遍需要若干年的时间, 即使通过ORNL的超级计算机Summit上的9,216个CPU上将它们全部仿真,也需要四年时间才能完成。因此Sedova和她的同事们选择装备了27,648组NVIDIA GPU的 Summit超级计算机来加快工作速度。
他们最初使用的是AutoDock的OpenCL版本,这是一个用来模拟蛋白质和配体如何结合的开源程序,由斯克里普斯研究所和达姆施塔特大学合作开发。与CPU相比,运行在GPU上的OpenCL版本的处理速度提高了50倍。
CUDA切入正题
在NVIDIA和Scripps Research的帮助下,该团队将代码移植到CUDA,使其可以在Summit上运行,由此在原有50倍加速的基础上,处理速度再次提升2.8倍。Jubilee Development的另一位研究人员Aaron Scheinberg发现,在使用OpenMP加速向GPU提供数据时,这项工作又实现了3倍增速。
对抗某一特定蛋白质的化合物数量可达14亿种,另一项测试结果表明,他们可以在短短12小时内完成对这些化合物的高精度筛选。与运行在CPU上的程序相比,该速度提高了33倍以上。
GPU将处理包含14亿个配位体的数据库所需的时间减少了一个数量级以上, 他们还缩小了结果间差异,由此解决了在超级计算机的CPU上的进程安排问题。
她说:“GPU与Summit规模和体系结构的结合,将化合物对接能力扩充了数十亿个。”
团队的另一位成员,生物物理学家Josh Vermaas特别对NVIDIA团队的Scott Le Grand帮助他们将AutoDock移植到CUDA表示感谢。Vermaas在关于工作开端的博客中写到, “以前的平台只支持OpenCL代码,他的帮助对实现平台性能提升至关重要。”
在24小时内模拟20亿种化合物
Sedova相信,通过进一步改进,团队可以实现将化合物检测能力提升至24小时内20亿种。对于数目如此庞大的数据,这将是在高分辨率下完成的首次模拟。
研究人员在实现这一里程碑式的成就过程中仍然面临一些挑战。
蛋白质-配位体对接的标准工作流程是一个缓慢的基于文件的流程。它可以在笔记本电脑上完成对数百种化合物的测试,但如此庞大的数据量即使交由世界上最大的超级计算机处理,计算机也会出现宕机的情况。
这是对那些希望帮助加速科学发展的开源开发者的号召。
Sedova的团队正在领导这项工作,组建了一个新的工作流程,该工作流程有望安全地在Summit上启动大量工作。她正在咨询系统的I / O专家,并试图建立一个数据库来容纳所有配体。
下一步是在Summit的4,608个节点中的108个上启动约100万种化合物的实验。她说:“如果行得通,我们将在Summit的所有节点上启动14亿个化合物的大规模生产。”
聚焦搜索有希望成功的分子
如果该团队成功,他们将向孟菲斯的研究人员发送一份约9000种最有希望成功的化合物清单,以便在湿实验室中对真实的病毒开展测试。搜索范围的缩小大大增加了配位成功的希望。
这个项目于今年1月开始,当时ORNL的顶级研究人员Jeremy C. Smith展示了使用Summit超级计算机进行药物研究以对抗冠状病毒的首个研究。目前项目仍处于初期阶段。
展望未来,Sedova就桥接蛋白质-配位体领域与高性能计算的典型方法提出了更多想法,她也有足够的精力去进一步探索。
欲了解更多有关使用GPU对抗冠状病毒的项目信息,请访问NVIDIA COVID-19专题页面:https://www.nvidia.com/zh-cn/covid-19/
如需获取更多信息,请点击下方“阅读原文”。
号外!想要解锁更多AI技术应用?速速扫描下方海报二维码,观看GTC 2020主题演讲中文字幕版!