Structura Biotechnolog 的突破性软件可以迅速分析 2D 显微镜数据,了解分子结构。
在这场 COVID-19 疫苗研发的全球竞赛中,科研人员和制药公司首先要做的就是了解这种病毒的蛋白质结构。
然而,了解它们的前提是建立详细的蛋白质分子 3D 模型,但迄今为止这项工作一直是项及其耗时的工程。Structura Biotechnology 开创性的软件加速了这一进程。
这个加载了 Structura 软件的 GPU 驱动机器学习算法,为一种叫做“冷冻电子显微镜”或“cryo-EM” 的图像处理技术提供了动力,这项技术也是生化领域的一项革命性突破,曾获得过 2017 年诺贝尔化学奖。
Cryo-EM 使强大的电子显微镜能够捕获接近自然状态的生物分子的详细图像。这些图像可被用于重建生物分子的 3D 模型。
利用 cryo-EM 提供的有价值的 2D 图像数据,Structura 的 AI 驱动软件 cryoSPARC 可以快速分析所得的显微镜数据,用于解决嵌入式蛋白质分子的 3D 原子结构。而这也使研究人员可以更快地评估药物与这些分子结合的有效程度,从而大大加快了药物发现的过程。
全世界已有上百个实验室使用了这家在刚在多伦多成立三年公司的软件。在 2020 年期间,使用该软件的用户数量激增,但并不令人惊讶。事实上,这家公司的首席执行官 Ali Punjani 指出,科学家们使用 Structura 的软件来可视化 COVID -19 蛋白质的研究已经被发表在多本刊物中。
Punjani 说:“我们的软件能够帮助科学家了解蛋白质的外观与一些刚被提出疗法如何结合。对目标结构的了解越多,设计或识别锁定在该结构上并阻止它的分子就越容易。”
有趣的测试案例
Structura 的想法来自 Punjani 在多伦多大学工作时听到的一次对话,这场对话关于如何使用显微图像解决蛋白质结构。他认为这个主题会成为他对机器学习研究的浓厚兴趣的一个有趣的测试案例。
Punjani 于 2017 年组建了他的团队,Structura 在大规模推理和计算机视觉算法的支持下构建的软件,有助于从 2D 图像数据中恢复 3D 模型。他说,关键是要以提高的准确性收集和分析足够数量的微观数据,以实现高质量的 3D 重建。
Punjani 说:“这是一个高度科学的领域,对错误的容忍度为零,弄错了可能会浪费大量时间和金钱。”
Structura 的软件通常在客户的硬件上部署,必须完成处理实时 3D 显微镜数据的任务。Punjani 说,实验室通常会在 NVIDIA Quadro RTX 6000 GPU 或类似设备上运行这项工作,而许多大型制药公司已经投资了 NVIDIA V100 Tensor Core GPU 集群以及各种 NVIDIA 显卡。
Structura 在运行 V100 GPU 的多 GPU 节点的机器上进行了所有的模型训练和软件开发。Punjani 说,由于问题的特殊性和特殊性,他的团队从头开始编写了所有 GPU 内核。在 Structura 的 GPU 上运行的代码是用 CUDA 编写的,cuDNN 则用于一些高端计算任务。
正确的时间,正确的软件
鉴于 Structura 创新技术的价值以及 cryo-EM 的重要性,Punjani 并没有抑制他对公司的雄心壮志。最近该公司加入了 NVIDIA Inception,这是一项初创加速计划,旨在通过人工智能和数据科学的发展培育初创公司,使行业发生革命性变化。
Punjani 说,与生物有关的任何研究现在都可以利用 cryo-EM 提供 3D 蛋白质结构信息,因此,业界对 Structura 软件能完成的工作给予了广泛关注。
他说:“我们正在构建的是 Cryo-EM 的基本构建块,他们可以更好地实现基于结构的药物发现。Cryo-EM将在所有生物学研究中无处不在。”
NVIDIA 首席科学家 BILL DALLY 通过 GTC 中国线上大会 2020 主题演讲,为您解读 NVIDIA 新科技如何助力解决当今世界的巨大挑战。速速扫描下方海报中的二维码观看演讲视频!