百度智算峰会精彩回顾:GPU加速药物研发与基因组学分析

英伟达NVIDIA中国 2022-12-28 21:03

生命科学是前沿科技创新的关键领域。AI、云计算、大数据等互联网技术的发展,正在为基因测序、生物医药、AI 与大数据应用等方面注入新动能,加速生命科学领域相关企业的智能化升级。


12 月 27 日,“2022 百度云智峰会·智算峰会”成功举办。NVIDIA 资深解决方案架构师翟健分享了以“GPU 加速药物研发与基因组学分析”为题的演讲,介绍了 NVIDIA 如何利用 GPU 和加速软件推动 AI 驱动的药物研发与基因组学分析,包括 NVIDIA 与百度智能云在赋能药物研发、基因测序分析方面的合作。以下为内容概要。



GPU 加速助力药物研发


CLARA 是 NVIDIA 在医疗方向的 SDK 平台,它借助于 NVIDIA 的基础软硬件平台,为医疗用户提供了医疗设备、制药、影像、基因以及智慧医院等五个方面的能力,从而为医疗的终端用户,针对具体的应用场景提供完备的加速能力。


而其中的 CLARA Discovery 是 CLARA 平台下面向药物研发场景的重要解决方案,它基于 NVIDIA 的 AI 和 HPC 能力来辅助加速药物研发的工作流程。目前该方案已经纳入到了百度智能云赋能药物研发的解决方案中。



医疗领域的前期研发过程当中会涵盖如下几个过程:集靶点发现、化学分子生成、蛋白质性质结构预测、药物分子与蛋白质进行对接打分,构建自由能 FEP 等。


整个制药行业涉及到两个学科,结构生物学与计算化学。而这两个学科都涉及到传统的 HPC 与新兴的 AI 方法,而且 AI 的方法相较于 HPC 的方法会有比较明显的速度上的优势。


目前 AI 正在颠覆整个药物研发的过程,包括在靶点发现方面、虚拟筛选以及分子生成、结构预测,甚至在临床上应用的自然语言模型,都是 AI 加速的体现。


AI 中 Transformer 模型正在逐渐地应用在药物研发领域中。左边的四张小图来自于 MegaMolBART 与 Protrans 一系列突破性的论文,表明基于 Transformer 的预训练模型可以有效地加速分子生成和蛋白质的结构预测。



右上角展示的就是 Transformer 模型的 Encoder-Decoder 的架构形式,它们可以用在诸如右下方的几个典型领域,包括:小分子模型的生成、反应序列的预测、蛋白质结构预测、生物医学领域的 NLP 以及图像分析等。


NVIDIA 基于在大语言模型上的经验,推出了 BioNeMo 的解决方案,它是一款可以在云端进行训练和部署的服务框架,主要面向有大语言模型需求的药物研发人员。此外,它基于 NVIDIA 的 GPU 硬件也做了很好的优化工作,并且提供了多种预训练模型,支持云原生的服务,极大地加速了药物研发的工作流程。



这一页展示的是 BioNeMo 的逻辑架构,最底层的是 NVIDIA 加速的计算平台。下面开始第二层是 NVIDIA 的大语言模型平台 NeMo Megatron,是 BioNeMo 的快速训练和部署的重要保证。


BioNeMo 提供了多种预训练的 Transformer 类的模型,分别针对化学分子生成、蛋白质结构序列预测、DNA 的 embedding 等几个方面。最终这些都服务于我们最上层中,药物研发领域里几个典型应用场景。


BioNeMo 的三个典型特点是:


一,它支持分子、蛋白质和核苷酸的 SMMILES 和 FASTA 的表征。


二,它含有多种预训练模型,像我们刚才提到的 MegaMolBART 等。


三,它可以在云端部署相应的、可视化界面的服务。


这里跟大家分享一个案例,Vyasa 是一个面向药物研发的 AI 解决方案提供商,他们在方案中整合了 BioNeMo 中的 MegaMolBART 模型,从而实现了终端用户在本地和云端都可以利用 GPU 对药物分子生成过程进行加速。也正因为如此,他们的用户 Memorial Solan Kettering 学院采购了 NVIDIA 的 DGX 服务器用于加速这一类型的工作负载。


除了在分子生成、蛋白质结构性质预测方面,NVIDIA 提供了很好的加速优化。在虚拟筛选和仿真的过程当中,NVIDIA 也协同了众多的开源社区、高校,加速了传统 HPC 领域当中的对接、分子动力学和量子化学里的常用软件。



这张图中展示的就是我们在三个领域当中常用的一些软件。这些软件 NVIDIA 都提供了相应的 GPU 加速版本,大家可以在 NVIDIA 的 NGC 平台(https://catalog.ngc.nvidia.com/ )进行下载。


下面展示的是分子动力学软件 Gromacs 的 GPU 版本的性能评测。可以看到,在 NVIDIA 的 A100 和 V100 GPU 上,Gromacs 都同比 CPU 获得了极好的加速。



类似的,这一页展示的是量子化学软件 VASP CPU-GPU 的性能对比。NVIDIA 的 V100 和 A100 GPU 同样都获得了极高的加速。



GPU 加速突破基因测序分析瓶颈


接下来让我们介绍一下 NVIDIA GPU 在加速基因组学方面的方案。


在今年春季的 NVIDIA GTC 大会上,来自于斯坦福大学的团队介绍了他们如何基于 NVIDIA GPU 打破了基因测序的世界纪录。他们将人类的基因测序缩短到了 7 小时 18 分钟,完成了湿实验和在计算机上的数据分析等过程。


而在基因测序方面,一般包括如下三个环节:一,通过测序仪得到数据之后进行的一级分析过程,完成四分类任务;二,在计算机上完成一致性对比处理、变体识别等二级分析过程;三,最后的三级分析则是对大量的数据进行处理。而这三个过程目前都是可以用 GPU 实现加速的。分别可以通过 GPU 加速的 TensorFlow、PyTorch,以及 TensorRT 进行一级分析加速。通过 CLARA Parabricks 对二级分析进行加速。利用 RAPIDS、MONAI 等可以加速三级分析。


下面让我们来介绍一下二级分析的软件 CLARA Parabricks。CLARA Parabricks 是一款利用 GPU 加速高通量、高精度的 DNA 和 RNA 测序分析工具,主要用于人类基因组学分析、癌症基因筛查、RNA 测序分析等。目前其中含有 60 多个工具模块,包括基因数据的一致性比对、金标准处理和质量把控、高精度遍体识别等范畴类的多种常用工具。


这一页展示的是 CLARA Parabricks 目前支持的工具模块的部分内容,基本上涵盖了主流的基因测序二级分析中的大部分工具。



使用 CLARA Parabricks 可以实现对典型的应用的加速,它是针对金标准的种系、体细胞和 RNA 的加速工具。而且目前使用 Ampere 架构的 GPU 可以实现 80 倍的加速,精度方面也能够保证,且具有比较灵活的工作流程。


那么谈到这里就要说一下 CLARA Parabricks 的几大特点了。因为它是模块化的工具,所以可以通过各种倾向性的组合,可以灵活选择 CLARA Parabricks 当中的各种模块。


同时刚才提到它的工作流程灵活,是因为它对主流的基因组学分析中的 workflow 管理器都支持,包括 WDL,nextflow 等。此外,它还对 Google 的 DeepVariant 1.4 版本的变体识别工具也做了很好的支持。


接下来我们来看看 Parabricks 的 benchmark。可以看到,列举的几个模块在 GPU 上,同比 CPU 都具有非常好的加速效果。而且在 A100 上可以最高实现 80 倍的加速。这一页展示的就是分别在 2 张、4 张和 8 张 A100 上同比 CPU 实现加速的效果。



同时,在癌症的基因筛查中,端到端的流程也可以在 GPU 上实现比较明显的加速。


2022 年春季 GTC 大会上,NVIDIA 发布了 Hopper 架构的 GPU。该架构的 GPU 对于动态编程做了很好的加速,单就动态编程这一特性,Hopper 架构就比上一代的 Ampere 架构有了 7 倍的理论加速。而在基因组学分析中,动态编程技术是需要被频繁使用到的,也因此,Hopper 架构的 GPU 可以给基因测序带来重大的收益。


上文提到的,斯坦福大学创造的基因测序世界纪录就是借助 NVIDIA CLARA Parabricks 实现的。


这里再跟大家分享一个案例,就是英国的 BioBank 这家公司,他们要处理 50 万个外显子,这些在 CPU 上需要 1 个小时才能得到结果,而 GPU 将这个过程仅仅缩短到了 5 分钟,成本下降了 60%。


这里展示了 CLARA Parabricks 的资料参考页,感兴趣的听众可以登陆 CLARA Parabricks 的网页了解更多的内容。同时,CLARA Parabricks 已经可以在百度智能云上使用了,在云上的 GPU 最佳实践专栏中还提供了 CLARA Parabricks 的使用方式和详尽介绍,感兴趣的同学可以登陆 https://cloud.baidu.com/doc/GPU/s/pl6vzliqu了解更多内容。



在加速三级分析这部分,同样可以使用 GPU 版本的大数据处理 SDK RAPIDS。RAPIDS 是一个端到端的 GPU 加速数据科学的 SDK。它包括数据处理的 SDK cuDF,用于传统机器学习的 SDK cuML,图计算 SDK cuGraph,以及一些可视化的库、众多延伸的库等。基本上 NVIDIA 非深度学习类的 GPU 加速库都在这里了。


单个细胞的三级分析依赖于众多的传统机器学习与大数据的方法,比如回归聚类等算法以及一些可视化的方法。右边展示的就是针对 scRNA 序列处理的聚类,回归与可视化端到端运行的时间。可以看到,使用 GPU 可以降低整体的运行时间。



最后让我们再次回顾一下这张图,NVIDIA GPU 在一级至三级分析上都有相应的解决方案。尤其在二级分析和三级分析上,NVIDIA 提供 CLARA Parabricks 和 RAPIDS 方案,可以带给用户更好的性能与性价比的提升。这也是斯坦福大学利用 GPU 打破基因测序世界纪录的根本原因。


上面提到的这些软件,大家可以登陆 NVIDIA NGC 平台(https://catalog.ngc.nvidia.com/ )下载相应的软件进行体验。


点击查看完整视频内容


推荐阅读

百度智算峰会精彩回顾:加速计算助力智能云深入产业


百度智算峰会精彩回顾:应用驱动的数据中心计算架构演进


即刻点击 “阅读原文” 或扫描下方海报二维码收下这份 GTC22 精选演讲合集清单,在NVIDIA on-Demand 上点播观看主题演讲精选、中国精选、元宇宙应用领域与全球各行业及领域的最新成果!


评论 (0)
  •   电磁信号模拟系统深度解析   一、系统概述   北京华盛恒辉电磁信号模拟系统作为半实物仿真测试系统,广泛应用于无线通信、军事训练等多领域。它通过软硬件结合,构建逼真电磁信号环境,用于测试电子设备在复杂电磁干扰下的性能表现。   应用案例   目前,已有多个电磁信号模拟系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁信号模拟系统。这些成功案例为电磁信号模拟系统的推广和应用提供了有力支持。   二、系统组成   装备模型库:涵盖雷达、通信设备等各类装备平台及电子装
    华盛恒辉l58ll334744 2025-04-21 10:48 93浏览
  • 导读在智能汽车技术发展浪潮中,车辆控制系统的智能化、网络化已成为行业发展的必然趋势。虹科PEAK智行定位车控系统,集成了尖端科技,能够实现车辆全方位监控与控制。从实时GPS定位到CAN/CAN FD信号处理,虹科方案不仅提升了车辆的智能化水平,更在安全性和效率上迈出了革命性的一步。虹科PEAK智行定位车控系统,通过CAN/CAN FD信号实现车辆的精准控制,包括加减速、转弯、倒退等动作,模拟真实车辆平台的动态表现。该系统搭载了虹科各型号设备,通过紧密协作,实时反映车辆位置、总线报文等信息,实现车
    虹科汽车智能互联 2025-04-21 16:04 75浏览
  •   海上安全事件应急处置系统解析   北京华盛恒辉海上安全事件应急处置系统是为应对船舶碰撞、火灾等海上突发事件打造的综合管理体系,通过技术与协同机制,实现快速响应救援、优化资源配置,守护海上生命、财产与环境安全。以下从系统构成、功能、技术、应用及趋势展开阐述。   应用案例   目前,已有多个海上安全事件应急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润海上安全事件应急处置系统。这些成功案例为海上安全事件应急处置系统的推广和应用提供了有力支持。   一、系统构成
    华盛恒辉l58ll334744 2025-04-21 15:50 68浏览
  • 导读Linux驱动程序领域再添新成员,PLIN驱动程序现已正式发布。这一新驱动程序为使用LIN接口的用户提供了一个便捷、高效的解决方案。本文将展示如何安装PLIN驱动程序,以及如何在Linux环境下进行基本的PLIN通信操作,确保您能够快速掌握并应用这一新工具。继我们在Linux环境下成功推出CAN/CAN FD接口驱动程序后,现在我们为LIN接口带来了同样兼容Linux的驱动程序。免费软件包中不仅包含了驱动程序本身,还提供实用工具和一份易于理解的快速入门指南。用户下载后,需要根据当前使用的Li
    虹科汽车智能互联 2025-04-21 14:56 60浏览
  •   有效数据智能分拣系统详解   北京华盛恒辉有效数据智能分拣系统融合人工智能、大数据分析与机器学习等前沿技术,实现海量数据自动化分类、筛选、整理及分配。凭借强大的数据处理效能,助力企业精准提取关键信息,优化决策流程,提升运营效率。以下从系统架构、核心功能、技术特性、应用场景及发展趋势展开解读。   应用案例   目前,已有多个有效数据智能分拣系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润有效数据智能分拣系统。这些成功案例为有效数据智能分拣系统的推广和应用提供了有力支持。
    华盛恒辉l58ll334744 2025-04-21 16:46 105浏览
  •   有效数据智能分拣系统平台深度解析   一、系统概述   北京华盛恒辉有效数据智能分拣系统平台融合人工智能、机器视觉、物联网及大数据分析技术,为物流包裹、数据信息等提供高效精准的智能化分拣处理方案。通过自动化设备与智能算法协同运作,取代传统人工分拣模式,显著提升分拣效率、降低错误率,满足电商、快递及供应链不断增长的业务需求。   应用案例   目前,已有多个有效数据智能分拣系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润有效数据智能分拣系统。这些成功案例为有效数据智能分
    华盛恒辉l58ll334744 2025-04-21 16:22 120浏览
  • 北京贞光科技有限公司作为紫光同芯授权代理商,深耕电子元器件领域数十载,专为汽车与工业客户提供车规级安全芯片及配套服务。公司整合硬件供应、软件SDK与技术支持为一体,配备专业团队提供选型咨询与现场指导,助力客户实现完整的芯片应用解决方案。在全球芯片供应链重构的大背景下,我国车规级芯片产业正迎来前所未有的发展机遇。北京贞光科技有限公司作为紫光同芯授权代理商,深耕电子元器件领域数十载,专为汽车与工业客户提供车规级安全芯片及配套服务。公司整合硬件供应、软件SDK与技术支持为一体,配备专业团队提供选型咨询
    贞光科技 2025-04-21 16:10 80浏览
  • 导读在当今快速发展的智能通讯领域,时间敏感网络(TSN)已成为确保网络通信高可靠性和低延迟的关键技术。IEEE 802.1 Qci作为TSN的一个重要组成部分,提供了一套强大的机制来管理网络流量,确保关键数据流的优先级和带宽得到保障。本文将深入探讨IEEE 802.1 Qci协议的基本概念、工作原理以及虹科提供的Qci解决方案,帮您理解如何通过精确的流量控制来提升网络的稳定性和效率。虹科TSN解决方案01# 技术简介时间敏感网络(TSN)通过IEEE 802.1 Qci标准定义了一种关
    虹科工业智能互联 2025-04-21 16:17 77浏览
  • 精益生产咨询师证/精益管理专业人员证/精益生产工程师证虽然在名称上有一些差异,但其实实际区别并不大,目前类似的证书以ILSSI-CLMP较为得到国际上的认可,当然,你不会因为有一张精益生产咨询师证,而会有人马上请你做咨询师,因为除了知识之外,你还要有充足经验、热诚、沟通能力等等,这些也是我们招聘咨询师的基本要求。那么,有没有必要取得CLMP证书呢?这主要取决于你自己对职业发展的规划和自我提升的意志。CLMP是什么?CLMP的全称是Certified Lean Management Profess
    优思学院 2025-04-21 14:29 45浏览
  •  霍尔效应自发现以来,已渗透至多个行业领域,其核心应用可归纳为以下几类:一、‌电子与半导体行业‌1、‌半导体器件开发与测试‌① 通过测量霍尔系数和电阻率,判断器件的导电类型(N型/P型)及载流子浓度分布,优化器件设计和制造工艺‌。② 监控晶圆掺杂水平和表面缺陷,提高集成电路良率‌。2、‌磁场传感器制造与校准‌测试霍尔传感器的灵敏度、线性度、响应时间等参数,确保其在汽车、工业控制等场景下的可靠性‌。3、‌电磁测量仪器‌基于霍尔电压与磁场强度的线性关系,开发高斯计、电流表、功率计等‌。二、
    锦正茂科技 2025-04-21 13:17 46浏览
  •   海上安全事件应急处置系统平台深度解析   一、平台概述   北京华盛恒辉海上安全事件应急处置系统平台融合现代信息技术、通信技术、GIS、大数据分析及 AI 等技术,旨在快速响应船舶碰撞、火灾、溢油等海上突发事件,实现科学决策与高效资源调配,保障海上生命财产安全、减少环境污染。   应用案例   目前,已有多个海上安全事件应急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润海上安全事件应急处置系统。这些成功案例为海上安全事件应急处置系统的推广和应用提供了有力支持
    华盛恒辉l58ll334744 2025-04-21 15:21 87浏览
  • 导读在汽车测试和现代工业领域,功耗控制与效率优化是工程师们不断追求的目标。虹科PCAN Router系列设备以其卓越的性能和灵活性,为CAN/CAN FD网络中的报文转换提供了高效解决方案。本文将探讨虹科PCAN Router系列设备如何在保持高效工作的同时,通过低功耗模式和高效唤醒功能,满足对能耗有严格要求的应用场景。虹科PCAN Router系列网关1 低功耗模式的优势与实现在实际的工作场景中,可能会出现一些对功耗要求存在限制的情况。鉴于此,可以灵活设置虹科PCAN Router系
    虹科汽车智能互联 2025-04-21 15:45 65浏览
  •   电磁信号模拟平台解析   北京华盛恒辉电磁信号模拟平台作为模拟复杂电磁环境的系统,在无线通信、电子对抗等多领域广泛应用。以下从功能、技术特性、应用场景及发展趋势展开详细解读。   应用案例   目前,已有多个电磁信号模拟平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁信号模拟平台。这些成功案例为电磁信号模拟平台的推广和应用提供了有力支持。   一、核心功能   复杂电磁环境建模:构建贴近真实的电磁环境,涵盖各类干扰因素。   多通道信号模拟:模拟多通道电磁信号
    华盛恒辉l58ll334744 2025-04-21 15:10 96浏览
  •  霍尔效应的检测需通过实验手段测量霍尔电压、载流子浓度等参数,并分析材料电学特性。以下是具体检测方法及流程:一、核心检测方法1、‌直流(DC)霍尔测试‌‌原理‌:通过恒定磁场和电流测量霍尔电压,适用于常规半导体材料(如硅、砷化镓)。‌步骤‌:向样品通入直流电流,施加垂直磁场,用高精度电压表直接测量霍尔电压,并排除热电压等干扰信号。2、‌交流磁场(AC)霍尔测试‌‌适用场景‌:针对低迁移率材料(如某些有机半导体),霍尔电压远小于误差电压时使用。‌技术要点‌:利用锁相放大器提取交流磁场下的
    锦正茂科技 2025-04-21 11:39 42浏览
  • 一、‌基础原理验证与分析‌1、‌理解霍尔效应基本机制‌通过实验观察磁场中导体或半导体材料的电荷偏转现象,验证霍尔电压与磁场强度、电流方向的关系,直观认识洛伦兹力对载流子的作用‌。2、‌探索磁电效应关联性‌研究霍尔效应与材料电学特性(如载流子类型、浓度)的关联,揭示半导体材料的导电机制(如N型/P型半导体)。二、‌参数测量与标定‌1、‌关键物理量测量‌掌握霍尔元件灵敏度(KH)、霍尔系数(RH)、电导率(σ)及载流子迁移率(μ)的测量方法,为半导体材料性能评估提供数据支持。2、‌磁场强度与分布测定
    锦正茂科技 2025-04-21 13:03 38浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦