百度智算峰会精彩回顾:GPU加速药物研发与基因组学分析

英伟达NVIDIA中国 2022-12-28 21:03

生命科学是前沿科技创新的关键领域。AI、云计算、大数据等互联网技术的发展,正在为基因测序、生物医药、AI 与大数据应用等方面注入新动能,加速生命科学领域相关企业的智能化升级。


12 月 27 日,“2022 百度云智峰会·智算峰会”成功举办。NVIDIA 资深解决方案架构师翟健分享了以“GPU 加速药物研发与基因组学分析”为题的演讲,介绍了 NVIDIA 如何利用 GPU 和加速软件推动 AI 驱动的药物研发与基因组学分析,包括 NVIDIA 与百度智能云在赋能药物研发、基因测序分析方面的合作。以下为内容概要。



GPU 加速助力药物研发


CLARA 是 NVIDIA 在医疗方向的 SDK 平台,它借助于 NVIDIA 的基础软硬件平台,为医疗用户提供了医疗设备、制药、影像、基因以及智慧医院等五个方面的能力,从而为医疗的终端用户,针对具体的应用场景提供完备的加速能力。


而其中的 CLARA Discovery 是 CLARA 平台下面向药物研发场景的重要解决方案,它基于 NVIDIA 的 AI 和 HPC 能力来辅助加速药物研发的工作流程。目前该方案已经纳入到了百度智能云赋能药物研发的解决方案中。



医疗领域的前期研发过程当中会涵盖如下几个过程:集靶点发现、化学分子生成、蛋白质性质结构预测、药物分子与蛋白质进行对接打分,构建自由能 FEP 等。


整个制药行业涉及到两个学科,结构生物学与计算化学。而这两个学科都涉及到传统的 HPC 与新兴的 AI 方法,而且 AI 的方法相较于 HPC 的方法会有比较明显的速度上的优势。


目前 AI 正在颠覆整个药物研发的过程,包括在靶点发现方面、虚拟筛选以及分子生成、结构预测,甚至在临床上应用的自然语言模型,都是 AI 加速的体现。


AI 中 Transformer 模型正在逐渐地应用在药物研发领域中。左边的四张小图来自于 MegaMolBART 与 Protrans 一系列突破性的论文,表明基于 Transformer 的预训练模型可以有效地加速分子生成和蛋白质的结构预测。



右上角展示的就是 Transformer 模型的 Encoder-Decoder 的架构形式,它们可以用在诸如右下方的几个典型领域,包括:小分子模型的生成、反应序列的预测、蛋白质结构预测、生物医学领域的 NLP 以及图像分析等。


NVIDIA 基于在大语言模型上的经验,推出了 BioNeMo 的解决方案,它是一款可以在云端进行训练和部署的服务框架,主要面向有大语言模型需求的药物研发人员。此外,它基于 NVIDIA 的 GPU 硬件也做了很好的优化工作,并且提供了多种预训练模型,支持云原生的服务,极大地加速了药物研发的工作流程。



这一页展示的是 BioNeMo 的逻辑架构,最底层的是 NVIDIA 加速的计算平台。下面开始第二层是 NVIDIA 的大语言模型平台 NeMo Megatron,是 BioNeMo 的快速训练和部署的重要保证。


BioNeMo 提供了多种预训练的 Transformer 类的模型,分别针对化学分子生成、蛋白质结构序列预测、DNA 的 embedding 等几个方面。最终这些都服务于我们最上层中,药物研发领域里几个典型应用场景。


BioNeMo 的三个典型特点是:


一,它支持分子、蛋白质和核苷酸的 SMMILES 和 FASTA 的表征。


二,它含有多种预训练模型,像我们刚才提到的 MegaMolBART 等。


三,它可以在云端部署相应的、可视化界面的服务。


这里跟大家分享一个案例,Vyasa 是一个面向药物研发的 AI 解决方案提供商,他们在方案中整合了 BioNeMo 中的 MegaMolBART 模型,从而实现了终端用户在本地和云端都可以利用 GPU 对药物分子生成过程进行加速。也正因为如此,他们的用户 Memorial Solan Kettering 学院采购了 NVIDIA 的 DGX 服务器用于加速这一类型的工作负载。


除了在分子生成、蛋白质结构性质预测方面,NVIDIA 提供了很好的加速优化。在虚拟筛选和仿真的过程当中,NVIDIA 也协同了众多的开源社区、高校,加速了传统 HPC 领域当中的对接、分子动力学和量子化学里的常用软件。



这张图中展示的就是我们在三个领域当中常用的一些软件。这些软件 NVIDIA 都提供了相应的 GPU 加速版本,大家可以在 NVIDIA 的 NGC 平台(https://catalog.ngc.nvidia.com/ )进行下载。


下面展示的是分子动力学软件 Gromacs 的 GPU 版本的性能评测。可以看到,在 NVIDIA 的 A100 和 V100 GPU 上,Gromacs 都同比 CPU 获得了极好的加速。



类似的,这一页展示的是量子化学软件 VASP CPU-GPU 的性能对比。NVIDIA 的 V100 和 A100 GPU 同样都获得了极高的加速。



GPU 加速突破基因测序分析瓶颈


接下来让我们介绍一下 NVIDIA GPU 在加速基因组学方面的方案。


在今年春季的 NVIDIA GTC 大会上,来自于斯坦福大学的团队介绍了他们如何基于 NVIDIA GPU 打破了基因测序的世界纪录。他们将人类的基因测序缩短到了 7 小时 18 分钟,完成了湿实验和在计算机上的数据分析等过程。


而在基因测序方面,一般包括如下三个环节:一,通过测序仪得到数据之后进行的一级分析过程,完成四分类任务;二,在计算机上完成一致性对比处理、变体识别等二级分析过程;三,最后的三级分析则是对大量的数据进行处理。而这三个过程目前都是可以用 GPU 实现加速的。分别可以通过 GPU 加速的 TensorFlow、PyTorch,以及 TensorRT 进行一级分析加速。通过 CLARA Parabricks 对二级分析进行加速。利用 RAPIDS、MONAI 等可以加速三级分析。


下面让我们来介绍一下二级分析的软件 CLARA Parabricks。CLARA Parabricks 是一款利用 GPU 加速高通量、高精度的 DNA 和 RNA 测序分析工具,主要用于人类基因组学分析、癌症基因筛查、RNA 测序分析等。目前其中含有 60 多个工具模块,包括基因数据的一致性比对、金标准处理和质量把控、高精度遍体识别等范畴类的多种常用工具。


这一页展示的是 CLARA Parabricks 目前支持的工具模块的部分内容,基本上涵盖了主流的基因测序二级分析中的大部分工具。



使用 CLARA Parabricks 可以实现对典型的应用的加速,它是针对金标准的种系、体细胞和 RNA 的加速工具。而且目前使用 Ampere 架构的 GPU 可以实现 80 倍的加速,精度方面也能够保证,且具有比较灵活的工作流程。


那么谈到这里就要说一下 CLARA Parabricks 的几大特点了。因为它是模块化的工具,所以可以通过各种倾向性的组合,可以灵活选择 CLARA Parabricks 当中的各种模块。


同时刚才提到它的工作流程灵活,是因为它对主流的基因组学分析中的 workflow 管理器都支持,包括 WDL,nextflow 等。此外,它还对 Google 的 DeepVariant 1.4 版本的变体识别工具也做了很好的支持。


接下来我们来看看 Parabricks 的 benchmark。可以看到,列举的几个模块在 GPU 上,同比 CPU 都具有非常好的加速效果。而且在 A100 上可以最高实现 80 倍的加速。这一页展示的就是分别在 2 张、4 张和 8 张 A100 上同比 CPU 实现加速的效果。



同时,在癌症的基因筛查中,端到端的流程也可以在 GPU 上实现比较明显的加速。


2022 年春季 GTC 大会上,NVIDIA 发布了 Hopper 架构的 GPU。该架构的 GPU 对于动态编程做了很好的加速,单就动态编程这一特性,Hopper 架构就比上一代的 Ampere 架构有了 7 倍的理论加速。而在基因组学分析中,动态编程技术是需要被频繁使用到的,也因此,Hopper 架构的 GPU 可以给基因测序带来重大的收益。


上文提到的,斯坦福大学创造的基因测序世界纪录就是借助 NVIDIA CLARA Parabricks 实现的。


这里再跟大家分享一个案例,就是英国的 BioBank 这家公司,他们要处理 50 万个外显子,这些在 CPU 上需要 1 个小时才能得到结果,而 GPU 将这个过程仅仅缩短到了 5 分钟,成本下降了 60%。


这里展示了 CLARA Parabricks 的资料参考页,感兴趣的听众可以登陆 CLARA Parabricks 的网页了解更多的内容。同时,CLARA Parabricks 已经可以在百度智能云上使用了,在云上的 GPU 最佳实践专栏中还提供了 CLARA Parabricks 的使用方式和详尽介绍,感兴趣的同学可以登陆 https://cloud.baidu.com/doc/GPU/s/pl6vzliqu了解更多内容。



在加速三级分析这部分,同样可以使用 GPU 版本的大数据处理 SDK RAPIDS。RAPIDS 是一个端到端的 GPU 加速数据科学的 SDK。它包括数据处理的 SDK cuDF,用于传统机器学习的 SDK cuML,图计算 SDK cuGraph,以及一些可视化的库、众多延伸的库等。基本上 NVIDIA 非深度学习类的 GPU 加速库都在这里了。


单个细胞的三级分析依赖于众多的传统机器学习与大数据的方法,比如回归聚类等算法以及一些可视化的方法。右边展示的就是针对 scRNA 序列处理的聚类,回归与可视化端到端运行的时间。可以看到,使用 GPU 可以降低整体的运行时间。



最后让我们再次回顾一下这张图,NVIDIA GPU 在一级至三级分析上都有相应的解决方案。尤其在二级分析和三级分析上,NVIDIA 提供 CLARA Parabricks 和 RAPIDS 方案,可以带给用户更好的性能与性价比的提升。这也是斯坦福大学利用 GPU 打破基因测序世界纪录的根本原因。


上面提到的这些软件,大家可以登陆 NVIDIA NGC 平台(https://catalog.ngc.nvidia.com/ )下载相应的软件进行体验。


点击查看完整视频内容


推荐阅读

百度智算峰会精彩回顾:加速计算助力智能云深入产业


百度智算峰会精彩回顾:应用驱动的数据中心计算架构演进


即刻点击 “阅读原文” 或扫描下方海报二维码收下这份 GTC22 精选演讲合集清单,在NVIDIA on-Demand 上点播观看主题演讲精选、中国精选、元宇宙应用领域与全球各行业及领域的最新成果!


评论
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 17浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 21浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 19浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 25浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 150浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 100浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 20浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 80浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 92浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 82浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 115浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 128浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 19浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦