人工智能如何改变基因组学?

原创 英伟达NVIDIA中国 2023-04-04 21:19

AI 和加速计算正在为基因组测序流程开辟新的可能性。



全基因组测序领域的进步已经点燃了数字生物学的革命。


随着新一代高通量测序成本的下降,基因组学项目正在世界各地展开。


无论是对患有罕见疾病的危重病人进行测序,还是大规模人群的遗传学研究,全基因组测序正在成为临床工作流程和药物研发的重要一环。


但基因组测序只是第一步。基因组测序数据分析需要通过加速计算、数据科学和 AI 来读取和理解基因组。随着摩尔定律(集成电路中的晶体管数量每两年增加一倍)的终结,人们需要新的计算方法来降低数据分析的成本、提高读取的吞吐量和准确性并最终释放人类基因组的全部潜力。


生物信息学数据的爆发


一个人的全基因组测序会产生约 100GB 的原始数据。而在使用如深度学习和自然语言处理这类复杂的算法和应用对基因组进行测序后,这个数字会增加一倍以上。


伴随着人类基因组测序成本的不断降低,测序数据量呈现指数级增长。


据估计,全人类基因组存储的数据量将在 2025 年达到 40EB,这比存储人类从古至今说过的每一个字所需要的存储空间还高出 8 倍。


许多基因组分析流程正在竭力应对不断产生的大量原始数据。


加速基因组测序分析流程


测序分析十分复杂且需要耗费大量算力,并且还需要许多步骤来检测人类基因组中的遗传变异。


深度学习对于使用基于循环神经网络(RNN)和卷积神经网络(CNN)的模型在基因组仪器内进行碱基检测变得越来越重要。神经网络解读仪器产生的图像和信号数据并对人类基因组的 30 亿个核苷酸对进行推断。这在提高读取准确性的同时确保碱基检测更加实时,进一步加快了从样本到变异检测格式(VCF)再到最终报告的整个基因组分析流程。


在基因组二次分析中,比对技术运用参考基因组来协助重新拼接 DNA 片段测序后的基因组。


领先的比对算法 BWA-MEM 能够帮助研究人员迅速将 DNA 序列读取结果映射到参考基因组上。另一种用于 RNA-seq 数据的黄金标准比对算法 STAR 可通过准确、极速的比对来更好地理解基因表达。


动态规划算法 Smith-Waterman 也被广泛用于比对,在包含一个动态规划加速器的 NVIDIA H100 Tensor Core GPU 上,比对步骤加快了 35 倍。


发现遗传变异


测序项目最关键的阶段之一是变异检测,例如单核苷酸变化、小规模插删或复杂重排。研究人员将在这个阶段检测病人样本和参考基因组之间的差异。这有助于临床医生确定危重病人可能患有的遗传疾病,或帮助研究人员在整个人群中发现新的药物靶标。


经 GPU 优化和加速的检测工具,如博德研究所的 GATK(用于生殖系变异检测的基因组分析工具套件),可以加快分析速度。为了帮助研究人员排除 GATK 结果中的假阳结果,NVIDIA 与博德研究所联合推出了一款利用 CNN 过滤变异的深度学习工具 NVScoreVariants。


基于深度学习的变异检测工具,如谷歌的 DeepVariant,可在无需单独过滤步骤的情况下,提高检测的准确率。DeepVariant 使用 CNN 架构检测变异,通过各基因组平台输出结果的反复微调训练提高检测的准确性。


NVIDIA Clara Parabricks 工具套件中的二次分析软件将这些变异检测工具的速度提高了 80 倍。例如在基于 CPU 的环境中使用 GPU 加速的 Clara Parabricks 可以将 HaplotypeCaller 的运行时间从 16 小时减少到 5 分钟以内。


加速新一轮基因组学浪潮


通过为短读和长读测序平台提供加速的 AI 碱基检测和变异检测,NVIDIA 正在帮助推动下一波基因组学的发展浪潮。行业领导者和初创企业正在与 NVIDIA 一起助力全基因组测序领域的突破。


例如,生物技术公司 PacBio 最近发布了一款采用 NVIDIA Tensor Core GPU 的新型长读长测序系统——Revio。与之前的系统相比,Revio 的算力提高了 20 倍,旨在以低于 1000 美元的成本对人类基因组进行大规模的高精度长读测序。


牛津纳米孔科技有限公司提供了业内仅有的一个单一技术,能够对任何长度的 DNA 或 RNA 片段进行实时测序,使研究人员能够迅速发现更多遗传变异。西雅图儿童医院最近使用高通量纳米孔测序仪 PromethION 在新生儿出生后的几小时内检测遗传性疾病。


Ultima Genomics 正在提供每个样本只需 100 美元的高通量全基因组测序。Singular Genomics 的 G4 测序仪是目前最强大的台式测序系统。 


扫描海报二维码,或点击“阅读原文”,即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!


评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 162浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 189浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 299浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 619浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 477浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 119浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 190浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 209浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 140浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 60浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 151浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 117浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦