初创加速计划|NVIDIA助力深原质药实现基于深度生成的功能蛋白质设计

原创 英伟达NVIDIA中国 2024-02-01 20:45

案例简介



随着 ChatGPT 的出圈,越来越多的人了解了生成式 AI,以及生成式 AI 这个概念。依托 NVIDIA 计算平台,深原质药(dProtein Biotechnology)把生成式 AI 进一步拓展成为了 AIGP,也就是用 AI 来生成蛋白质。这种由 AI 设计得到的蛋白质未来将在药物、检测试剂、合成生物学,乃至医美等领域都扮演重要的角色。深原质药通过自主开发的一系列 AI 算法,配合 NVIDIA 技术,能够为蛋白质相关的设计问题提供全面的解决方案,并已经服务于检测试剂和工具酶、递送载体和蛋白药物等领域的重要合作伙伴。


蛋白质从预测到设计的挑战


AlphaFold2 的成功点燃了生物学家使用 AI 算法的热情。对于生物学中积累的大量数据,人类的智慧还不足以总结出可计算的定理或定律。这正是 AI 可以大显身手的舞台。


AlphaFold2 解决的是“蛋白质结构预测问题”,即给定蛋白质的氨基酸序列,求解这个蛋白质的三维原子坐标结构。由于蛋白质的空间折叠是由其序列所决定的,同时又有很多已知序列信息以及结构信息作为训练数据,所以这方面的 AI 模型已经取得了极大的成功,能够以相当高的精度预测一个蛋白质的空间结构。


不过结构预测并不等同于蛋白质设计,甚至可以说是完全不同的两个问题。如果说结构预测是一次命题考试,那么蛋白质设计则更像是一次开卷考试,很多时候面临着序列、折叠、主链、侧链、结构全都未知的情况。


面对蛋白质设计的挑战,学术界和工业界给出了多种多样的 AI 解决方案。但是这些模型与当前的大模型相比,仍旧显得太过简单,能力也有限。这主要是由于已有的算法主要都基于蛋白质的氨基酸序列进行学习和生成。这种类似字符串的信息虽然便于理解和处理,但是却高度抽象化,与真实的蛋白质结构相去甚远,丢失了大量结构细节信息。因此,当前算法在一些困难问题上的表现不好,比如药物蛋白的设计以及酶的改造设计。


NVIDIA 计算平台助力高效实现

“从结构到结构”蛋白质设计思想


深原质药重新解构了蛋白质设计问题,提出了“从结构到结构”的设计思想,注重真实的三维结构信息,而不是高度抽象化、高度简单化的蛋白质序列信息。在这一框架下,深原质药独立开发了自己的蛋白质设计算法 CUTEDGE。


为了实现在三维空间中解决蛋白质设计问题,深原质药的 AI 团队将标准的二维稳定扩散模型拓展到了三维空间中,构成了 CUTEDGE 算法的基础。由于增加了一个维度,且要维持较高的分辨率以体现结构的细节,于是 CUTEDGE 的模型参数激增至 6.9 亿,比很多主流的蛋白质设计算法提高了一至两个数量级。


为了能够实现这样一个模型的训练,深原质药采用了 NVIDIA 高性能 GPU,配合 NVLink 和超高的显存以及 CUDA 等加速技术。在 NVIDIA 上述技术与产品的加速之下,6.9 亿参数的 CUTEDGE 在单块 NVIDIA 高性能 GPU 上完成单次生成任务(50 步去噪过程)仅需 20 秒的时间。这就使深原质药可以在极短的时间内为客户生成大量的设计蛋白质,以供后续的评估与实验验证。


NVIDIA 全栈技术助力

蛋白质设计从“画”到“讲”


如果说 Midjourney 是以生成式 AI 为画笔在作画,那么 CUTEDGE 就是以生成式 AI 为画笔画出了一个设计蛋白质。不过,当下最成功的 AI 模型无疑是 Transformer,以及以它为基础的各种语言模型。那么,有没有可能让语言模型“讲”出来一个蛋白质呢?


深原质药给出的答案是:当然可以。


目前已经有一些算法采用语言模型去学习蛋白质的序列信息,把一个蛋白质的序列当成一句话,来学习其中的“语法规则”,最终解决某些任务场景下的蛋白质设计问题。


深原质药的“讲”法则完全不同,基于公司独有的“从结构到结构”的理念,将蛋白质的三维结构表征为对应的一组编码,或者说词元表。这样一来就可以用一组词元来对应一个蛋白质三维结构,并输入大语言模型进行学习和生成。


得益于 NVIDIA 的开源框架 Megatron-LM,深原质药在 NVIDIA 高性能 GPU 上进行了并行训练,且训练速度较之前的框架(TensorFLow)提升 8 倍,显存占用率减少约 73%。同时还利用了 NVIDIA 的开源框架 Transformer Engine Apex 实现了使用 FP16 快速地训练语言模型,以及通过 NVIDIA 的开源框架 TensorRT-LLM 提升了语言模型的推理速度(约 5 倍)。最终,深原质药得以通过其“蛋白质结构语言模型”,成功“讲”出了全新的设计蛋白。


目前,深原质药已经形成了以 CUTEDGE、AtomSeg 等算法为核心的一个 AI 算法矩阵,紧密围绕蛋白质设计中的各类痛点问题,给出 AIGP 的解决方案。


开放、共赢


蛋白质设计领域方兴未艾,深原质药深信,“开放、共赢”才能进一步推动这个领域向前发展。为了践行这一理念,深原质药于 2023 年底开放了其 AI 算法矩阵当中的 CUTEDGEopt 和 AtomSeg 的公测,用户可以在深原质药官网找到算法入口,计算自己想要解决的蛋白质设计问题。在 2023 年,深原质药也加入了 NVIDIA 初创加速计划,成为会员公司,将与 NVIDIA 开展更加深入和全面的合作。


在这样一个变革的时代,AI 带来的不仅仅是有趣的对话机器人,更是生产力的又一次跃升。深原质药基于 AI 算法的蛋白质设计,将为众多生物技术公司和创新药物研发企业带来更丰富的研发管线,让 AIGP 真正产生生产力,用更绿色、更安全的蛋白质产品服务于人们。

NVIDIA 初创加速计划


深原质药是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构、创业孵化器、创业加速器、行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣、技术支持、市场宣传、融资对接、业务推荐等一系列服务,加速创业公司的发展。


想获得 NVIDIA 初创加速生态助力?扫描下方二维码,仅需一分钟填写意向申请表单,获得快速联系。



评论 (0)
  •   后勤实验仿真系统平台深度解析   北京华盛恒辉后勤实验仿真系统平台依托计算机仿真技术,是对后勤保障全流程进行模拟、分析与优化的综合性工具。通过搭建虚拟场景,模拟资源调配、物资运输等环节,为后勤决策提供数据支撑,广泛应用于军事、应急管理等领域。   应用案例   目前,已有多个后勤实验仿真系统平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润后勤实验仿真系统平台。这些成功案例为后勤实验仿真系统平台的推广和应用提供了有力支持。   一、核心功能   (一)后勤资源模拟
    华盛恒辉l58ll334744 2025-04-23 15:39 182浏览
  •   电磁频谱数据综合管理平台系统解析   一、系统定义与目标   北京华盛恒辉电磁频谱数据综合管理平台融合无线传感器、软件定义电台等前沿技术,是实现无线电频谱资源全流程管理的复杂系统。其核心目标包括:优化频谱资源配置,满足多元通信需求;运用动态管理与频谱共享技术,提升资源利用效率;强化频谱安全监管,杜绝非法占用与干扰;为电子战提供频谱监测分析支持,辅助作战决策。   应用案例   目前,已有多个电磁频谱数据综合管理平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁频谱数
    华盛恒辉l58ll334744 2025-04-23 16:27 208浏览
  •   通用装备论证与评估系统平台解析   北京华盛恒辉通用装备论证与评估系统平台是服务军事装备全生命周期管理的综合性信息化平台,通过科学化、系统化手段,实现装备需求论证、效能分析等核心功能,提升装备建设效益。   应用案例   目前,已有多个通用装备论证与评估系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润通用装备论证与评估系统。这些成功案例为通用装备论证与评估系统的推广和应用提供了有力支持。   一、系统分层架构   (一)数据层   整合装备性能、作战、试验等多源异
    华盛恒辉l58ll334744 2025-04-24 16:14 121浏览
  • 前言本文主要演示基于TL3576-MiniEVM评估板HDMI OUT、DP 1.4和MIPI的多屏同显、异显方案,适用开发环境如下。Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:VMware16.2.5、Ubuntu22.04.5 64bitU-Boot:U-Boot-2017.09Kernel:Linux-6.1.115LinuxSDK:LinuxSDK-[版本号](基于rk3576_linux6.1_release_v
    Tronlong 2025-04-23 13:59 146浏览
  •   有效样本分析决策系统平台全面解析   一、引言   北京华盛恒辉有效样本分析决策系统在当今数据驱动的时代,企业、科研机构等面临着海量数据的处理与分析挑战。有效样本分析决策系统平台应运而生,它通过对样本数据的精准分析,为决策提供有力支持,成为提升决策质量和效率的关键工具。   应用案例   目前,已有多个有效样本分析决策系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润有效样本分析决策系统。这些成功案例为有效样本分析决策系统的推广和应用提供了有力支持。   二、平台概述
    华盛恒辉l58ll334744 2025-04-24 11:13 104浏览
  • 故障现象一辆2016款奔驰C200L车,搭载274 920发动机,累计行驶里程约为13万km。该车组合仪表上的防侧滑故障灯、转向助力故障灯、安全气囊故障灯等偶尔异常点亮,且此时将挡位置于R挡,中控显示屏提示“后视摄像头不可用”,无法显示倒车影像。 故障诊断用故障检测仪检测,发现多个控制单元中均存储有通信类故障代码(图1),其中故障代码“U015587 与仪表盘的通信存在故障。信息缺失”出现的频次较高。 图1 存储的故障代码1而组合仪表中存储有故障代码“U006488 与用户界
    虹科Pico汽车示波器 2025-04-23 11:22 112浏览
  •   陆地边防事件紧急处置系统平台解析   北京华盛恒辉陆地边防事件紧急处置系统平台是整合监测、预警、指挥等功能的智能化综合系统,致力于增强边防安全管控能力,快速响应各类突发事件。以下从系统架构、核心功能、技术支撑、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个陆地边防事件紧急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地边防事件紧急处置系统。这些成功案例为陆地边防事件紧急处置系统的推广和应用提供了有力支持。   一、系统架构   感知层:部
    华盛恒辉l58ll334744 2025-04-23 11:22 128浏览
  •   海上训练与保障调度指挥平台系统解析   北京华盛恒辉海上训练与保障调度指挥平台系统是现代海上作战训练的核心枢纽,融合信息技术、GIS、大数据及 AI 等前沿技术,旨在实现海上训练高效组织、作战保障科学决策。以下从架构功能、应用场景、系统优势及发展挑战展开解读。   应用案例   目前,已有多个海上训练与保障调度指挥平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润海上训练与保障调度指挥平台。这些成功案例为海上训练与保障调度指挥平台的推广和应用提供了有力支持。   一
    华盛恒辉l58ll334744 2025-04-24 15:26 115浏览
  •   陆地装备体系论证与评估综合平台系统解析   北京华盛恒辉陆地装备体系论证与评估综合平台系统是契合现代军事需求而生的专业系统,借助科学化、智能化手段,实现对陆地装备体系的全方位论证与评估,为军事决策和装备发展提供关键支撑。以下从功能、技术、应用及展望展开分析。   应用案例   目前,已有多个陆地装备体系论证与评估综合平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地装备体系论证与评估综合平台。这些成功案例为陆地装备体系论证与评估综合平台的推广和应用提供了有力支持。
    华盛恒辉l58ll334744 2025-04-24 10:53 116浏览
  •   无人机结构仿真与部件拆解分析系统平台解析   北京华盛恒辉无人机结构仿真与部件拆解分析系统无人机技术快速发展的当下,结构仿真与部件拆解分析系统平台成为无人机研发测试的核心工具,在优化设计、提升性能、降低成本等方面发挥关键作用。以下从功能、架构、应用、优势及趋势展开解析。   应用案例   目前,已有多个无人机结构仿真与部件拆解分析系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机结构仿真与部件拆解分析系统。这些成功案例为无人机结构仿真与部件拆解分析系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-23 15:00 213浏览
  •   航空兵训练与战术对抗仿真平台系统解析   北京华盛恒辉航空兵训练与战术对抗仿真平台系统是现代军事训练的关键工具,借助计算机技术构建虚拟战场,支持多兵种协同作战模拟,为军事决策、训练及装备研发提供科学依据。   应用案例   目前,已有多个航空兵训练与战术对抗仿真平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润航空兵训练与战术对抗仿真平台。这些成功案例为航空兵训练与战术对抗仿真平台的推广和应用提供了有力支持。   一、系统架构与核心功能   系统由模拟器、计算机兵力生
    华盛恒辉l58ll334744 2025-04-24 16:34 127浏览
  •   高海拔区域勤务与装备保障调度系统平台解析   北京华盛恒辉高海拔区域勤务与装备保障调度系统平台专为高海拔特殊地理环境打造,致力于攻克装备适应、人员健康保障、物资运输及应急响应等难题。以下从核心功能、技术特点、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个高海拔区域勤务与装备保障调度系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润高海拔区域勤务与装备保障调度系统。这些成功案例为高海拔区域勤务与装备保障调度系统的推广和应用提供了有力支持。   一、核心
    华盛恒辉l58ll334744 2025-04-24 10:13 109浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦