他山之石|基因组学是如何用“复杂”分析复杂的?

科创板日报 2022-08-28 21:34

HCare, We Care. 欢迎来到「HCare」专栏,在这里,我们聚焦前沿科技,突破创新。我们将和你分享细胞疗法、基因编辑、分子诊断、AI制药、手术机器人 、AI影像等听起来遥远又实际上离我们很近的技术,你将看到我们对创新的狂热,对世界的好奇和对科学的敬畏。

「HCare」 Vol.22,我们分享如何使用“复杂”的组学思维对生命活动进行整体化的研究分析。

没有人是一座孤岛。

约翰·多恩的这句布道词,描述了现在的人类社会:没有人是一座孤岛,我们绝大多数的活动都是通过和他人互动合作完成的,圣经中关于巴别塔的故事,同样揭示了合作的伟大力量。

人与人之间合作,细胞和细胞之间也会合作,蛋白、核酸之间也会合作。

没有生命是一座孤岛。

生命活动是一个极其复杂的过程,许多功能并不是通过某一组分独立完成的,而是许多因子相互配合,形成复杂的通路乃至网络。同一个因子有时也会兼具多种功能,在不同的条件下发挥不同的作用。研究哪些因子在什么条件下参与了某个功能,因子之间又是怎样配合,成为了科学家面前巨大的难题。

通常,科学家会从单个核酸或者蛋白等因子出发,研究他们在特定条件下独立的功能,然后通过相互作用实验调查能够和他们产生互动的因子,再继续研究这些相关的因子……直到再也没有相关因子被发现。这样一个个排查的方法极其繁琐耗时,而且很容易漏掉许多间接参与作用的因子。 

生命活动和我们的社会一样,充满了各种各样的联系,各个组分相互互动合作,最终完成了生命活动 插画:青柠

要怎么样才能更快更全面地研究生物的某一功能,而不被单一因子的视野束缚的问题,被美国遗传学家Thomas H. Roderick率先提出的组学(Omics)概念很好的回答:

我们不需要拘泥于单一因子的研究,而是将研究对象视为一个整体,用共同特征来研究它们。

用复杂研究复杂,犹如用魔法击败魔法。

“基因组学”是组学这一概念诞生的鼻祖。

自16世纪开始,理性的力量带领人类从神学统治的世界走了出来,科学技术让人类相信未来是能够被过往的重复经验预测的,而不是被上帝计划好的。几个世纪以来,科学始终与稳定、有序、可预测等名词紧密联系在一起。但是生命科学从诞生开始,就一直践行着“凡事总有例外”。

单一的定律或推论只能勾勒出未来的大致轮廓,在细节上却往往存在偏差,一些绝望的人甚至认为生命其实是上帝掷骰子的产物——上帝也不知道自己要做什么。

直到20世纪,科学家慢慢意识到生命并不是一件毫无规律的事情,生命特征受到一些叫做“基因”的遗传密码的控制,生命的活动与功能则大多由蛋白来完成。随着生物化学的发展,“基因”慢慢揭下了她的面纱:通常它存在于由碱基互补配对DNA(脱氧核糖核酸)组成的双螺旋结构里,并通过“转录-翻译”这一过程产生RNA和蛋白质,最后完成生命活动。但基因里究竟包含了什么样的密码,依旧是一个谜。

1977年,Frederick Sanger突破性的使用双脱氧核苷三磷酸链终止法完成了世界上第一次核酸测序,“基因”不再是一个模糊的概念,而变成了一系列可读的核苷酸序列。利用测序技术,科学家相信可以理解“上帝的谜语”,并在世纪末开展了宏伟的“人类基因组计划”,包括中国华大基因在内的研究机构参与了对人类体内的所有基因进行测序的工作,试图破译基因密码。

生命活动并不是上帝掷骰子的结果,但是它极其复杂。全基因组测序虽然破译了基因的编码,以及这些基因在染色体上的位置,但是这些编码意味着什么,执行了怎样的功能,又或者又怎样的相互作用,依旧是一个谜团。

在组学这一概念产生之前,科学家习惯性的将生命因子独立出来研究,像把一个人孤立出来进行观察,就把复杂的问题变成简单的问题。我们也知道,很少有完全独立生活的人,绝大多数的人都会和其他人发生各种各样的关系,基因也是一样。除了基因序列之外的表观遗传等注释系统,基因之间还存在大量的相互作用,一个看似简单的生命活动会同时需要许多基因参与。孤立、简化的研究思路在复杂的基因关系面前显得无所适从。

既然不能用简单的思维分析复杂的问题,那我们就用“复杂”的思维分析复杂的问题。

得益于计算机和测序技术的进步,科学家能够同时分析大量基因数据,这样就可以按照指定特征打包分析一个一系列的基因。用整体的思维研究基因,就是“基因组学”的概念。基因组学的工作不仅包括了对基因本身的序列和功能的研究,还包括了其之间、蛋白与其间相互作用的研究。

每个个体的同一基因并不一定具有完全一致的序列,即使是同一个细胞的同一基因也可能存在序列上的差别,这些在基因组中的微小变化被称为单核苷酸多态性(SNP)。这些多态性在给予生物表征丰富性的同时也暗藏了危险,一个核苷酸序列的变化可能并不会影响一个蛋白的功能,也有可能将一个原本正常的蛋白转变成致癌因子。在单核苷酸多态性以外,基因还存在长度、区域核苷酸序列等许多的多态性。因此,即使对于单一基因的研究,也需要大量的数据完成,任何一个单一团队都无法完成如此浩大的工程。

计算科学的发展让同步大量处理数据不再是令人头疼的事情。现在,科学家只需要寻找合适的样本,就能通过高通量的测序与分析技术对基因进行分析研究。高通量处理让样本在短时间内被完全一致的处理与分析,解决了由于不同实验产生的人为误差,在大量输出数据时保证了结果的一致性。同时,统一的算法模型和可视化处理也使得基因组学分析变得更加简单直观,通过图像就能知道哪些基因之间存在联系。

 

高通量与可视化让组学研究更加便捷直观,原本需要逐个分析的数据,一张图表就能清晰展现各个基因直接的关系 图自github/Micha Sam Brickman Raredon

基因数据库的建立加速了基因组学研究的合作,基因研究的数据能够及时共享并讨论,全世界科学家各显神通,共同描绘基因的神秘蓝图并为疾病研发武器。例如在新冠早期,Moderna等就通过多国团队对新冠病毒的测序结果设计并生产了mRNA疫苗,有效遏制了疾病的传播。

基因组学的概念让科学家能够用“复杂的视角”面对复杂的问题,高保真地获得基因的特征细节以及相互关系,这些大量又必要的信息在进行分析注释之后,在数据库中像自助餐一样被科研人员使用,基因组学极大的推动了生物学的发展。

基因组学还让基因疾病的诊断变得更加快捷。对癌症患者的肿瘤组织进行组学分析,能够精准掌握肿瘤所具备的基因特征,并由此选择最合适的靶向治疗药物;对正常人或肠道菌群进行基因组学分析,能够得出一些疾病的患病风险,及时防患于未然;对胚胎进行组学分析能够在胎儿出生前分析患有遗传疾病的可能,及时作出干预。

在基因组学蓬勃发展后,蛋白质组学紧随而来。

和基因组学类似,蛋白组学也是同时获取并分析一个基因组表达的大量蛋白特征数据,研究一个蛋白质组的功能以及蛋白间的相互关系。但是蛋白具有比核酸更加复杂的高级结构,即使具有同样的氨基酸序列,蛋白的高级结构遭到破坏后也不再能发挥原有的功能。因此,在分析蛋白质的序列组成以外,蛋白质的结构也是组学所关注的重点。

质谱(MS)与2D电泳分析是最经典的蛋白组学分析手段。质谱通过将样品在离子源中电离并通过加速场进入质量分析器,通过电场和磁场的叠加作用得到质谱图,分析物质的质量-电荷比;凝胶电泳则将蛋白全部赋上负电荷,在具有阻力的凝胶电场中运动,来分离分析不同大小的蛋白。

蛋白和核酸一样可以测序,利用化学或蛋白酶将蛋白裂解成简单的肽链结构后,逐步测定每一个小肽段的氨基酸组成,再利用氨基酸序列中的重叠区域排列测序结果,最终得到完整的蛋白质序列。而对于蛋白质的三维结构,利用X射线晶体衍射图谱或核磁共振的方式为蛋白质“拍照片”,再利用计算机比较分析获得较为精准的蛋白质立体结构。

这些传统的生物实验原理看上去很简单,但是会耗费大量的时间和金钱,单次的实验结果也不一定理想。计算生物学的出现彻底引发了蛋白质组学的革命,科学家发现,通过换算分析就可以预测一个基因组中能够产生蛋白的氨基酸序列,通过将这些序列与已知蛋白的结构进行比对,就能够得到较为精准的蛋白质结构。DeepMind团队基于人工智能系统研发的蛋白质结构预测系统AlphaFold则以极高的蛋白质3D结构预测结果彻底颠覆了生物研究,蛋白质组学研究不再是一件困难的事情。

在基因组学、蛋白质组学外,代谢组学、转录组学、功能基因组学等一系列“组学”如雨后春笋般产生,在探索生命奥秘的同时,也利用精准的分析技术为医疗服务。

贝普奥西湖欧米将AI赋能于蛋白组学研究,凭借过硬的蛋白质组学分析能力,助力精准医疗、药物研发与基础研究,与百余家高校、研究所、医院、药物研发机构建立合作。凯莱谱则专注于代谢组学,搭建的CalOmics代谢组学技术平台能够对低分子量代谢产物进行精确统一分析,统计分析并进行代谢通路解读,评估个体或组织细胞的生长状态,为临床治疗提供重要的参考。

组学研究在需要可靠的计算和分析能力外,同样需要可靠的实验设备获得最新最可靠的实验数据。华大智造领衔的基因组学正在服务医疗、农业、健康等行业,为基因组学的研究与应用提供可靠的仪器设备与试剂耗材,自主研发并生产的临床级高通量基因测序仪正在引发肿瘤等临床诊断的革命。齐碳科技专注于纳米孔基因测序仪器与配套试剂,在纳米孔测序高读长的技术优势上优化测序精度,并降低测序成本,为基因组学提供可靠的数据。

生命活动虽然很复杂,我们依然可以使用“复杂”的组学研究思维对生命活动进行整体化的研究分析,凭借平台化和智能化的分析平台,以及高效可靠的分析仪器,当复杂的生命活动遇上复杂的组学,长期来看则会变得简单。

# 参考资料:

[1]Smith, Yolanda. "History of Genomics". *News-Medical*. 04 May 2022. .

[2]Del Giacco, Luca, and Cristina Cattaneo. Introduction to genomics.” *Methods in molecular biology (Clifton, N.J.)* vol. 823 (2012): 79-88. doi:10.1007/978-1-60327-216-2_6

[3]McArdle, Andrew James, and Stephanie Menikou. What is proteomics?.” *Archives of disease in childhood. Education and practice edition* vol. 106,3 (2021): 178-181. doi:10.1136/archdischild-2019-317434

[4]Aizat, Wan Mohd et al. Recent Development in Omics Studies.” *Advances in experimental medicine and biology* vol. 1102 (2018): 1-9. doi:10.1007/978-3-319-98758-3_1

[5]Subramanian, Indhupriya et al. Multi-omics Data Integration, Interpretation, and Its Application.” *Bioinformatics and biology insights* vol. 14 1177932219899051. 31 Jan. 2020, doi:10.1177/1177932219899051

[6]Zhou, Min et al. Multi-omics approaches to improve malaria therapy.” *Pharmacological research* vol. 167 (2021): 105570. doi:10.1016/j.phrs.2021.105570

[7]Zhou, Min et al. Multi-omics approaches to improve malaria therapy.” *Pharmacological research* vol. 167 (2021): 105570. doi:10.1016/j.phrs.2021.105570

科创板日报 国内首个专注科创板、创投及TMT等领域的新锐媒体,致力于打造领先、专业、权威的科创信息服务平台。
评论
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 96浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 100浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 113浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 122浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 100浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 75浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 227浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 86浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 211浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 127浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 172浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 80浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 145浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 161浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 126浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦