写在前面
这个生物学这个东西,最近不知道为什么越学越迷离;有很多时候甚至不清楚自己做的是什么,主要的原因可能还是不是生物自家出身,有很多基础的生物学内容几乎就是空白。
还是希望能通过这样的方式,稍稍明白明白自己在干点什么
什么是系统生物学
系统生物学(systems biology),是一个使用整体论(而非还原论)的方式, 整合不同学科、层次的信息,以研究、分析、理解(即多组学整合分析)生物系统如何行使功能的学术领域。系统生物学通过研究各个生物系统内部所有组成成分间,各分子层面上的相互关系和相互作用(例如,与细胞信号传送、代谢通路[1]、细胞器、细胞、生理系统与生物等相关的基因和蛋白网络),期望最终能够建立整个系统的可理解模型,以及为有机体绘制完整图谱。系统生物学使用计算机模拟,数学分析的方法来构建复杂生物系统的模型。
系统生物学不同于以往只注意个别的基因和蛋白质的实验生物学,研究所有的基因、所有的蛋白质和组分间的所有相互关系;其目标是:对复杂的生物系统构建计算的数学模型,从总体上预测生物系统的真实性。特别是从2000年开始,这个概念在各种环境下被广泛用于生物学。人类基因组计划是生物学中应用系统思维的一个例子,它导致新的合作的方式来处理在遗传学生物学领域的问题。系统生物学的目标之一是模拟和发现涌现的特性,细胞的,组织的和生物体的特性,作为一个系统,其理论描述只能用系统生物学的技术进行[2]。这些通常涉及代谢网络或细胞信号传送网络[1]。
系统生物学开始于对基因和蛋白质的研究,该研究使用高通量技术来测定某物种在给定条件干涉下基因组和蛋白质组的变化。研究基因组的高通量技术包括用来测定mRNA变化的生物芯片技术。高通量蛋白质组学方法包括质谱,该技术用于鉴定蛋白质,检测蛋白修饰和量化蛋白质表达水平。
上面这段是摘自Wiki
一些哲学思考
- 系统生物学与合成(synthesis)的观点
系统生物学试图由合成的角度看生物学,合成的观点选择面对子系统不独立的可能性,而希望寻找新的方法来解决子系统间交互作用的问题。就像是研究任何一个科学问题一样,解决这问题的第一个步骤是有系统地收集这些交互作用的信息。在过去采用化约论的观点看问题时,在用一个新的观点诠释问题时,才会注意到过去那些被忽视的信息。佛来明发现抗生素时,并不是因为只有他观察到这现象,而是因为只有他重视这现象。因此能够灵活地由不同的尺度,不同的观点看问题时,才容易有新的发现。
传统生物学假设细胞是一个黑盒子,我们可以加入物质(例如养份或抑制剂),或制作突变株来扰动这未知的系统,再做实验上的观察。系统生物学在设计实验时,所测量的数值或许与过去所差不多,可是使用巨量分析的技术收集大量数据,而解释数据的观点也不相同,甚至会引入许多生物学者不熟悉的分析方式。这种先收集大量数据,再做理论分析的研究方法是比较有效率的方式,可在同样的时间内由不同的专家“平行”地研究不同的路径。更重要的是这种研究方式,让我们有机会观察到许多路径间的交互作用,这是在针对单一路径做研究时不容易看见的信息,因此才有机会由合成的角度分析生物学。在发展遗传工程学时,曾经淘汰了一批不习惯用这样方式思考的人,也让学习这种思考方式的人有了飞快的进展。系统生物学的观点是否相当于过去遗传工程学对生物学的冲击,不同的人或许有不同的见解,可是可以确认的是它会发现一些过去忽视的现象,而且能与化约的观点互补。或许现在发展系统生物学的时机尚未成熟,可是我们是要创造时势,或是在未来追随时代的潮流,是我们应该思考的问题。
- 生物信息学是过渡到未来生物学的重要工具
未来的生物学究竟是否会综合化约与合成的观点来建立生物学的理论架构虽然尚不明朗,可以确认的是生物信息学的工具将像遗传工程技术那样的深入到每个生物学实验室。这种新的工具是这两种观点都需要的工具,它不但能被动地节省做分析的人力,也能主动地引入“由信息驱动的生物医学研究”。这种新的研究方式强调由数据中做观察,比较,进而提出假设,再以实验方法做验证。这种利用“信息探采(data mining)”的研究模式,与传统实验生物学的搭配,将使我们能更有效率地发现新的现象,因此生物信息学将使我们能更早地进展到有理论架构的未来生物学。
综合而言,基因体分析等研究为我们累积了巨量的数据,而生物信息学可协助我们利用这些数据加速做新的观察之速率,因此有机会由整体的、合成的角度检视生物学,而建立所谓的系统生物学。未来的生物学很可能透过灵活地、交错地运用化约与合成两种观点,建立起生物学的理论架构,使传统生物学由描述性的科学,转型变成一种分析性的未来生物学。
系统理论和系统思想对于我国知识分子并不陌生。1980年在我国学术界曾经流行过“三论”——系统论、信息论和控制论,其中的“系统论”是指奥地利科学家贝塔朗菲(L. Bertalanffy)在1970年创立的“一般系统论”(general system theory)。尽管贝塔朗菲是以生物学家的身份去思考、研究并提出系统论的,但他的系统论并不仅仅适用于生命科学,而且适用于物理学、心理学、经济学和社会科学等各门学科。如果说过去所谈论的是指在哲学层面上的、普适性强的一般系统论,那么本文所要介绍的系统生物学(systems biology),则是生命科学研究领域的一门新兴学科。
作为人类基因组计划的发起人之一,美国科学家莱诺伊•胡德(Leroy Hood)也是系统生物学的创始人之一。在胡德看来,系统生物学和人类基因组计划有着密切的关系。正是在基因组学、蛋白质组学等新型大科学发展的基础上,孕育了系统生物学。反之,系统生物学的诞生进一步提升了后基因组时代的生命科学研究能力。正如胡德所说,“系统生物学将是21世纪医学和生物学的核心驱动力”[1]。基于这一信念,胡德在1999年年底辞去了美国西雅图市华盛顿大学的教职,与另外两名志同道合的科学家一起创立了世界上第一个系统生物学研究所(Institute for Systems Biology)。随后,系统生物学便逐渐得到了生物学家的认同,也唤起了一大批生物学研究领域以外的专家的关注。2002年3月,美国《科学》周刊登载了系统生物学专集。该专集导论中的第一句话这样写道:“如果对当前流行的、时髦的关键词进行一番分析,那么人们会发现,‘系统’高居在排行榜上。”
- 什么是系统生物学?
根据胡德的定义,系统生物学是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科。也就是说,系统生物学不同于以往的实验生物学——仅关心个别的基因和蛋白质,它要研究所有的基因、所有的蛋白质、组分间的所有相互关系。显然,系统生物学是以整体性研究为特征的一种大科学。
系统生物学的基本工作流程有这样四个阶段。首先是对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内和细胞间的作用机理,以此构造出一个初步的系统模型。第二步是系统地改变被研究对象的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况下系统组分或结构所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,并把得到的有关信息进行整合。第三步是把通过实验得到的数据与根据模型预测的情况进行比较,并对初始模型进行修订。第四阶段是根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精练。系统生物学的目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。
- 系统生物学的灵魂——整合
作为后基因组时代的新秀,系统生物学与基因组学、蛋白质组学等各种“组学”的不同之处在于,它是一种整合型大科学。首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等)整合在一起进行研究。系统生物学研究所的第一篇研究论文,就是整合酵母的基因组分析和蛋白质组分析,研究酵母的代谢网络。由于不同生物分子的研究难度不一样,技术发展程度不一样,目前对它们的研究水平有较大的差距。例如,基因组和基因表达方面的研究已经比较完善,而蛋白质研究就较为困难,至于涉及生物小分子的代谢组分的研究就更不成熟。因此,要真正实现这种整合还有很长的路要走。
对于多细胞生物而言,系统生物学要实现从基因到细胞、到组织、到个体的各个层次的整合。《科学》周刊系统生物学专集中一篇题为“心脏的模型化——从基因到细胞、到整个器官”的论文,很好地体现了这种整合性。我们知道,系统科学的核心思想是:“整体大于部分之和”;系统特性是不同组成部分、不同层次间相互作用而“涌现”的新性质;对组成部分或低层次的分析并不能真正地预测高层次的行为。如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个带根本性的挑战。
系统生物学整合性的第三层含义是指研究思路和方法的整合。经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。首先是在DNA水平上寻找特定的基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研究的基础上,研究蛋白质的空间结构,蛋白质的修饰以及蛋白质间的相互作用等等。基因组学、蛋白质组学和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万基因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研究。此外,系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学、计算机科学等各种学科的共同参与。
系统生物学的整合性可以体现在两种不同的策略上。第一种就是胡德和系统生物学研究所采用的方式,选定一个较为简单的系统,如单细胞生物酵母,然后分析尽可能多的构成成分——基因组、转录组、蛋白质组、相互作用组,以揭示整个系统的行为。另外一种策略是吉尔曼(A. G. Gilman)领导的“信号转导联军”采用的,以一个较为复杂的系统(G蛋白介导的和与其相关的细胞信号转导系统)为研究对象,采用尽可能多的研究手段去进行分析。
- 系统生物学的基础——信息
在前分子生物学时代,生物学家把生命视为具有特殊“活力”的有机体,遵循着无机界不存在的法则进行生命活动。在分子生物学时代,研究者们把生命视为一架精密的机器,由基因和蛋白质根据物理、化学的规律来运转。在后基因组时代,像胡德这种类型的科学家,把生命视为信息的载体,一切特性都可以从信息的流动中得到实现。
胡德提出,应该把生物学视为一门信息科学。这个观点包含有三层意思。首先,生物学研究的核心——基因组,是数字化的(digital)。生物学与所有其他学科,如物理学、化学、地理学,是完全不一样的科学,因为生物学以外的学科都只能通过类比的方式(analog)进行分析。既然生物学研究的核心是数字化的,因此生物学可以被完全破译。从理论上说,我们对生物学的把握应该超过其他任何一门学科。其次,生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的基因,第二类信息是指控制基因行为的调控网络。显然,由一段DNA序列组成的基因是数字化的。值得强调的是,基因调控网络的信息从本质上说也是数字化的,因为控制基因表达的转录因子结合位点也是核苷酸序列。生物学是信息科学的第三层意思是,生物信息是有等级次序的,而且沿着不同的层次流动。一般说来,生物信息以这样的方向进行流动:DNA→mRNA→蛋白质相互作用网络→细胞→器官→个体→群体。这里要注意的是,每个层次信息都对理解生命系统的运行提供有用的视角。因此,系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合。
根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。换一个角度来说,生命是远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换能量,以抵消其熵增过程。奥地利物理学家薛定谔早在1940年发表的著作《生命是什么?》中就已指出,生命以“负熵流”为食,而“负熵”其实就是信息的另一种表示方法。因此,我们可以这样说,生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信息的运行规律。
- 系统生物学的钥匙——干涉
系统生物学一方面要了解生物系统的结构组成,另一方面是要揭示系统的行为方式。相比之下,后一个任务更为重要。也就是说,系统生物学研究的并非一种静态的结构,而是要在人为控制的状态下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力学特征。
凡是实验科学都有这样一种特征:人为地设定某种或某些条件去作用于被实验的对象,从而达到实验的目的。这种对实验对象的人为影响就是干涉(perturbation)。传统生物学采用非干涉方法如形态观察或分类研究生物体。20世纪形成的分子生物学等实验生物学的特点就是,科学家可以在实验室内利用各种手段干涉生物学材料,如通过诱导基因突变或修饰蛋白质,由此研究其性质和功能。系统生物学同样也是一门实验性科学,也离不开干涉这一重要的工具。
系统生物学中的干涉有这样一些特点。首先,这些干涉应该是有系统性的。例如人为诱导基因突变,过去大多是随机的;而在进行系统生物学研究时,应该采用的是定向的突变技术。上面所提到的对酵母的系统生物学研究,胡德等人就是把已知的参与果糖代谢的9个基因逐一进行突变,研究在每一个基因突变下的系统变化。果蝇从受精开始到形成成熟个体一共有66个典型的发育阶段,不久前科学家利用基因芯片技术,对每一个发育阶段的基因表达谱进行了系统的研究。这也是一类系统性的干涉方式。其次,系统生物学需要高通量的干涉能力,如高通量的遗传变异。现有技术已经能做到在短时间内,把酵母的全部6000多个基因逐一进行突变。对于较为复杂的多细胞生物,可以通过RNA干涉新技术来实现大规模的基因定向突变。随着研究技术的发展,一定还会有许多新的干涉技术应用于系统生物学。
需要提请人们注意的是,以测定基因组全序列或全部蛋白质组成的基因组研究或蛋白质组研究等“规模型大科学”,并不属于经典的实验科学。这类工作中并不需要干涉,其目标只是把系统的全部元素测定清楚,以便得到一个含有所有信息的数据库。胡德把这种类型的研究称为“发现的科学”(discovery science),而把上述依赖于干涉的实验科学称为“假设驱动的科学”(hypothesis-driven science),因为选择干涉就是在做出假设。系统生物学不同于一般的实验生物学就在于,它既需要“发现的科学”,也需要“假设驱动的科学”。首先要选择一种条件(干涉),然后利用“发现的科学”的方法,对系统在该条件下的所有元素进行测定和分析;在此基础上做出新的假设,然后再利用“发现的科学”研究手段进行新研究。这两种不同研究策略和方法的互动和整合,是系统生物学成功的保证。
- 系统生物学的另一个特点——对理论的依赖和建立模型的需求。
系统生物学的理想就是要得到一个尽可能接近真正生物系统的理论模型;建模过程贯穿在系统生物学研究的每一个阶段。离开了数学和计算机科学,就不会有系统生物学。也许正是基于这一考虑,科学家把系统生物学分为“湿”的实验部分(实验室内的研究)和“干”的实验部分(计算机模拟和理论分析)。“湿”、“干”实验的完美整合才是真正的系统生物学。
从某种意义上说,系统生物学在中国有很好的基础。我们的传统医学就是把人体视为一个系统,通过测定和改变系统的输入和输出来调节系统的状态。传统科学的缺点在于,它只能进行“黑箱操作”,不能解释系统的内部组成成分和动力学过程。而系统生物学则把生物系统化为“白箱”,不仅要了解系统的结构和功能,而且还要揭示出系统内部各组成成分的相互作用和运行规律。
相关的领域
- 表型组学 Phenomics
- 基因组学
- 表观遗传学
- 转录组
- 蛋白质组学
- 代谢物组学
- 糖组学
- 脂类组学 Lipidomics
- 相互作用组学 Interactomics
- 代谢组学 Fluxomics
- 生物组学 Biomics
大大的疑问和困惑
- 多组学联合分析居然也算是系统生物学的范畴吗?(看来已经做了一段时间了)
- 开发的那些不知道是什么东西的小玩意