分子进化树不仅精确的反应物种间或群体间在进化过程中发生的极微细的遗传变异,而且借助化石提供的大分子类群的分化年代能定量的估计出物种间或群体间的分化年代,这对进化的研究无疑使一种革命。进化树又名系统树,已发展为多学科,包括遗传学,分类学,分子生物学,生物化学,生态学,又包括概率统计,计算机科学群论等的一个多交叉边缘领域。当今不同的构树法,大体分为3类:简约法(parsimony);距离矩阵法(distance matrix methods);最大似然法(maximum likelihood methods)。
距离矩阵法是简单计算两个序列的差异数量。这个数量被看做进化距离,其准确大小依赖于进化模型的选择。然后运行一个聚类算法,从最相似的序列开始,通过距离值方阵计算出实际的进化树,或者通过将总的树枝长度最小化而优化出进化树。简约法搜索进化树的原理是用最小的改变来解释所要研究的分类群之间的观察到的差异。最大似然法评估所选定的进化模型能够产生实际观察到的数据可能性。进化模型可能只是简单的假定所有核苷酸之间相互转变的概率一样。程序会把所有可能的核苷酸轮流放置在进化树的内部节点上,并且计算每一个这样序列产生实际数据的可能性。所有可能的几率被加总,产生一个特定位点的似然值,然后这个数据集的所有比对位点的似然值的总和就是整个进化树的似然值。
1.4 同源建模
同源建模又称为比较建模,其原理是序列相似则结构相似,即存在同源关系的两条序列具有相似的结构。当两条序列的同源性大于30%时,序列的同源性能够暗示两者结构相似序列的同源性越高则结构,模型的准确性越高[10],但是如果蛋白质同源性低于25%,利用同源建模的模型准确率大大降低,不适合用于研究。
同源建模一般是以下步骤的循环,直到得出满意的结果:(1)寻找已知结构的蛋白质作为模板;(2)目标和模板的序列比对;(3)以模板结构为原型,构建目标的主链结构模型;(4)在目标模板比对中形成空位的区域,使用环区建模得到完整的主链结构模型;(5)构建并优化模型的侧链;(6)对整个结构模型进行优化。其中决定模型的准确性和可信度的关键步骤是目标与模板的序列比对和环区建模。
对于构建的模型,可以采用拉氏构象图(Ramachandran Plot)来鉴定基本骨架的构象是否合理,以此来评估模型的准确度。拉氏图是在 1963 年被 G.N.Ramachandra,C.Ramakrishnan 和V.Sasisekharan 提出来的,是一种使蛋白质结构中主链氨基酸残基的二面角(Φ、Ψ)可视化的方法。拉式图是以 Φ 为横坐标,以 Ψ 为纵坐标,主链氨基酸残基的二面角落在坐标图上。统计拉式图包括三个区域:1.一般允许区:在图中表现为实线封闭区域,出现在此区域内的任何二面角确定的构象都是被允许的,且构象稳定;2.最大允许区域:在图中表现为虚线封闭区域,处于此区域内的氨基酸残基在结构上是允许的,但构象不够稳定:3.不允许区域:在图中表现为虚线外区域,是该区域内任何二面角确定的肽链构象,都是不允许的。
搜寻出已知结构的同源蛋白质作为模板是进行同源建模必要条件,这个步骤可以通过搜索蛋白质结构数据库来完成。一般从目标序列出发搜索PDB蛋白质结构数据库,得到有已知结构的同源序列,选取一个或几个作为目标序列的模板。同源建模中最核心的步骤是目标模板比对,比对的准确性决定了主链建模和模型优化的准确性。目标和模板比对相当于确定结构保守区,目标和模板这部分的结构是一致的。一般通过多重序列比对来实现,插入空位使各序列长度相同,通过调整空位的位置尽量使相同或相似的氨基酸对齐。
- 上一篇:茚枳碱的合成工艺研究+文献综述
- 下一篇:几种有机溶剂对面包酵母γ-癸内酯合成的影响
-
-
-
-
-
-
-
NFC协议物理层的软件实现+文献综述
上市公司股权结构对经营绩效的影响研究
高警觉工作人群的元情绪...
中国传统元素在游戏角色...
现代简约美式风格在室内家装中的运用
江苏省某高中学生体质现状的调查研究
g-C3N4光催化剂的制备和光催化性能研究
C++最短路径算法研究和程序设计
浅析中国古代宗法制度
巴金《激流三部曲》高觉新的悲剧命运