资源预览内容
第1页 / 共8页
第2页 / 共8页
第3页 / 共8页
第4页 / 共8页
第5页 / 共8页
第6页 / 共8页
第7页 / 共8页
第8页 / 共8页
亲,该文档总共8页全部预览完了,如果喜欢就下载吧!
资源描述
分子进化与系统进化树的构建分子进化与系统进化树的构建$ L9 C6 e8 6 O主要内容:$ f# P$ u6 A# u7 W% F1、分子进化的研究方法, M o- y7 g6 1 O+ i. + 3 u2、系统进化树的构建方法4 Y; S; q0 Z4 _* m: s3、系统进化树构建常用软件汇集# ?: m2 v: G/ 6 I- U4、系统进化树构建方法及软件的选择0 * Sq1 c3 n / 5、Phylip分子进化分析软件包简介及使用+ X1 k, C+ b2 : 0 D6、如何利用MEGA3.1构建进化树% x! e- H. A( / M9 s; Y7 U. x) C; d1 M D% q6 I7 p s声明:, 5 P8 u* $ A6 2 Qh1、本篇涉及的资源主要源于网络及相关书籍,由酷友搜集、分析、整理、审改,供大家学习参考用,如有转载、传播请注明源于基因酷及本篇的工作人员;若本篇侵犯了您的版权或有任何不妥,请Email genecool126.com告知。% X2 n; # / Q F* 2、由于我们的学识、经验有限,本篇难免会存在一些错误及缺陷,敬请不吝赐教:请到基因酷论坛(www.genecool.com/bbs)本篇对应的专题跟贴指出或Email genecool126.com。! R B% 7 M7 o7 K/ B; W: b# T7 q) : C 致谢:( j r9 v3 ?. l5 Z& S, v4 B整编者:flashhyh: y$ 0 l) h; * s* E: 主要参考资料:生物信息学札记 樊龙江;分子进化分析与相关软件的应用 作者不详;进化树构建 ZHAO Yangguo;如何用MEGA 3.1构建进化树 作者不详;MEGA3指南 作者不详;# ?( r, F9 ! 分子进化的研究方法分子进化的研究方法2 D. 5 b8 u. K$ S# 分子进化研究的意义+ Q/ Y8 x1 j6 ?4 X7 _8 自20世纪中叶,随着分子生物学的不断发展,进化研究也进入了分子进化(molecularevolution)研究水平,并建立了一套依赖于核酸、蛋白质序列信息的理论和方法。随着基因组测序计划的实施,基因组的巨量信息对若干生物领域重大问题的研究提供了有力的帮助,分子进化研究再次成为生命科学中最引人注目的领域之一。这些重大问题包括:遗传密码的起源、基因组结构的形成与演化、进化的动力、生物进化等等。分子进化研究目前更多地是集中在分子序列上,但随着越来越多生物基因组的测序完成,从基因组水平上探索进化奥秘,将开创进化研究的新天地。# d/ xG$ r m/ r7 i 分子进化研究最根本的目的就是从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。通过核酸、蛋白质序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律。0 S V2 x/ S2 W! g+ G( ( W, Y% V; z& Z: 4 l/ t3 / w3 a+ s分子进化研究的基础$ D3 Q( I ?4 C3 |9 T 假设:核苷酸和氨基酸序列中含有生物进化历史的全部信息。$ c7 M; m H# S y% B2 A) W 分子钟理论:在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。如下图:: E9 d9 g7 Po ?) + Y% + 直系同源与旁系同源7 C& q1 I S# Lx5 Z, k 直系同源(orthologs):同源的基因是由于共同的祖先基因进化而产生的;8 # ! sp. Z( 9 z7 D 旁系同源(paralogs):同源的基因是由于基因复制产生的。$ C0 F. ?. BY# z0 _+ y 两者之间的关系如下图所示:6 0 r+ y- x( : w d2 C q( d$ S. _ 3 A _: Y/ u) p 注:用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。 s, V* H- ) i9 % s1 W( |$ g3 分子进化研究的基本方法* j* T/ 6 v8 S! a& & g 对于进化研究,主要通过构建系统发育过程有助于通过物种间隐含的种系关系揭示进化动力的实质。9 n) e N- e# h 表型的(phenetic)和遗传的(cladistic)数据有着明显差异。Sneath和Sokal(1973)将表型性关系定义为根据物体一组表型性状所获得的相似性,而遗传性关系含有祖先的信息,因而可用于研究进化的途径。这两种关系可用于系统进化树(phylogenetictree)或树状图(dendrogram)来表示。表型分枝图(phenogram)和进化分枝图(cladogram)两个术语已用于表示分别根据表型性的和遗传性的关系所建立的关系树。进化分枝图可以显示事件或类群间的进化时间,而表型分枝图则不需要时间概念。文献中,更多地是使用“系统进化树”一词来表示进化的途径,另外还有系统发育树、物种树(speciestree)、基因树等等一些相同或含义略有差异的名称. 系统进化树分有根(rooted)和无根(unrooted)树。有根树反映了树上物种或基因的时间顺序,而无根树只反映分类单元之间的距离而不涉及谁是谁的祖先问题。下图表示了4个物种部分有根树和无根树形式:! f8 I3 h+ D# Q+ 2 B0 f8 s# # 3 G/ F; R, T# k; a! % Y3 L- F* o; X 用于构建系统进化树的数据有二种类型:一种是特征数据(characterdata),它提供了基因、个体、群体或物种的信息;二是距离数据(distancedata)或相似性数据(similaritydata),它涉及的则是成对基因、个体、群体或物种的信息。距离数据可由特征数据计算获得,但反过来则不行。这些数据可以矩阵的形式表达。距离矩阵(distancematrix)是在计算得到的距离数据基础上获得的,距离的计算总体上是要依据一定的遗传模型,并能够表示出两个分类单位间的变化量。系统进化树的构建质量依赖于距离估算的准确性。系统进化树的构建方法系统进化树的构建方法3 QE W# |; R 系统树的构建主要有三种方法:0 o4 L5 I+ _ I1 t+ B/ k距离矩阵法(distance matrix method)是根据每对物种之间的距离,其计算一般很直接,所生成的树的质量取决于距离尺度的质量。距离通常取决于遗传模型。+ 1 v- S- c% S o: k最大简约(maximum parsimony)法较少涉及遗传假设,它通过寻求物种间最小的变更数来完成的。) U/ : E. v 4 b1 $ B 对于模型的巨大依赖性是最大似然(maximum likelihood)法的特征,该方法在计算上繁杂,但为统计推断提供了基础。% O1 G# T7 B+ x P5 V5 t/ i7 t Mr* b距离矩阵法1 n9 Y8 F0 a 首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系。这里的遗传距离为所有成对实用分类单位(operational taxonomic units,OTU)之间的距离。用这些距离对OUT进行表型意义的分类可借助于聚类分析(clustering),聚类过程可以看作是鉴别具有相近OUT类群的过程。: kM* X9 & R4 A8 Q. X 由进化距离构建进化树的方法很多,常用有如下几种:- A & - P! % P 平均连接聚类法(UPGMA法):聚类的方法很多,包括序贯法(sequential)、聚合法(agglomerative)、分层法(hierarchical)和非重叠法(nonoverlapping)等。应用最广泛的是平均连接聚类法(average linkage clustering)或称为UPGMA法(应用算术平均数的非加权成组配对法,unweighted pair-group method using anarithmetic average)。该法将类间距离定义为两个类的成员所有成对距离的平均值,广泛用于距离矩阵。Nei等模拟了构建树的不同方法,发现当沿树上所有分枝的突变率相同时,UPGMA法一般能够得到较好的结果。但必须强调有关突变率相等(或几乎相等)的假设对于UPGMA的应用是重要的。另一些模型研究(如Kim和Burgman)已证实当各分枝的突变率不相等时,这一方法的结果不尽人意。当各分枝突变率相等时,认为分子钟(molecularclock)在起作用。( m2 O% v( R B2 i* f% f- K Fitch-Margoliash Method(FM法):UPGMA法包含这样的假定:沿着树的所有分枝突变率为常数。Fitch和Margoliash(1967)所发展的方法去除了这一假定。该法的应用过程包括插入“丧失的”OUT作为后面OUT的共同祖先,并每次使分枝长度拟合于3个OTU组。 G$ ! B) L0 P, E. M Margoliash担心他们的法则所得到的拓扑结构可能是不完全正确的,并建议考查其它的拓扑结构。可以采用Fitch和Margoliash(1967)称之为“百分标准差”的一种拟合优度来比较不同的系统树,最佳系统树应具有最小的百分标准差。根据百分标准差选择系统树,其最佳系统树可能与由Fitch-Margoliash法则所得的不相同。当存在分子钟时,可以预期这一标准差的应用将给出类似于UPGMA方法的结果。如果不存在分子钟,因而在不同的世系(分枝)中的变更率是不同的,则Fitch-Margoliash标准就会比UPGMA好得多。通过选择不同的OUT作为初始配对单位,就可以选择其它的系统树进行考查。具有最低百分标准差的系统树即被认为是最佳的,并且这个标准是建立在应用Fitch- Margoliash算法的基础上的。7 K* D) N: K) r# FM算法的基本步骤:9 z/ v9 nl$ Z2 ) Q1、找出关系最近的序列对,如A和B! g% t% f4 y- x* _K ib2、将剩余的序列作为一个简单复合序列,分别计算A、B到所有其他序列的距离的平均值4 G$ J& ; B- F 1 w0 _! 3 n4 p3、用这些值来计算A和B间的距离( a6 Rj% X) P( m3 V7 s- + B0 _4、将A、B作为一个单一的复合序列AB,计算与每一个其他序列的距离,生成新的距离矩阵6 U# _( q G) a9 g3 tb5、确定下一对关系最近的序列,重复前面的步聚计算枝长3 K5 xu- V% U/ I6、从每个序列对开始,重复整个过程 T. a9 p6 - m7、对每个树计算每对序列间的预测距离,发现与原始数据最符合的树0 q5 l) P. 9 J1 xw6 Z Neighbor-JoiningMethod(NJ法/邻接法):邻接法(Neighbor-joiningMethod)由Saitou和Nei(1987)提出。该方法通过确定距离最近(或相邻)的成对分类单位来使
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号