资源预览内容
第1页 / 共8页
第2页 / 共8页
第3页 / 共8页
第4页 / 共8页
第5页 / 共8页
第6页 / 共8页
第7页 / 共8页
第8页 / 共8页
亲,该文档总共8页全部预览完了,如果喜欢就下载吧!
资源描述
基因组的分子进化与群体遗传学本文首先从两个方面介绍基因组的分子进化:第一是基因组的图景,集中于 塑造在各种各样的基因组特征中观察到的模式的进化过程,例如非编码DNA进 化、基因的突变速率和重组速率、密码子选择和基因密度;第二是功能序列进化 的概览。最后展望了群体遗传学的发展和应用前景。1 非编码 DNA 的进化 大部分真核基因组是非编码的,如果有区别的话,研究这种基因做什么应该 引起可观的兴趣。物种之间或内部的进化对比为最简单的假设提供强有力的检 验:非编码DNA正在随机地突变且受单独漂移的支配。Ludwig提供了这个领域 的清晰概览1,并安排非编码序列面临大量的进化约束的证据,这种约束对过去 观察到的变化产生影响。功能非编码DNA(ncDNA)由顺式作用元件如增强子、核心启动子、基体或 脚手架附着区、绝缘子和沉默子组成。真核DNA包裹在核小体和其它结构蛋白 组件周围,且被调控蛋白高度修饰。 ncDNA 调节核蛋白相互作用,为结合蛋白 的物理定位和其它结合动力学充当一种模板。非编码区域的种间特异性的序列对比揭示了保守特征,它们中的许多可能是 顺式作用元件。尽管选择约束的明显暗示,顺式元件的结构和序列随时间而变化, 有时甚至在表达模式保守的情况下,更是戏剧性地如此。因此,基因表达的功能 性保守在保证相关顺式调控因子的进化保护上是不充分的。一些研究表明,在染色质组织和转录调控相关的调控序列比蛋白编码序列占 据许多更大的基因组序列片段。一个基因能够拥有许多增强子为了保证适当的活 化以响应不同的时间的或空间的暗示。顺式作用元件与它们的核心启动子在序列 特异性和定位特异性上一起进化以实现最好的可能的功能表现。1.1 由功能约束保护大的 ncDNA 序列的比较研究表明,保守区域分散于快速分叉的片段,且甚 至在 300450 百万年的进化后,保守是明显的。高度保守区域的密度和块长度随 进化距离的增加而减少。 ncDNA 上保守的点状模式的解释由分子进化的原则指 导,该原则首先由 Kimura 提出2,即“功能上不太重要的分子或部分分子不更 重要的分子演变地更快。”换言之,序列特异性保守的 ncDNA 暗示了在这些序 列上的功能约束和更慢速率的分子进化。1.2 顺式元件上的功能和进化改变的保护 存在许多广泛地分离的调控序列的许多例子,它们保留了表达特异性。功能性保守调控序列上的进化改变的研究必须起始于负责功能的序列的表征。许多进化假说被提出以解释顺式元件上的进化改变。1.3 增强子进化的模型 存在多个结合位点,每一个具有许多“模糊”,且间隔上的轻微改变也能影响增强子功能的可能性与许多独立的突变将有助于基因表达上的变化的观点相 兼容。基因表达的时域-空域需求被认为是一种连续的特征,能随着影响转录因 子的结合或相互作用的突变向前或向后移轻微动。1.3.1 稳定选择的模型Kimura 观察到一种定量特征的取代速率隶属于稳定选择3。如果大量的隔离 位点被涉及,在稳定选择下,每个突变的平均选择系数将很小。随后,这些弱的 突变能被遗传漂移而不是选择控制,且取代速率相当高。应用于增强子进化,稳 定选择能适应结合位点反转,而不扰乱初始的增强子功能。1.3.2 补偿选择的模型 一对在不同位点的进化,其是个别有害的,但还原了结合上的正常适合性, 也许被称为补偿中性突变。Kimura解释,当基因被轻微地结合时,通过遗传漂 移能容易地将这些突变固定于种群。Carter和Wagner模拟这种过程,因为其 也许可应用于调控序列。他们发现,大的种群规模加速补偿进化,然而小的种群 规模抑制这种形式的漂移发生。1.4 新功能顺式元件的起源顺式调控元件如何通过先前存在的顺式元件的修饰和分散演化一个新的功 能?三种假说被提出。第一,复制和DNA重排涉及全部或部分的存在的功能元 件;第二,存在的功能元件的修饰,例如结合位点的获得或丧失,或为额外的转 录因子获得结合位点;第三,存在元件的共选择和发展的功能的扩展。这三种假 说坚持发育生物学和群体遗传学的被普遍接受的原则,它们这几先前存在的元件 的进化修饰并允许一种新的基因被获得,不破坏顺式调控元件的原始功能。2 突变速率Duret 综述了最近的研究,表明弱选择力形成了密码子使用的偏见优先 使用特定的密码子以编码一种氨基酸尽管其证据对于无脊椎动物相较脊椎动 物更加清晰。然而,Duret在得出选择对密码子偏见负责这一结论上是谨慎的, 因为许多研究是基于假设同源突变速率和非偏见基因转化的简单模型,而简化已 知是无效的。事实上正如Duret指出,突变速率实质上依赖于基因表达水平和在 侧翼位点上和基因组区域内的碱基组成而变化。尽管同义密码子编码相同的氨基酸,它们不是被任意地使用,且与另外一些 相比,一些的使用更为频繁。这种密码子使用偏见出现于生命王国中的许多物种。 密码子使用根据一个给定基因组内的基因而变化,也根据分类群而变化。典型地, 两种模型被提出以解释同义密码子子集的优先使用。2.1 选择模型选择模型(翻译选择)假设存在密码子使用的共适应和优化翻译效率的丰富 tRNA。选择模型预测了密码子使用偏见与基因表达模式之间的一种关联,在高 度表达基因中被优先使用的同义密码子应该也对应更为丰富的tRNA。另外,选 择行为应该导致向非优化密码子固定突变的可能性的降低,因此,也将导致在平 衡时高表达基因中同义替代的更低速率。2.2 中性模型中性模型(突变偏见)假设密码子偏见来源于突变过程的偏见。中性模型并 没有预测密码子使用和基因表达间的任何关系。这种突变的压力应该影响基因组 中的所有位置,不仅是同义位点而且是所有其他沉默位点 (内含子和基因间区 域),次之是非同义密码子位置,因此,这种模型预测了同义位点和基因组中相 邻沉默位点的碱基组成之间的关联。最近的研究表明了其它过程也许能影响密码子偏见。值得注意的是,转录是 可突变的,将导致基因表达与碱基组成之间的一种关联。中性和选择模型并不排 斥突变,密码子的使用几乎在一定程度上反映了选择和突变压力还有漂移之间的 一种平衡。也应该注意到,翻译选择并不是作用于同义密码子使用的唯一的选择 压力。在细菌 Escherichia coli 中,翻译选择已被清晰地阐明由于冲突的选择 压力非最优密码子可被保持于基因内。在真核基因中,一些涉及剪接或 mRNA 稳定的调控元件位于外显子。适当基因调控的需要将对序列产生约束,这将解释 在哺乳基因中一些同义密码子位置探测到的选择压力。在同义密码子间没有选择差异时,鉴于选择压力作用于周围的非同义密码子 位置,不能预计同义位点的碱基组成与基因组中其它中性位点的等同。取代模式 在区域内不同有许多原因。第一,一个给定碱基位点上的突变速率取决于侧翼碱 基的的性质(如CpG二核苷酸是哺乳基因组中的突变热点);第二,内含子和基 因间区域的碱基组成也许受缺失和插入的强烈影响(如显著的可转座因素),然 而,如此突变在同义位点强烈地反选择的;第三,转换和颠换取代模式在第三种 密码子位置不同于非编码区域。这是由于遗传密码的结构:在二折叠退化位点, 转换是同义突变,而非颠换。因此,在第三个密码子位置的颠换处于强烈的选择 压力,然而转换是沉默突变。相反,在非编码区域,转换和颠换都是沉默的。因 此,如果 GC AT 突变压力对转换和颠换是不同的,选择限制取代至转换的位 点将具有不同于中性位点的GC含量,这种现象也能影响四折叠退化位点的碱基 组成,因为非同义取代能改变二折叠退化密码子为四折叠退化密码子。关于同义密码子使用的研究表明,在多细胞物种如 C. elegans 或 Drosophila 中,甚至极小的表型效应能够经受自然选择。在脊椎动物中,密码子使用的主要 决定因素是基因所处的等容的GC含量,而不是翻译选择。在考虑碱基组成上的 等容效应后,检测密码子使用和基因表达的重要关系将是可能的;然而,并没有 建立这个关系是翻译选择还是与转录耦合的突变偏见的后果。在一定程度上,突变是细胞分裂的副产物。雄性和雌性间的突变速率也应该 是有区别的。对于哺乳类,这部分地正确。胚胎和蛋的形成是截然不同的细胞过 程,因为对于大多数雌性生命,蛋在减数分裂I期被阻止,然而胚胎经历连续的 有丝分裂。通过比较X染色体上进化改变的速率和模式,其花费雌性生命的2/3, 对于 Y 染色体和常染色体,观察者企图评估雌性和雄性突变的相对速率。 Li、 Yi和Makova综述了这个观点,让我们领略从大的基因组范围的分析中获得的 最新结果。他们推断,在灵长类、啮齿类和鸟类雄性中的一个提高的突变速率存 在强有力的支持,3 重组速率正如突变速率中的异质性在严格的观察上变得明显,重组速率上的大量变化 也被发现。长期认为,在人类和果蝇的基因组内,在每兆碱基的厘摩上表达的每 单位物理长度上的重组速率至少在一个数量级上变化oNachman强调了这种异质 性并综述了在非常精细水平分辨率上的重组变化的近期研究8。Nachman也描述 了这种变化在进化改变模式上的影响。预计选择在基因组领域以非常低速率的重 组去除有害突变上不是很有效率,因此,预计各种各样的突变和转座子在这些区 域得到积累。这个期望在主要地非重组额Y染色体上达到一种极致。Y染色体 进化的经典模型假设,Y染色体源于X染色体,接着其以较低的重组速率进化, 丧失基因功能和剂量补偿,仅保留雄性生育所必须的少数基因。然而,正如 Carvalho所评论的刃,基因组分析正在揭示,存在Y染色体更多的进化。人类和 蝇类的 Y 染色体似乎从常染色体经受一系列转座,这充当有功能的性相关基因 的一种不间断的源泉。事实上,从常染色体的这种DNA转移也许甚至解释了一 些物种中Y染色体的起源。正如Carvalho评论,果蝇Y染色体不表现与X染色 体的同源痕迹,相反,也许已经从一种配角或B染色体进化而来。减数重组一减数分裂前期I阶段同源染色体间的遗传信息交换一在真核生物 中普遍存在。交换发生的速率在物种间、个体间、性别间、基因组的不同区域间 也许充分地变化。重组速率变化对遗传变异的建构和我们绘制和鉴别疾病基因的 能力具有深远的意义。历史上,用细胞工程的方法测量互换的速率,通过观察微 观的交叉,或通过在使用表型标记的遗传杂交中获得的重组个体的数量。利用完 整的基因组序列和数以千计的分子标记,详细地描述重组的数量和分布是可能 的。理论模型表明,重组的水平能在许多方面影响遗传变异的数量和模式。例如, 在基因组区域,重组减少或缺失,在不同位置的等位基因间的非稀有联合是期望 的。作为在连锁位点的选择的后果,除了较低频率的多态性之外,具有少数重组 的基因组区域也许庇护较少数的多态性。另外,选择的功效被期望随着重组速率 的一种功能而变化:由于连锁的干扰减小了在低重组区域固定有益突变的可能 性。大量理论工作都致力于研究选择和连锁共同影响遗传变异模式的方式, Nachman综述了两种模式,即遗传变异的数量和等位基因频率的分布。3.1 遗传变异的数量在连锁位点的选择模型表明,遗传变异的数量在低重组区域也许被减少了。 遗传搭车引用适应性突变的固定和连锁突变体的相关固定。在最简单的情况下, 如果缺乏重组时一个新的突变出现并席卷一个种群而固定于基因组区域,一种单 一单体型将被固定于所有的个体。如果在选择席卷的过程中存在一些重组,多于 一种的单体型也许依然追随适应性突变体的固定,且较少的突变体将消失。因此, 预计遗传搭车过程产生一种重组速率和核苷酸变异间的正相关。基于选择和连锁 的另一个过程,即所谓的背景选择,也能产生重组速率和核苷酸变异间的正相关。 这个过程基于从一个种群中通过选择去除有害突变和基于连锁中性突变体的联 合去除。这两个过程并不是互相排斥的,相反,都可能一起至少在一定程度上起 作用。3.2 等位基因频率的分布选择也许导致在连接位点的等位基因频率的分
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号