资源预览内容
第1页 / 共73页
第2页 / 共73页
第3页 / 共73页
第4页 / 共73页
第5页 / 共73页
第6页 / 共73页
第7页 / 共73页
第8页 / 共73页
第9页 / 共73页
第10页 / 共73页
亲,该文档总共73页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
基因、基因组与基因组学基因、基因组与基因组学Gene、Genome & Genomics医学分子生物学医学分子生物学 第二章第二章基因基因组和基因组学课件基因基因组和基因组学课件2.1 2.1 基因的结构与功能基因的结构与功能 2.2 2.2 基因组的结构与功能基因组的结构与功能 2.3 2.3 基因组学基因组学 主要内容主要内容基因基因组和基因组学课件基因基因组和基因组学课件2.1.1 基因的分类基因的分类2.1.2 基因的结构基因的结构2.1.3 基因的功能基因的功能2.1 基因的结构与功能基因的结构与功能 基因基因组和基因组学课件基因基因组和基因组学课件基因的概念基因的概念 遗传学角度:遗传学角度:分子生物学角度:分子生物学角度:基因(基因(gene):):是指携带有遗传信息的是指携带有遗传信息的DNA或或RNA序列,序列,也称为也称为遗传因子遗传因子。 基因(基因(gene):):是合成有功能的是合成有功能的蛋白质或蛋白质或RNA所必需的全部所必需的全部DNA,包括,包括编码编码蛋白质或蛋白质或RNA的核酸的核酸序列及为保证转录所必需的序列及为保证转录所必需的调控调控序列序列。 基因基因组和基因组学课件基因基因组和基因组学课件基因的研究简史基因的研究简史孟孟德德尔尔(Mendel)的的颗颗粒粒因因子子:一一个个因因子子决决定定一一个个性性状状(1865年年)。约翰森(约翰森(Johannsen):首先提出):首先提出基因基因一词(一词(1909年)年)摩摩尔尔根根(Morgan)的的基基因因论论:一一个个基基因因控控制制一一个个性性状状(1926年),明确了基因存在于染色体上。年),明确了基因存在于染色体上。Beadle 和和Tatum:一个基因一个酶学说一个基因一个酶学说(1941年)。年)。Avery肺肺炎炎双双球球菌菌转转化化实实验验:证证实实了了遗遗传传物物质质的的本本质质是是DNA(1944年)。年)。基因基因组和基因组学课件基因基因组和基因组学课件赫赫尔尔希希和和蔡蔡斯斯:噬噬菌菌体体大大肠肠杆杆菌菌感感染染实实验验,只只有有DNA能能进进入入大大肠肠杆杆菌菌(1952年)。年)。Watson 和和Crick:提出:提出DNA右手双螺旋右手双螺旋理论(理论(1953年)。年)。Crick:提出:提出中心法则中心法则(1957年)。年)。Benzer:提出:提出一个顺反子一个顺反子,一条多肽链的概念(,一条多肽链的概念(1957年)。年)。Jacob和和Monod:提出了:提出了操纵子模型操纵子模型(1961年)。年)。尼尼伦伦伯伯格格:三三联联密密码码子子学学说说将将DNA结结构构与与生生物物功功能能结结合合起起来来(1966年)年) 。Sharp等:真核生物基因中的等:真核生物基因中的断裂现象断裂现象(1977年)。年)。 噬菌体中发现了噬菌体中发现了重叠基因重叠基因(1978年)年)。基因基因组和基因组学课件基因基因组和基因组学课件2.1.1 基因的分类基因的分类 基因根据其是否具有基因根据其是否具有转录和翻译转录和翻译功能可分为:功能可分为:结结构构基基因因(structural genes):可可被被转转录录形形成成mRNA,并并转转译译成成多多肽肽链链,构构成成各各种种结结构构蛋蛋白白质质,催催化化各各种种生生化化反反应应的的酶酶和和激素等。激素等。调调节节基基因因(regulatory genes):指指某某些些可可调调节节控控制制结结构构基基因因表表达的基因。达的基因。核核糖糖体体RNA基基因因(ribosomal RNA genes,rRNA基基因因)与与转转运运RNA基基因因(transfer RNA genes, tRNA基基因因) :这这类类基基因因只只转录产生相应的转录产生相应的RNA而不翻译成多肽链。而不翻译成多肽链。基因基因组和基因组学课件基因基因组和基因组学课件2.1.2 基因的结构基因的结构 人类基因按照功能的不同分为人类基因按照功能的不同分为3 3个区域:个区域:编码区:编码区:能够编码产生蛋白质的序列,包括能够编码产生蛋白质的序列,包括外显子外显子与与内含子内含子前导区:前导区:位于编码区上游,相当于位于编码区上游,相当于mRNA 5端非编码区(非端非编码区(非翻译区)翻译区)调节区:调节区:包括启动子和增强子等基因编码区的两侧也称为包括启动子和增强子等基因编码区的两侧也称为侧侧翼序列翼序列基因基因组和基因组学课件基因基因组和基因组学课件基因的一般结构基因的一般结构基因基因组和基因组学课件基因基因组和基因组学课件2.1.2 基因的结构基因的结构病毒到高等生物的细胞核均共用病毒到高等生物的细胞核均共用一套遗传密码一套遗传密码。牛,酵母线粒体和植物叶绿体基因序列结构的研究发现,其密码牛,酵母线粒体和植物叶绿体基因序列结构的研究发现,其密码有异于细胞核的遗传密码有异于细胞核的遗传密码 。密码子有可能密码子有可能重复利用重复利用。基因的大小主要取决于其基因的大小主要取决于其内含子的有无、大小以及数量内含子的有无、大小以及数量。 开放阅读框架(开放阅读框架( open reading frame,ORF ):):是指是指DNADNA链链上,由蛋白质合成的起始密码开始,到终止密码为止的一个上,由蛋白质合成的起始密码开始,到终止密码为止的一个连续编码连续编码。 基因基因组和基因组学课件基因基因组和基因组学课件2.1.3 基因的功能基因的功能 基因有控制遗传性状和活性调节的功能。基因有控制遗传性状和活性调节的功能。基因的表达活性有严格的时间和空间特异性。基因的表达活性有严格的时间和空间特异性。基因主要通过两条途径控制生物的性状基因主要通过两条途径控制生物的性状:一是通过控制一是通过控制酶的合成酶的合成来控制生物的性状。来控制生物的性状。二是通过控制二是通过控制结构蛋白的成分结构蛋白的成分直接控制生物的形状。直接控制生物的形状。基因基因组和基因组学课件基因基因组和基因组学课件2.2 基因组的结构与功能基因组的结构与功能2.2.1 病毒基因组的结构和功能病毒基因组的结构和功能 2.2.2原核生物基因组的结构和功能原核生物基因组的结构和功能 2.2.3真核生物基因组的结构和功能真核生物基因组的结构和功能基因基因组和基因组学课件基因基因组和基因组学课件基因组(基因组(genome):):是指生物体全套遗传信息,包括所有是指生物体全套遗传信息,包括所有基因和基因间的区域基因和基因间的区域 原核生物(原核生物(prokaryote)和真核生物()和真核生物(eukaryote)的)的基因组基因组都是都是DNA 病毒病毒基因组基因组有的是有的是DNA,有的是,有的是RNA 基因组(原核生物和真核生物)基因组(原核生物和真核生物)2.2 基因组的结构与功能基因组的结构与功能 染色体基因组(染色体基因组(chromosomal genome) 染色体外基因组(染色体外基因组(extrachromosomal genome) 如:细菌的如:细菌的质粒质粒(plasmid)DNA 真核生物的真核生物的线粒体线粒体(mitochondria)DNA 叶绿体叶绿体(chloroplast)DNA 基因基因组和基因组学课件基因基因组和基因组学课件基因组的大小通常以其基因组的大小通常以其DNA的含量来表示。进化程度越高的含量来表示。进化程度越高的生物其基因组越大的生物其基因组越大DNA含量越高,结构也越复杂。含量越高,结构也越复杂。存在反常现象:存在反常现象: 许多复杂性相近的生物体其基因组大小却显著不同:许多复杂性相近的生物体其基因组大小却显著不同:果蝇的基因组大约是蝗虫基因组的果蝇的基因组大约是蝗虫基因组的1/251/25。 C值(值(C value):):是指一种生物体单倍体基因组是指一种生物体单倍体基因组DNADNA的总量。的总量。基因基因组和基因组学课件基因基因组和基因组学课件表表2-1 2-1 不同生物体基因组中基因的比较不同生物体基因组中基因的比较物种基因组大小/Mb大致的基因数目基因密度/(个/Mb)原核生物原核生物肺炎链球菌2.223001060 大肠杆菌4.64400950 根瘤农杆菌5.75400960真核生物真核生物 真菌真菌 酿酒酵母125800480 粟酒裂殖酵母124900410 原生生物原生生物 四膜虫22020 00090待续基因基因组和基因组学课件基因基因组和基因组学课件 无脊椎动物无脊椎动物 美丽线虫9719 000200 果蝇18013 70080 东亚飞蝗5000不确定不确定 脊椎动物脊椎动物 人类290027 0009.3 小鼠250029 00012 植物植物 拟南芥12525 500200 水稻43045 000100 玉米220045 00020 郁金香120 000不确定不确定基因基因组和基因组学课件基因基因组和基因组学课件基因基因组和基因组学课件基因基因组和基因组学课件2.2.1 病毒基因组的结构和功能病毒基因组的结构和功能 基因基因组和基因组学课件基因基因组和基因组学课件2.2.1.1病毒基因组可以由病毒基因组可以由DNA或或RNA组成组成 病毒的核酸通常是病毒的核酸通常是DNA或为或为RNA分子,目前未见报道在分子,目前未见报道在同一病毒颗粒中共存在两种核酸的情况。同一病毒颗粒中共存在两种核酸的情况。病毒基因组的病毒基因组的DNA或或RNA可以是单链的,也可以是双链可以是单链的,也可以是双链的,可以是闭环的,也可以是线性的。的,可以是闭环的,也可以是线性的。 基因组基因组基因组基因组 形状形状形状形状 乳头瘤病毒乳头瘤病毒乳头瘤病毒乳头瘤病毒 DNA DNA 双链闭环双链闭环双链闭环双链闭环 腺病毒腺病毒腺病毒腺病毒 DNA DNA 双链线状双链线状双链线状双链线状 脊髓灰质炎病毒脊髓灰质炎病毒脊髓灰质炎病毒脊髓灰质炎病毒 RNA RNA 单链单链单链单链 呼肠弧病毒呼肠弧病毒呼肠弧病毒呼肠弧病毒 RNA RNA 双链双链双链双链基因基因组和基因组学课件基因基因组和基因组学课件2.2.1.2 病毒基因组的大小相差较大病毒基因组的大小相差较大 病毒的基因组病毒的基因组很小很小:与细菌或真核细胞相比。:与细菌或真核细胞相比。不同的病毒之间其基因组大小不同的病毒之间其基因组大小相差很大相差很大。 乙肝病毒乙肝病毒DNA:3kb,信息量较小,编码,信息量较小,编码4种蛋白质种蛋白质 痘病毒的基因组:痘病毒的基因组:300kb,编码几百种蛋白质(病毒复制所涉及,编码几百种蛋白质(病毒复制所涉及 的酶类编码,核苷酸代谢的酶类)的酶类编码,核苷酸代谢的酶类)病毒基因组的大小通常与其对宿主的病毒基因组的大小通常与其对宿主的依赖程度依赖程度有关,基因有关,基因组越大,依赖性越小组越大,依赖性越小。基因基因组和基因组学课件基因基因组和基因组学课件2.2.1. 3 部分部分RNA病毒基因组编码序列具有节段性病毒基因组编码序列具有节段性 多数多数RNA病毒的基因组是由连续的核糖核酸链组成,但也病毒的基因组是由连续的核糖核酸链组成,但也有些病毒的基因组有些病毒的基因组RNA由不连续的几条核酸链组成:由不连续的几条核酸链组成: 流感病毒的基因组流感病毒的基因组RNA分子是节段性的,由八条分子是节段性的,由八条RNA分子构成,分子构成,每条每条RNA分子都含有编码蛋白质分子的信息分子都含有编码蛋白质分子的信息 轮状病毒的基因组由轮状病毒的基因组由10个节段性的线性双链个节段性的线性双链RNA分子构成,每段分子构成,每段RNA分子都编码一种蛋白质。分子都编码一种蛋白质。 分段基因组的病毒一般分段基因组的病毒一般感染效率较低感染效率较低 分段基因组容易发生重组,故分段基因组容易发生重组,故病毒容易变异病毒容易变异 基因基因组和基因组学课件基因基因组和基因组学课件2.2.1. 4 病毒基因存在基因重叠病毒基因存在基因重叠 这种现象在其它的生物细胞中仅见于线粒体和质粒这种现象在其它的生物细胞中仅见于线粒体和质粒DNA,是病毒基因组的结构特点。这种结构的意义在于使较小的是病毒基因组的结构特点。这种结构的意义在于使较小的基因组能够携带较多的遗传信息。基因组能够携带较多的遗传信息。重叠基因是重叠基因是19771977年年SangerSanger在研究在研究X174X174时发现的。时发现的。基因重叠:基因重叠:是指同一段是指同一段DNADNA片段能够参与编码两种甚至两种片段能够参与编码两种甚至两种以上的蛋白质分子。以上的蛋白质分子。基因基因组和基因组学课件基因基因组和基因组学课件基因重叠基因重叠X174是一种单链是一种单链DNA病病毒,宿主为大肠杆菌。毒,宿主为大肠杆菌。它感染大肠杆菌后可合成它感染大肠杆菌后可合成11个个蛋白质分子,总分子量为蛋白质分子,总分子量为25万万左右,相当于左右,相当于6078个个核核苷酸所容纳的信息量。苷酸所容纳的信息量。而而X174病毒病毒DNA本身却本身却只有只有5375个个核苷酸,最多只核苷酸,最多只能编码总分子量为能编码总分子量为20万万的蛋的蛋白质分子。白质分子。基因基因组和基因组学课件基因基因组和基因组学课件基因重叠的方式基因重叠的方式 (1)一个基因完全在另一个基因里面。)一个基因完全在另一个基因里面。(2)几个基因部分重叠。)几个基因部分重叠。(3)两个基因之间只有一个碱基重叠。)两个基因之间只有一个碱基重叠。基因基因组和基因组学课件基因基因组和基因组学课件噬菌体X174的重叠基因基因基因组和基因组学课件基因基因组和基因组学课件基因重叠的方式基因重叠的方式 (1)一个基因完全在另一个基因里面。)一个基因完全在另一个基因里面。(2)几个基因部分重叠。)几个基因部分重叠。(3)两个基因之间只有一个碱基重叠。)两个基因之间只有一个碱基重叠。基因基因组和基因组学课件基因基因组和基因组学课件2.2.1. 5 病毒基因组的大部分序列具有编病毒基因组的大部分序列具有编码功能码功能 病毒基因组的大部分是用来编码蛋白质的,只有病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部份没有编码功能翻译,这与真核细非常小的一部份没有编码功能翻译,这与真核细胞基因组截然不同。胞基因组截然不同。X174X174基因组中不编码的序列只占基因组中不编码的序列只占217/5375217/5375乳头瘤病毒基因组约乳头瘤病毒基因组约8.0Kb8.0Kb,其中不编码的部分约为,其中不编码的部分约为1.0kb1.0kb。 基因基因组和基因组学课件基因基因组和基因组学课件2.2.1. 6 病毒基因组的转录单元是多顺反子病毒基因组的转录单元是多顺反子 多顺反子多顺反子mRNA(polycistronie mRNA):是指病毒基因组是指病毒基因组DNADNA序列中功能上相关的蛋白质的基因或序列中功能上相关的蛋白质的基因或rRNArRNA的基因往往丛的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成含有多个转录单元。它们可被一起转录成含有多个mRNAmRNA的分子。的分子。基因基因组和基因组学课件基因基因组和基因组学课件噬菌体噬菌体X174X174 基因组中的基因组中的D-E-J-F-G-H基因也转基因也转录在同一个录在同一个mRNA中,中,然后再翻译成各种蛋白然后再翻译成各种蛋白质,其中、质,其中、F、G及及H都是编码外壳蛋白的,都是编码外壳蛋白的,D 蛋白与病毒的装配有蛋白与病毒的装配有关,关,E 蛋白负责细菌的蛋白负责细菌的裂解,裂解, 因此它们在功能因此它们在功能上是相关的上是相关的基因基因组和基因组学课件基因基因组和基因组学课件2.2.1.7 病毒基因组都是单倍体,病毒基因组都是单倍体, 反转录病毒例外,是二倍体反转录病毒例外,是二倍体 基因基因组和基因组学课件基因基因组和基因组学课件2.2.1.8 噬菌体基因具有连续性,噬菌体基因具有连续性,而真核细胞病毒的基因是不连续的而真核细胞病毒的基因是不连续的基因基因组和基因组学课件基因基因组和基因组学课件2.2.2原核生物基因组的结构和功能原核生物基因组的结构和功能 原核生物基因组通常比较简单,其基因组大小在原核生物基因组通常比较简单,其基因组大小在106bp107bp之间,所包含的基因数目几百个到数千个之间。之间,所包含的基因数目几百个到数千个之间。类核(类核(nucleoid):):是指原核生物基因组通常由一条环状的是指原核生物基因组通常由一条环状的双链双链DNADNA分子组成,在细胞中与蛋白质结合成染色体的形式,分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域。在细胞内形成一个致密的区域。基因基因组和基因组学课件基因基因组和基因组学课件图 大肠杆菌的类核结构模型基因基因组和基因组学课件基因基因组和基因组学课件2.2.2.1 大肠杆菌染色体基因组的结构和功能大肠杆菌染色体基因组的结构和功能 大肠杆菌基因组序列中的大肠杆菌基因组序列中的基因密度非常高基因密度非常高,编码区所占的,编码区所占的比例较大。大肠杆菌中总共有比例较大。大肠杆菌中总共有4288个基因,平均编码长度个基因,平均编码长度为为950bp,基因之间的间隔区长度为,基因之间的间隔区长度为118bp,而且这些结构,而且这些结构基因没有内含子。基因没有内含子。大肠杆菌大肠杆菌DNADNA分子中的分子中的重复序列很少重复序列很少,但在大肠杆菌基因,但在大肠杆菌基因组中不同部位可以有称为组中不同部位可以有称为转座子的转座子的50kb50kb的重复片段的重复片段。 基因基因组和基因组学课件基因基因组和基因组学课件大肠杆菌染色体基因组大肠杆菌染色体基因组基因基因组和基因组学课件基因基因组和基因组学课件转座因子转座因子最初是在大肠杆菌半乳糖操纵子的研究中发现的。最初是在大肠杆菌半乳糖操纵子的研究中发现的。原核生物转座因子主要有二类:原核生物转座因子主要有二类:一类是插入序列一类是插入序列(insertion sequence,IS) :2 000bp以内,两端正向重以内,两端正向重复序列(复序列(direct repeats,DR)、反向重复序列()、反向重复序列(inverted repeats,IR),中间),中间1kb左右的编码序列,仅编码和转座有关的转座酶。左右的编码序列,仅编码和转座有关的转座酶。另一另一类是复合型是复合型转座子座子( composite transposon) :2 0002 00020 000bp20 000bp之间,两端由一对之间,两端由一对ISIS元件组成,带有与转座作用有关的基因和其他基元件组成,带有与转座作用有关的基因和其他基因。因。基因基因组和基因组学课件基因基因组和基因组学课件图 Tn的基本结构 基因基因组和基因组学课件基因基因组和基因组学课件2.2.2.2大肠杆菌染色体外基因组的结构大肠杆菌染色体外基因组的结构和功能和功能 大肠杆菌质粒是双链环状结构的大肠杆菌质粒是双链环状结构的DNA分子。分子。可以有共价闭合环状可以有共价闭合环状DNADNA、缺口的环状、缺口的环状、DNADNA线性线性DNA DNA 三种三种结构状态。结构状态。质粒(质粒(plasmid):):是指一类染色体外具有自主复制能力的是指一类染色体外具有自主复制能力的环状双链环状双链DNADNA分子,属染色体外基因组。分子,属染色体外基因组。基因基因组和基因组学课件基因基因组和基因组学课件质粒质粒 (plasmid)特特点点:能能在在宿宿主主细细胞胞内内独独立立自自主主复复制制;带带有有某某些些遗遗传传信信息息, , 会赋予宿主细胞一些遗传性状。会赋予宿主细胞一些遗传性状。 基因基因组和基因组学课件基因基因组和基因组学课件质粒的功能质粒的功能 质粒对宿主细胞的生存一般不是必需的,但质粒带有某些质粒对宿主细胞的生存一般不是必需的,但质粒带有某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些新的遗传性状,某些情况下有利于细胞的生长。一些新的遗传性状,某些情况下有利于细胞的生长。基因基因组和基因组学课件基因基因组和基因组学课件抗性抗性抗生素抗性氨基糖甙类、-内酰胺类、大环内酯类及磺胺类等重金属抗性 汞离子及有机汞制剂、镍、钴、银、铬、铅、锑及铋等阳离子抗性砷酸盐、亚砷酸盐、铬酸盐及硼酸盐等其它抗性紫外线,X射线,细菌素,质粒控制的修饰系统等代谢能力代谢能力简单糖类的代谢乳糖、蔗糖及绵籽糖等卤化物的代谢2,4-二氯甲苯复杂碳化合物的代谢甲苯、萘、樟脑、苯胺、烟碱及烷烃等蛋白质代谢 明胶及酪蛋白等其他代谢 色素生成,产硫化氢,胞外DNA酶等致病性致病性侵袭力菌毛、夹膜、黏附因子及血浆凝固酶等毒素大肠杆菌肠毒素、破伤风杆菌神经毒素、炭疽杆菌外毒素及鼠疫菌素等结合转移结合转移性伞毛的合成,表面排斥,致育性抑制,对信息素的反应和抑制等表2-2 细菌质粒所控制的一些性状。基因基因组和基因组学课件基因基因组和基因组学课件质粒的复制质粒的复制 质粒能自主复制,是能独立复制的复制子质粒能自主复制,是能独立复制的复制子(autonomous replicon)。)。严严紧紧控控制制(stringent stringent controlcontrol)型型质质粒粒:其其复复制制常常与与宿宿主主的的繁繁殖殖偶偶联联,拷拷贝贝数数较较少少,每每个个细细胞胞中中只只有有1 1个个到到十十几几个个拷贝。拷贝。松松弛弛控控制制(relaxed relaxed controlcontrol)型型质质粒粒:其其复复制制与与宿宿主主不不偶偶联,每个细胞中有几十到几百个拷贝。联,每个细胞中有几十到几百个拷贝。 基因基因组和基因组学课件基因基因组和基因组学课件质粒的稳定性与不相容性质粒的稳定性与不相容性 影响质粒稳定性的因素有两种:影响质粒稳定性的因素有两种:宿主细胞分裂时质粒能否均衡地分配到子代细胞。宿主细胞分裂时质粒能否均衡地分配到子代细胞。质粒分子自身结构的稳定性。质粒分子自身结构的稳定性。质粒的不相容性(质粒的不相容性(incompatibility):):是指两个不同的质粒是指两个不同的质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失的现象。其中一种质粒将被丢失的现象。基因基因组和基因组学课件基因基因组和基因组学课件2.2.3 真核生物基因组的结构和功能真核生物基因组的结构和功能 真核生物的遗传物质绝大部分存在于细胞核染色真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中,因此真核体,少部分存在于线粒体或叶绿体中,因此真核生物基因组可分为生物基因组可分为细胞核基因组细胞核基因组和和细胞器基因组细胞器基因组。基因基因组和基因组学课件基因基因组和基因组学课件真核生物的染色体基因组一般比较庞大,例如人的单倍体真核生物的染色体基因组一般比较庞大,例如人的单倍体基因组由基因组由3109bp碱基碱基组成,按组成,按1000个碱基编码一种蛋白个碱基编码一种蛋白质计算,理论上可有质计算,理论上可有300万个万个基因。但实际上,人类基因基因。但实际上,人类基因组中仅含有组中仅含有25 00030 000个个基因。基因。这些与表达无关的这些与表达无关的DNA大部分是基因间隔区序列,基因间大部分是基因间隔区序列,基因间隔区序列主要由隔区序列主要由重复重复DNA构成。构成。 只有只有很少一部份很少一部份(约占(约占2-3)的)的DNA序列用以编码蛋白序列用以编码蛋白质和结构质和结构RNA。 基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.1 真核生物染色体基因组特点真核生物染色体基因组特点 2.2.3.1.1真核生物基因组存在大量的重复序列真核生物基因组存在大量的重复序列 2.2.3.1.2 真核基因组的另一特点是存在多基真核基因组的另一特点是存在多基 因家族与假基因因家族与假基因 基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.1.1真核生物基因组存在大量的重复序列真核生物基因组存在大量的重复序列 单拷贝序列单拷贝序列中度重复序列中度重复序列高度重复序列高度重复序列基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.1.1.1单拷贝序列(低度重复序列)单拷贝序列(低度重复序列) 在单倍体基因组中,在单倍体基因组中,单拷贝序列只有一个或几个单拷贝序列只有一个或几个拷贝,拷贝,占占DNA总量的总量的40-80: 果蝇中占果蝇中占79,小鼠中占,小鼠中占70。结构基因基本上属于单拷贝序列结构基因基本上属于单拷贝序列,储存的巨大遗,储存的巨大遗传信息,用来编码各种不同功能的蛋白质,体现传信息,用来编码各种不同功能的蛋白质,体现了生物的各种功能。了生物的各种功能。基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.1.1.2 中度重复序列中度重复序列 中度重复序列在真核基因组中重复次数为中度重复序列在真核基因组中重复次数为10105,占,占DNA总量的总量的10-40: 果蝇中占果蝇中占1515,小鼠中占,小鼠中占2020。编码编码rRNA、tRNA、组蛋白以及免疫球蛋白的机、组蛋白以及免疫球蛋白的机构基因等都属于这一类,另有部分可能与基因的构基因等都属于这一类,另有部分可能与基因的调控有关。调控有关。基因基因组和基因组学课件基因基因组和基因组学课件Alu家族家族是中度重复序列研究较多的一种散在重复序列,是中度重复序列研究较多的一种散在重复序列,因序列内部有限制性内切酶因序列内部有限制性内切酶AluI的酶切位点而得的酶切位点而得名。名。 Alu序列每个成员的长度约序列每个成员的长度约300bp,由两个,由两个130bp130bp的正的正向重复序列组成,二者之间有向重复序列组成,二者之间有31bp31bp的间隔序列,的间隔序列,Alu序列序列的重复次数为的重复次数为30-50万次。万次。基因基因组和基因组学课件基因基因组和基因组学课件rRNA基因rRNA基因通常集中成簇存在,而不是分散于基因通常集中成簇存在,而不是分散于基因基因组组中,这样的区域称为中,这样的区域称为rDNA,如染色体的核仁组,如染色体的核仁组织区(织区(nucleolus organizer region)即为)即为rDNA区。区。基因基因组和基因组学课件基因基因组和基因组学课件图 非洲爪蟾的rRNA基因结构基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.1.1.3高度重复序列高度重复序列 高度重复序列在真核基因组中重复次数可高达百万高度重复序列在真核基因组中重复次数可高达百万(106)以以上,在基因组中所占比例随种属而异,约占上,在基因组中所占比例随种属而异,约占DNA总量总量10-60,可以集中串联排列在某一区域。,可以集中串联排列在某一区域。典型的高度重复序列典型的高度重复序列DNA有有反向重复序列反向重复序列(inverted repeats)和和卫星卫星DNA(satellite DNA)。反向重复序列反向重复序列 :是指两个相同顺序的互补拷贝在同一是指两个相同顺序的互补拷贝在同一DNADNA链链上的反向排列。上的反向排列。 卫星卫星DNA DNA 是另一类高度重复序列,这类重复序列的重复单位是另一类高度重复序列,这类重复序列的重复单位一般由一般由2-10bp2-10bp组成,成串排列。组成,成串排列。 基因基因组和基因组学课件基因基因组和基因组学课件图 反向重复序列发夹式结构基因基因组和基因组学课件基因基因组和基因组学课件卫星DNA(satelliteDNA)重复顺序:由2-10bp组成重复单位,重复单位成串排列而成由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA(或随体DNA)在人细胞组中,卫星DNA约占5-6基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.1.1.4 重复序列的多态性重复序列的多态性 DNA多态性是指多态性是指DNA序列发生变异从而导致的个体间核序列发生变异从而导致的个体间核苷酸序列的差异,主要包括:苷酸序列的差异,主要包括: 单核苷酸多态性(单核苷酸多态性(single nucleotide polymorphism,SNP) SNP是由基因组是由基因组DNA上的单个碱基的变异引起的上的单个碱基的变异引起的DNA序列多态性。是人群中个体差异最具代表性的序列多态性。是人群中个体差异最具代表性的DNADNA多多态性,相当一部分还直接或间接与个体的表型差异、对疾态性,相当一部分还直接或间接与个体的表型差异、对疾病的易感性或抵抗能力、对药物的反应性等相关。病的易感性或抵抗能力、对药物的反应性等相关。SNPSNP被被认为是一种能稳定遗传的早期突变认为是一种能稳定遗传的早期突变 串联重复序列多态性(串联重复序列多态性(tandem repeats polymorphism) 基因基因组和基因组学课件基因基因组和基因组学课件短串联重复序列短串联重复序列由几个碱基对作为核心单位,串联重复形成的一类由几个碱基对作为核心单位,串联重复形成的一类DNA序列,由于核心单位重复数目的变化,构成了序列,由于核心单位重复数目的变化,构成了STR基因座的遗传多态性。基因座的遗传多态性。分布于人类整个基因组,平均每分布于人类整个基因组,平均每15kb就存在一个就存在一个STR基因座。人类基因组已发现了七千个以上的基因座。人类基因组已发现了七千个以上的STR位点。位点。具有分布广泛,易于检测,信息量大,有高度多态性具有分布广泛,易于检测,信息量大,有高度多态性并遵循孟德尔共显性遗传等优点。并遵循孟德尔共显性遗传等优点。目前目前STR分析已广泛应用于遗传制图、连锁性分析、分析已广泛应用于遗传制图、连锁性分析、亲子鉴定、疾病基因定位和物种多态性研究等领域亲子鉴定、疾病基因定位和物种多态性研究等领域 。基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.1.2 真核基因组的另一特点是存在真核基因组的另一特点是存在多基因家族与假基因多基因家族与假基因 珠蛋白基因家族:珠蛋白基因家族:家族的不同成员成簇地分布在不同染色家族的不同成员成簇地分布在不同染色体上,但核酸序列高度同源,编码一组功能上紧密相关的体上,但核酸序列高度同源,编码一组功能上紧密相关的蛋白质。蛋白质。组蛋白基因家族:组蛋白基因家族:基因家族成簇地分布在某一条染色体上,基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质。它们可同时发挥作用,合成某些蛋白质。多基因家族(多基因家族(multi gene family) :是指由某一祖先基因经是指由某一祖先基因经过重复和变异所产生的一组基因。过重复和变异所产生的一组基因。 基因基因组和基因组学课件基因基因组和基因组学课件图图 人珠蛋白多基因家族人珠蛋白多基因家族基因基因组和基因组学课件基因基因组和基因组学课件假基因与有功能的基因同源,原来可能也是有功能的基因,假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。为无功能基因。传统假基因(传统假基因(conventional pseudogene) 加工的假基因(加工的假基因(processed pseudogenes)假基因(假基因(pseudo gene):):是指与某些有功能的基因结构相是指与某些有功能的基因结构相似,但不能表达有功能的基因产物的某些基因。似,但不能表达有功能的基因产物的某些基因。 基因基因组和基因组学课件基因基因组和基因组学课件图图 加工的假基因加工的假基因基因基因组和基因组学课件基因基因组和基因组学课件2.2.3.2 真核生物真核生物细胞器基因胞器基因组的的结构与功能特点构与功能特点 真核生物有两类细胞器能携带遗传物质:真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体线粒体和叶绿体。这些遗传物质独立于细胞核基因组外,能够自行复制和表这些遗传物质独立于细胞核基因组外,能够自行复制和表达,又称为达,又称为染色体外基因组染色体外基因组。大多数细胞器基因组是环状大多数细胞器基因组是环状DNADNA,某些低等真核生物(如,某些低等真核生物(如草履虫、衣滴虫和几种酵母)的线粒体草履虫、衣滴虫和几种酵母)的线粒体DNADNA是线状分子。是线状分子。通常每个细胞内有许多细胞器,每个细胞器基因组又有许通常每个细胞内有许多细胞器,每个细胞器基因组又有许多拷贝。多拷贝。基因基因组和基因组学课件基因基因组和基因组学课件线粒体基因组编码其自身蛋白质合成体系的某些成员,如线粒体基因组编码其自身蛋白质合成体系的某些成员,如rRNA和和tRNA等,以及等,以及呼吸呼吸链中的某些成中的某些成员,如,如ATP酶、酶、NADH还原酶、细胞色素氧化酶复合体中的某些组分。线还原酶、细胞色素氧化酶复合体中的某些组分。线粒体蛋白质合成体系及呼吸链中的其它成员由细胞核基因粒体蛋白质合成体系及呼吸链中的其它成员由细胞核基因组编码。组编码。基因基因组和基因组学课件基因基因组和基因组学课件基因基因组和基因组学课件基因基因组和基因组学课件高等动物线粒体基因组具有独特的特点:高等动物线粒体基因组具有独特的特点:母母系系遗遗传传。子子代代线线粒粒体体基基因因组组来来自自母母亲亲,父父系系的的线线粒粒体体基基因因组组在在精精卵卵结结合合时时一一般般不不能能进进入入卵卵细细胞胞。因因此此,在在子子代代个个体发育过程中没有父母双方线粒体体发育过程中没有父母双方线粒体DNADNA的重组发生。的重组发生。线线粒粒体体DNADNA损损伤伤后后不不易易修修复复,突突变变率率较较高高,可可能能与与衰衰老老及及某些疾病有关。某些疾病有关。遗遗传传密密码码与与通通用用遗遗传传密密码码存存在在差差别别,如如UGAUGA(终终止止密密码码子子)编编码码TrpTrp,AGA/AGGAGA/AGG(ArgArg)为为终终止止密密码码子子,AUAAUA(IleIle)为为起始密码子并编码起始密码子并编码MetMet。基因基因组和基因组学课件基因基因组和基因组学课件2.3 基因组学基因组学 基因组学(基因组学(Genomics)是一门对生命有机体全基因组进行)是一门对生命有机体全基因组进行序列分析和功能研究的新兴学科。序列分析和功能研究的新兴学科。随着人类基因组测序工作的初步完成,基因组学的研究由随着人类基因组测序工作的初步完成,基因组学的研究由最初的最初的结构基因组学结构基因组学向向功能基因组学功能基因组学转移。研究目标从转移。研究目标从单单纯的基因结构和表达纯的基因结构和表达发展为发展为整体水平上的基因组分析整体水平上的基因组分析。基因组学(基因组学(genomics):):以基因组为研究对象的一门科学,以基因组为研究对象的一门科学,包括基因组作图、核苷酸序列测定、基因定位及基因功能分包括基因组作图、核苷酸序列测定、基因定位及基因功能分析等。析等。 基因基因组和基因组学课件基因基因组和基因组学课件2.3 基因组学基因组学2.3.1 人类基因组计划人类基因组计划2.3.2 结构基因组学结构基因组学 2.3.3 基因定位克隆基因定位克隆 2.3.4 基因组功能研究基因组功能研究 2.3.5 基因组学与进化基因组学与进化 2.3.6 宏基因组学宏基因组学 基因基因组和基因组学课件基因基因组和基因组学课件2.3.1 人类基因组计划人类基因组计划人类基因组计划(人类基因组计划(The Human Genome Project, HGP)是二十世纪九十年代处开始启动的多国科学合作计划,对是二十世纪九十年代处开始启动的多国科学合作计划,对由少数人进行全基因组(即由少数人进行全基因组(即24条非同源染色体,共条非同源染色体,共30亿碱亿碱基)的测序和拼接,绘制出人类基因的谱图基)的测序和拼接,绘制出人类基因的谱图 。我国于我国于19991999年年9 9月积极参加到这项研究计划中的,承担其月积极参加到这项研究计划中的,承担其中中1%1%的任务,即人类的任务,即人类3 3号染色体上约号染色体上约30003000万个碱基对的测万个碱基对的测序任务。序任务。 基因组计划(基因组计划( genome project):):以获得某物种基因组全序以获得某物种基因组全序列为主要目标的科学计划列为主要目标的科学计划 基因基因组和基因组学课件基因基因组和基因组学课件2.3.2 结构基因组学结构基因组学 主要包括全基因组测序和序列信息的结构分析。主要包括全基因组测序和序列信息的结构分析。基因组研究的中心内容之一。基因组研究的中心内容之一。基因基因组和基因组学课件基因基因组和基因组学课件2.3.3 基因定位克隆基因定位克隆 基因定位克隆:基因定位克隆:是指利用微卫星和是指利用微卫星和SNPSNP全基因组扫描来搜索全基因组扫描来搜索与疾病性状紧密相关的位点,从而确定疾病相关基因的位置与疾病性状紧密相关的位点,从而确定疾病相关基因的位置并进一步获得克隆。并进一步获得克隆。 随着基因组序列信息的积累,基因的定位克隆成果丰富,随着基因组序列信息的积累,基因的定位克隆成果丰富,并且在多基因疾病的数量性状等基因的克隆方面也有很大进并且在多基因疾病的数量性状等基因的克隆方面也有很大进展。展。 基因基因组和基因组学课件基因基因组和基因组学课件2.3.4 基因组功能研究基因组功能研究 根据已有基因的功能推测基因组中具有相似结构根据已有基因的功能推测基因组中具有相似结构的基因的功能,借助这种的基因的功能,借助这种同源性分析同源性分析认识一个新认识一个新基因的功能。基因的功能。基因突变失活有效的方法有基因突变失活有效的方法有定点突变定点突变、基因敲除基因敲除(knock-out)和)和RNARNA干扰技术干扰技术等。等。基因基因组和基因组学课件基因基因组和基因组学课件2.3.5 基因组学与进化基因组学与进化 生物进化的研究表明,所有生命都来自一个共同生物进化的研究表明,所有生命都来自一个共同的祖先。的祖先。基因组信息数学分析可获得的最重要的直接结果基因组信息数学分析可获得的最重要的直接结果之一就是之一就是物种之间的进化距离物种之间的进化距离 。比较基因组学比较基因组学:是一门新兴的交叉学科,在基因:是一门新兴的交叉学科,在基因组学水平上研究不同物种在基因组结构与功能方组学水平上研究不同物种在基因组结构与功能方面亲缘关系、内在的联系,以及进化地位。面亲缘关系、内在的联系,以及进化地位。基因基因组和基因组学课件基因基因组和基因组学课件2.3.6 宏基因组学(宏基因组学(Metagenomics) 宏基因组学宏基因组学就是以就是以环境样品中的微生物群体基因组环境样品中的微生物群体基因组为研究为研究对象对象, , 以功能基因筛选和测序分析为研究手段以功能基因筛选和测序分析为研究手段, ,通过非培通过非培养方法进行某个特殊生态环境中微生物群落的鉴定。养方法进行某个特殊生态环境中微生物群落的鉴定。主要技术包括主要技术包括DNADNA的提取、文库的构建和目标基因克隆的的提取、文库的构建和目标基因克隆的筛选筛选可用于发现新基因、开发新的生物活性物质、研究群落中可用于发现新基因、开发新的生物活性物质、研究群落中微生物多样性等。微生物多样性等。宏基因组宏基因组 :是指是指生境中全部微小生物遗传物质的总和。生境中全部微小生物遗传物质的总和。基因基因组和基因组学课件基因基因组和基因组学课件
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号