大肠杆菌基因组为双链环状的DNA分子-

Prokaryotic and eukaryoticchromosome structureD1 prokaryotic chromosome structureD2 chromatin structureD3 eukaryotic chromosome structureD4 genome complexityD5 the flow of genetic informationD1 Prokaryotic chromosome structureTheEscherichia colichromosomeDNAdomainsDNA-bindingproteinsTheEscherichia colichromosomeAsingleclosed-circulardsDNAmoleculeTotallength:1300mMolecularweight:2.8*109DBasepairs:4.6MbThenumberorgenes:3000-4000Thestructures,functionsandlocationsingenemapof1400geneshavebeenconfirmed.Nucleoid:nonucleicmembrane,nonucleolus,nofixedconfiguration,simplestructureNucleoid大肠杆菌基因组为双链环状的DNA分子，在细胞中以紧密缠绕成的较致密的不规则小体形式存在于细胞中，该小体称为拟核（nucleoid）,其上结合有类组蛋白和少量RNA分子，并压缩形成一种脚手架形的（scaffold）致密结构。该区域DNA浓度高达3050mg/ml。正常生长时，DNA保持持续复制。生长时，DNA持续复制，生长速率最大时，每个细胞平均有基因组的两个拷贝。大肠杆菌及其他原核细胞就是以这种拟核形式在细胞中执行着诸如复制、重组、转录、翻译以及复杂的调节过程。基因组全序列测定于1997年由Wisconsin大学的Blattner等人完成。DNAdomainsTheDNAconsistsof50-100domainsorloop.Eachdomainhassupercoilingofdifferentlevel.TheE.colichromosomeasawholeisnegativelysupercoiled.Theendsofdomainsareconstrainedbybindingtoastructurewhichprobablyconsistsofproteinsattachedtopartofthecellmembrane.Theloopsareabout50-100kbinsize.Thedomainsarewrappedbynonspecificalhistone-likeproteinssuchasHUandH-NS,sohalfofthesupercoilingsareconstrained.RNApolymeraseandmRNAmoleculesandsite-specificDNA-bindingproteinssuchasintegrationhostfactor(IHF)maybeimportantintheorganizationoftheDNAdomains.highlyorderedDNA-proteincomplexessuchasnucleosomeshavenotbeendetected.SupercoilingofthegenomeDNA-bindingproteinsH两个28KD的相同亚基30000个二聚体HU两个9KD的不同亚基40000个二体聚体HLP117KD的亚基20000个单体P3KD的亚基未知这些DNA结合蛋白，使E.coli 染色体DNA压缩成为一个脚手架形结构，结构中心是多种DNA结合蛋白，DNA双螺旋分子有许多位点与这些蛋白结合，形成约100个小区，每个小区的DNA都是负超螺旋，一个小区的DNA有两个端点被蛋白质固定，每个小区相对独立。HUHU被称为类组蛋白(histone-likeprotein)。在动物、植物细胞里，很长很长的DNA分子靠一些叫做组蛋白(histones)的蛋白质来组织、压缩，才能装进空间较小的细胞核。在细菌细胞内，HU被认为起类似组蛋白的作用。HU由两个相似的亚基构成，分别称为HU-和HU-。两个亚基各形成一个类似受臂的结构，将双螺旋的DNA分子抱住。D2 Chromatin structureChromatinHistonesNucleosomesChromatinThetotallengthofDNAinaeukaryoticcelldependsonthespecies,butitcanbethousandsoftimesasmuchasinaprokaryoticgenome.TheDNAismadeupofanumberofdiscretebodiescalledchromosomes.Eachchromosomeisasinglelinearmolecule,whichcanbeuptoseveralcentimeterslong.Chromatin:ahighlyorganizedcomplexofDNAandprotein（11）ChromatinandchromosomeChromatinandchromosome染色质（chromatin）:指间期细胞核内由DNA、组蛋白、非组蛋白及少量RNA组成的线性复合结构,是间期细胞遗传物质存在的形式。染色体(chromosome):指细胞在有丝分裂或减数分裂过程中,由染色质聚缩而成的棒状结构。染色质与染色体是在细胞周期不同的功能阶段可以相互转变的的形态结构染色质与染色体具有基本相同的化学组成，但包装程度不同,构象不同。HistonesMostoftheproteinineukaryoticchromatinconsistsofhistones.Fivefamilies:Corehistones:H2A,H2B,H3andH4H1Allhistoneproteinshavealargepositivecharge,between20and30%oftheirsequenceconsistofthebasicaminoacids,lysineandarginine.ThismeansthathistoneswillbindverystronglytothenegativelychargedDNAinformingchromatin.染色体中的五种蛋白组蛋白类别碱性氧基酸LysArg酸性氨基酸碱/酸氨基酸残基数分子量H1极富Lys29155.421523,000H2A119151.412913,960H2B稍富Lys166131.712513,774H31013131.813515,342H4富Arg1114102.510211,282核心组蛋白核心组蛋白Smallproteins,withmassesbetween10-20kDa核心组蛋白的基因非常保守。亲缘关系较远的种属中,四种组蛋白(H2A、H2A、H3、H4)氨基酸序列都非常相似.e.g.海胆组织H3的氨基酸序列与来自小牛胸腺的H3的氨基酸序列间只有一个氨基酸的差异；小牛胸腺的H3的氨基酸序列与豌豆的H3只有4个氨基酸不同。H1组蛋白组蛋白H1的分子量较大，约23kDa不同生物的H1序列变化较大,在某些组织中，H1被特殊的组蛋白所取代。e.g.成熟的鱼类和鸟类的红细胞中H1被H5取代,精细胞中则由精蛋白代替组蛋白。H1更易从染色质中提纯其存在量为其他几种核心组蛋白的一半NucleosomesSupportingproofsaccordingtoexperimentsStructureofnucleosomesTheroleofH1LinkerDNAThe30nmfiberHigherorderstructure主要实验证据主要实验证据铺展染色质的电镜观察未经处理的染色质自然结构为30nm的纤丝，经盐溶液处理后解聚的染色质呈现10nm串珠状结构用非特异性微球菌核酸酶消化染色质，部分酶解片段分析结果应用X射线衍射、中子散射和电镜三维重建技术研究，发现核小体颗粒是直径为11nm、高6.0nm的扁园柱体，具有二分对称性，核心组蛋白的构成是先形成（H3）2（H4）2四聚体，然后再与两个H2AH2B异二聚体结合形成八聚体SV40微小染色体分析与电镜观察核小体结构核小体结构要点要点每个核小体单位包括200bp左右的DNA超螺旋和一个组蛋白八聚体及一个分子H1组蛋白八聚体构成核小体的盘状核心结构146bp的DNA分子超螺旋盘绕组蛋白八聚体1.75圈,组蛋白H1在核心颗粒外结合额外20bpDNA，锁住核小体DNA的进出端，起稳定核小体的作用。包括组蛋白H1和166bpDNA的核小体结构又称染色质小体。两个相邻核小体之间以连接DNA相连，典型长度60bp，不同物种变化值为080bp。组蛋白与DNA之间的相互作用主要是结构性的，基本不依赖于核苷酸的特异序列，实验表明，核小体具有自组装的性质。核小体沿DNA的定位受不同因素的影响，进而通过核小体相位改变影响基因表达核小体组蛋白DNAThe role of H1OnemoleculeofhistoneH1bindstothenucleosome,andactstostabilizethepointatwhichtheDNAentersandleavesthenucleosomecore.InthepresenceofH1,166bp(146+20)ofDNAisprotectedfromnucleasedigestion.AnucleosomecoreplusH1isknownasachromatosome.ThelargersizeofH1comparedwiththecorehistonesisduetothepresenceofanadditionalC-terminaltail,whichservestostabilizetheDNAbetweenthenucleosomecore.Linker DNA“beadsonastring”structure:globularparticles(nucleosomes)thinstrandsofDNATheaveragelengthoflinkerDNAbetweencoreparticlesis55bp,butthelengthvariesbetweenspeciesandtissuesfromalmostnothingtomorethan100bp.The30nmfiberThenucleosomesarewoundintoahigherorderleft-handedhelix,dubbedasolenoidwith30nmdiameter.aroundsixnucleosomesperturnHigherorderstructurePrimarystructure:nucleosomeSecondarystructure:solenoidTertiarystructure:chromosomalloopQuaternarystructure:chromatin压缩7倍压缩6倍DNA核小体螺线管染色体环染色单体Primarystructure:nucleosome核小体，可视为染色体DNA的一级包装，即由直径2nm的DNA双螺旋链绕组蛋白形成直径11nm的核小体“串珠”结构。若以每碱基对沿螺旋中轴上升距离为0.34nm计，200bpDNA(一个核小体的DNA片段)的伸展长度为68nm，形成核小体后仅为11nm(核小体直径)，其长度压缩了6-7倍。在低离子强度和去H1组蛋白的条件下,电镜下可清晰地看到染色体一级包装的核小体纤维。Secondarystructure:solenoid若增大离子强度，并保留H1，通过电镜可观察到10nm纤维会折转成较粗的30nm纤维，这种纤维即染色体DNA的二级包装。目前较公认的二级包装结构模型是螺线管纤维。它是由核小体纤维盘绕形成的一种中空螺线管，其外径为30nm,每圈含6个核小体。因此，螺线管的形成使DNA一级包装又压缩6倍。若以充分伸展的DNA双螺旋论，每个螺线管包含了408nm(668nm)长度的DNA链，而每圈螺线管的长度几乎等于核小体直径，即11nm，故染色体的二级包装相当于将DNA长度压缩了近40倍。H1组蛋白在维持毗邻核小体的紧密度及核小体纤维折转形成螺线管中起了重要作用。Tertiarystructure:chromosomalloop螺线管纤维基础上的更高一级包装是形成环状螺线管。电镜观察结果提示，这种结构是30nm纤维缠绕在一个由某些非组蛋白构成的中心轴骨架上形成的。即螺线管纤维相隔一定间距的某些区段被“拉拢”固定在蛋白轴上，从而产生了许多从骨架上伸出的纤维环。动物细胞中每个纤维环包含了5-1010kbDNA,这显然使螺线管纤维得到了较大程度的压缩。据认为,纤维环的形成是基因表达较理想的结构。这些环状区是基因表达的活性单位所在。从纤维环DNA比其它区域有更伸展的结构来理解这一点似乎是合理的.Quaternarystructure:chromatin上述三级包装完成后,DNA链被压缩的程度仍远不足以形成能被细胞核容纳的染色体.具环形区的螺线管纤维需进一步以某种方式盘绕、折叠,最终完成细胞生长和繁殖的不同时期的染色体包装.这种在更高层次上的复杂的包装是以何种方式进行的,目前尚无明确定论.但无疑是染色体DNA包装的重要内容.D3 Eukaryotic chromosome structureThemitoticchromosomeInterphasechromosomesDNaseIhypersensitivityCpGmethylationHistonevariantsandmodificationThe mitotic chromosomeconformationofchromatininmitosisormeiosismosthighlycondensedstateTwoidenticalsisterchromatidsjoinattheircentromeres.Thetipsofthechromosomesarethetelomeres,whicharealsotheendsoftheDNAmolecule.StructureofchromosomeStructure of chromosomeCentromere(primaryconstriction)SecondaryconstrictionNORSatelliteTelomereThecentromereprimaryconstrictionthesiteoftwoidenticalsisterchromatidsjoinedthesiteofassemblyofthekinetochoreTheDNAofthecentromerehasbeenshowninyeasttoconsistmerelyofashortAT-richsequenceof88bp,flankedbytwoveryshortconservedregions.Inmammaliancells,centromeresseentoconsistofratherlongersequences,andareflankedbyalargequantityofrepeatedDNA,knownassatelliteDNA.TelomeresTelomeresarespecializedDNAsequencesthatformtheendsofthelinearDNAmoleculesoftheeukaryoticchromosomes.Thebiochemicalfunctionoftelomeresaremaintainingthestabilityofchromosomes.Atelomereconsistsofuptohundredsofcopiesofashortrepeatedsequence,andthesequencesarehighly-conserved.e.g.5-TTAGGG-3inhumanItissynthesizedbythetelomerasebyreversetranscription.荧光原位杂交显示的端粒（上）和端粒序列（下）InterphasechromosomesIninterphase,thegenesonthechromosomesarebeingtranscribedandDNAreplicationtakeplace(duringS-phage).Thechromosomesadoptamuchmorediffusestructure.TypeEuchromatinHeterochromatinEuchromatin构成不均一染色体环所在位置非常不活跃。基因进行活跃转录的部位呈疏松的环状，电镜下表现为浅染，为解螺旋状态。在遗传行为上表现为活性；易被核酸酶在一些敏感的位点（hypersensitive sites）降解。HeterochromatinThechromatinremainshighlycompactedininterphase,althoughnotsocompactedasatmetaphase.consistoftherepeatedsatelliteDNAclosetothecentromeresofthechromosomesHeterochromatinistranscriptionallyinactive(inactivechromatin).GeneticinertiaHeteropycnosisThetwoXchromosomesinfemalemammalsareheterochromatin.异染色质（核内深染部分）和常染色质（核内浅染部分）DNaseIhypersensitivity当一个基因成为转录活性状态时，含有这个基因的染色质区域对DNase（一种内切酶）的敏感性要比无转录活性区域高得多。这是因为DNase可切割裸露DNA，由于此区域染色质的DNA蛋白质结构变得松散，DNase易于接触到DNA。较长的敏感区域意味着该区域正在进行转录，因此染色质对DNase的敏感性可被用来定位细胞中具转录活性的染色质。e.g.鸡的珠蛋白和卵清蛋白系统鸡的珠蛋白和卵清蛋白系统鸡胚红细胞的核中，珠蛋白的基因对DNase的降解是敏感的，而编码卵清蛋白的基因在红细胞中不表达，因此它对DNase的降解具有抗性。相反，在母鸡输卵管细胞的核中，卵清蛋白的基因具有转录活性，但却不能产生珠蛋白的RNA，卵清蛋白基因的序列对DNase的降解要比珠蛋白基因的序列敏感得多。实验步骤实验结果实验步骤实验以克隆的特异基因为探针，应用Southern杂交技术来论证DNA序列对DNase敏感性的改变。用不同浓度的DNase来处理样品，然后从各染色质样品中抽取DNA，再用限制性酶BamHI来降解（它可在珠蛋白基因两侧中的任一侧剪切，两个BamHI位点在染色体DNA上相隔4.5kb）。此DNA片段经琼脂糖电泳并通过Southern吸印技术转移到尼龙膜上，此膜和放射性珠蛋白探针进行分子杂交，来确定珠蛋白基因DNA片段的大小，从而可以推断是否被DNAase降解过。实验结果红细胞中提取的染色质，珠蛋白基因含有的DNA片段看来随着DNase浓度的增加，4.5kbBamH1-BamH1逐渐消失，表明含有珠蛋白基因的染色质片段对DNase的降解是敏感的，即珠蛋白的基因区域染色质组成是松散的，珠蛋白基因DNA序列很容易和DNase接触。实验对照，从对照组细胞(不产生珠蛋白)中分离的染色质，其4.5kbBamH1DNA片段未被任何浓度的DNase所降解。此结果表明不产生珠蛋白的细胞中相关的染色质是高度凝聚的。所以珠蛋白的基因序列不易于和DNase接触，从而不发生降解。用克隆的卵清蛋白基因为探针，来分析红细胞中的卵清蛋白基因（用BamH1酶来处理，可切成20-KbDNA片段）表明卵清蛋白基因对DNase的降解不敏感，20-KbBamH1-BamH1DNA片段在各种浓度的DNase作用下依然存在，结果表明在细胞中不产生卵清蛋白，因此基因组中这一区域并不变得松散。很多这类实验得出的结论几乎都是有转录活性的基因对DNase的敏感性增加，DNase敏感区的范围随着基因序列的不同而变化，从基因周围几个Kb到两侧20Kb大小不等。Hypersensitiveregion仔细分析具有转录活性基因周围的DNA区域，表明有一个中心区域存在，称为超敏感区域超敏感区域（hypersensitiveregion）或超敏感位点超敏感位点（hypersensitivesite），它对DNase是高敏感的。这些位点或区域将首先受到DNase的剪切。对DNase的敏感性反映了染色质中DNA的有效性，我们将这些位点描述为染色质中特殊DNA暴露区域，一般在转录起始点附近，即5端启动子区域，少部分位于其它部位如转录单元的下游。超敏感位点位于转录起始之前，转录的诱导物除去后虽超敏感位点仍然存在，但转录却很快停止，说明超敏感位点的存在是转录起始的必要条件，但不是充分条件。超敏感位点是一段长200bp左右的DNA序列，这些区域是低甲基化区；并可能有局部解链的存在；不存在核小体结构或结构不同寻常，此区域因DNA的裸露，易和多种酶或特异的蛋白质结合，也就是说易于和反式作用因子结合。HMG14 and HMG17染色质对DNase的敏感性与2种非组蛋白有关，高泳动蛋白14（HMG14，high-mobilitygroup）和HMG17，这是两种高丰富度小分子量（30KDa）的蛋白。活化染色质中，每10个核小体就结合一个HMG分子，当从红细胞中提出这两种蛋白时，珠蛋白基因不再对DNase出现敏感，当将这两种蛋白重新加入到此系统中，敏感性又可得到恢复。HMG蛋白的C端含活性氨基酸，可与核小体核心组蛋白的碱性区域相结合。HMG蛋白的N端1/3的区域氨基酸序列与H1和H5的C端十分相似。而HMG在核小体上位置与H1相近，HMG和组蛋白相互作用。可以竞争性取代H1或H5，核小体缺乏H1和H5将使染色质变得松散，成为具有转录活性的状态。影响染色质活性的其他因素除HMG以外可能还有别的因素会影响到染色质的活性，当把上述两种HMG加入鸡脑细胞的染色质中，其中珠蛋白基因所在区域并不表现出对DNase的敏感，表明红细胞和脑细胞还存在其它因子的差异，这些因子在盐抽提后仍留在染色质中，它们决定了红细胞珠蛋白基因区域在HMG14和HMG17存在时对DNase敏感。CpGmethylation真核生物基因组中存在着广泛的甲基化，DNA甲基化主要发生在CpG岛的5C上，其作用是导致基因的失活。一般说，DNA甲基化程度越高，这段DNA被转录成RNA并翻译成有功能蛋白质的可能性越小。甲基化作用好像是基因组用来防御寄生性遗传元件（parasiticgeneticelements），如转座子转移的。哺乳动物DNA中5CG3序列通常在胞嘧啶碱基处被甲基化，它与染色质中的非转录区相连。基因组中还有未甲基化的CpG“岛”，包围着持家基因的启动子区域，形成DNase敏感区。Histonevariantsandmodification组蛋白的共价修饰可通过影响组蛋白与DNA双链的亲和性，从而改变染色质的松散或凝集状态，来调节基因的表达。组蛋白共价修饰研究较为深入的是组蛋白乙酰化和甲基化。组蛋白乙酰化组蛋白甲基化其他组蛋白修饰方式通过乙酰化或磷酸化等化学方法对组蛋白进行修饰，可以引起染色质结构的改变，从而导致基因活性的改变。组蛋白乙酰化组蛋白乙酰化是由组蛋白乙酰转移酶（TACs）和组蛋白去乙酰化酶（HDACs）协调进行的，主要发生在组蛋白N末端的赖氨酸，组蛋白乙酰化呈多样性，核小体上有多个位点可提供乙酰化，但特定基因部位的组蛋白乙酰化和去乙酰化以一种非随机的、位置特异的方式进行。e.g.IFN-基因启动子附近组蛋白赖氨酸（H4K8,H3K9和K14）乙酰化，该表面能与特异的蛋白识别模块（proteinrecognitionmodules）结合。H4K8修饰产生的特异信号是SWI/SNF复合物BRG1组分的识别结合面（bindingsurfaces），而H3K9和K14修饰产生的信号是TFIID组分TAFII250的识别结合面。因此，这些特异的蛋白识别面代表了IFN-启动子组蛋白乙酰化“密码”，并参与IFN-转录激活作用的调节。组蛋白甲基化组蛋白甲基化是由组蛋白甲基化转移酶（histonemethyltransferases）完成的，甲基化可发生在赖氨酸和精氨酸残基上，赖氨酸残基能够单、双、三甲基化，而精氨酸残基能够单、双甲基化，这就极大的增加了组蛋白修饰调节基因表达的复杂性。当前的证据表明，组蛋白精氨酸甲基化是一种相对动态的标记，精氨酸甲基化与基因激活相关，而H3和H4靶精氨酸的甲基化丢失与基因沉默相关。相反，赖氨酸甲基化似乎是基因表达调控较为稳定的标记，例如，H3第4位的赖氨酸残基甲基化与基因激活相关，而第9位和第27位赖氨酸甲基化与基因沉默相关其他组蛋白修饰方式其他几种方式如磷酸化、腺苷酸化、泛素化、ADP核糖基化等等。这些修饰可能通过两种机制影响染色体的结构与功能。首先，这些修饰几乎都能改变组蛋白的电荷，因此改变了组蛋白与DNA结合的特性；第二，这些修饰能够产生蛋白识别模块(proteinrecognitionmodules)的结合表面，因此能募集专一蛋白复合物到它们的表面起作用。所以有人称这些能被专一识别的修饰信息为组蛋白密码，所有这些组蛋白密码组合变化非常多，因此,组蛋白共价修饰可能是更为精细的基因表达方式。D4 genome complexityNoncodingDNAReassociationkineticsUniquesequenceDNATandemgeneclustersDispersedrepetitiveDNASatelliteDNAGeneticpolymorphismNoncodingDNAThegenomesofcomplexeukaryoticorganismsmaycontainmorethan1000timesasmuchasprokarytotes.MuchoftheDNAdoesnotcodeforprotein.Thecodingregionsofgeneareinterruptedbyintronsequenceandgenesmaytakeupmanykilobasesofsequencebutgenesarebynomeanscontiguousalongthegenome,theyareseparatedbylongstretchedofsequenceforwhichthefunctionunknown.MuchofthisnoncodingDNAconsistsofmultiplerepeatsofsimilaroridenticalcopiesofafewdifferenttypesequence.Thesecopiesmayfollowoneanotherdirectly(tandemlyrepeated).e.g.satelliteDNATheymayoccurasmultiplecopiesscatteredthroughoutthegenome(interspersed).e.g.Aluelements垃圾垃圾DNA中发现不编码蛋白质的新型基因中发现不编码蛋白质的新型基因科学家用垃圾DNA来描述那些未加利用的人类基因组DNA片断，它们包括一些长的没有已知功能的DNA链。2004年12月17日发表的science杂志以“隐藏的DNA财富”为题，将非编码DNA的研究工作列为2004年度十大科学突破之一。人类基因组有3-4万个基因。基因组的很大部分为垃圾DNA，科学家正努力找出垃圾DNA大量存在的原因，并通过它们找到潜在的治疗疾病的方法。美国哈佛医学院的研究人员表示，他们在酵母基因组的垃圾DNA中发现了一种新基因。与其它基因不同，这个新基因并不编码蛋白质或者酶以表现出功能。但当这个基因开启时，它将调控临近基因的表达。“这并不能解释所有垃圾DNA。它表明了部分垃圾DNA的潜在用途。”新发现的基因名为SRG1，它能够利用转录获得的RNA屏蔽或者压制酵母基因组中临近基因的功能。温斯顿及其研究小组将这项发现发表于最新一期nature杂志。他们认为肯定有其它基因以同样的方式起作用，其它生物体的基因组中也应该存在这种基因，包括人类。真核基因组的一般实质可以由变性DNA的复性动力学方程(Kineticsofreassociation)获得。DNA互补链的复性通过碱基配对发生，它与DNA分离的变性过程相反。复性反应的动力学方程反映了存在多种序列，因此这个反应可用来定量基因和RNA产物。ReassociationkineticsThegenomesequencecomplexitywasstudiedusingmeasurementsoftheannealingofdenaturedDNA.ExperimenttheoryExperimentprocessConclusionsRepetitivesequence不同物种基因组大小差异的原因大的基因组含有更多的不同基因？或含有在小基因组中出现的小基因更多拷贝?该问题可以直接用基因组序列来回答，但目前我们只了解少数种属(相对较小)的有关信息。基因的多样性随着基因组大小而增加，我们可以认为基因组中不同DNA序列会增加，但不会只增加相同基因拷贝数。ExperimenttheoryGenomicDNAfragmentsofauniformsizenormallypreparedbyshearingofsonicationarethermallydenaturedandallowedtore-annealatalowconcentration(25).ThefractionoftheDNAwhichisreassociatedafteragiventime(t)willdependontheinitialconcentrationoftheDNA,C0.ThereassociationrateofDNAisalsocorrelatedwiththegenomesequencecomplexityandrepetitiondegree.C0对复性速率的影响浓度越高，互补链的碰撞机会越多，复性速率越快反之，较慢SequencecomplexityandrepetitiondegreeSingle-strandedfragmentswhichhaveasequencewhichisrepeatedinmultiplecopiesinthegenomewillbeabletoannealwithmanymorealternativecomplementarystrandsthanfragmentswithauniquesequence,andwillhencereassociatemorerapidly.highlyrepetitivesequencestructuralgenee.g.ATATATExperimentprocessThere-annealingofthestrandsmaybefollowedspectroscopically,ormoresensitivelybyseparatingsingle-strandedanddouble-strandedDNAbyhydroxyapatilechromatography.ThefractionoftheDNAstillinthesingle-strandedform(f)isplottedagainstCot.TheresultingcurverepresentsthereassociationkineticsoftheDNAsample,andiscolloquiallyknownasaCotcurve.Conclusions根据这类复性研究，证实重复顺序是真核生物DNA区别于原核生物DNA的一个重要特征。即所有真核生物染色体可能均含重复序列而原核生物一般只含单一序列。高度和中度重复序列的含量随真核生物物种的不同而变化。E.coliDNA没有重复顺序。在反应的起始阶段全都是单链，到最后阶段都成为双链，所以E.coli 的复性曲线可以看作为是一条理想曲线。小牛DNA的复性曲线明显有异于E.coli：前面一段曲线表明，小牛DNA片段的顺序短，重复程度高，所以复性速率明显高于E.coli；后面一段曲线与单拷贝顺序有关，复性速率大大低于E.coli，因为小牛基因组中单一顺序远比E.coli复杂之故。Repetitivesequence真核生物基因组中重复出现的3类核苷酸序列。高度重复序列：重复几百万次，一般是少于10个核苷酸残基组成的短片段。如异染色质上的卫星DNA。它们是不翻译的片段。在小鼠中约占基因组的10。中度重复序列：重复次数为几十次到几千次。在小鼠中约占20。e.g.rRNA基因、tRNA基因编码组蛋白、肌动蛋白、角蛋白等的基因单一序列：在整个基因组中只出现一次或少数几次的序列，在小鼠中约占基因组的70。e.g.珠蛋白基因、卵清蛋白基因、丝心蛋白基因等真核类DNA的重复程度大致有下列3种UniquesequenceDNAoccurinonlyoneorafewcopiesperhaploidgenome,andanyuniquesequenceinterveningsequence.correspondingtothecodingregionsofgenestheslowesttoreassociateonaCotcurve.E.coli:AlltheDNAhasauniquesequence.SincethelengthofitsDNAistooshort,soanygivensequencehascorrespondinglymorealternativepartnersatagivenconcentration,anditsreassociationoccursfaster,thatisatalowervalueofCot.Tandem gene clustersGenecluster 一个基因产生多次拷贝，顺序几乎相同，成簇地排列在一条染色体上，形成一个基因簇。Tandemgeneclusters由串联重复的基因或基因簇构成的中度重复DNA区段，称为串联重复基因簇。e.g.rRNAgenesclustershistonegeneclustersrRNAgenesclustersThegenewhichencodesthe45Sprecusorofthe18S,5.8Sand28SrRNAsisrepeatedinarrayscontainingfromaround10to10000copiesdependingonthespecies.ThegenesarelocatedtogetherinNOR.Inhumans,the45Sgeneoccursinarraysonfivechromosomes(13,14,15,21and22),eachcontainingaround40copies.5SrRNAgeneoccursonNO.1chromosome（1q42-43）,andeachhaploidgenomehas1000copiesof5SrRNAgenes.Histonegeneclusters5个组蛋白基因同在一个基因簇，串联重复达数百次。重复的次数随物种而异，但都在中度重复的范围内。通常每种组蛋白的基因在同一种生物中拷贝数相同。e.g.鸡的基因组中有10个拷贝，哺乳动物中为20拷贝，非洲爪蟾为40拷贝，海胆中可达300-600拷贝。不同生物中组蛋白基因在基因组中的排列不一样，而在拷贝数高的基因组中（100拷贝），大部份组蛋白基因串联重复形成基因簇。基因组中存在大量重复序列用以编码组蛋白是有其重要意义的。DNA复制时，组蛋白也要成倍增加，而且往往在DNA合成一小段后，组蛋白马上就要与其相结合，这要求在较短的时间内合成大量的组蛋白，因而需要有大量的组蛋白基因存在。DispersedrepetitiveDNAMostofthemoderatelyrepetitiveDNAinmanyspeciesarerepeatedmanythousandsoftimesandarescatteredthroughoutthewholegenome.Type:accordingtothelengthoftherepetitivesequenceSINESLINESe.g.AluelementSINES短分散重复序列(shortinterspersednuclearelements)，或(shortinterspersedrepeatedsequences)长度在500bp以下在人基因组中的重复拷贝数达10万以上LINES长散在重复序列(longinterspersednuclearelements）或（longintersperedrepeatedsequences)重复序列单元长度在1000bp以上在人基因组中有上万份拷贝Alu家族Alu家族的分布Alu家族的命名Alu顺序具有种的特异性Alu序列广泛分布的原因Alu家族的功能Alu家族的分布Alu序列是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族，在单倍体人基因组中重复达30万-50万次，约占人基因组的3-6。Alu序列分散在整个人体或其他哺乳动物基因组中，在间隔DNA、内含子中都发现有Alu序列，平均每5kbDNA就有一个Alu序列。已建立的基因组中均毫无例外的含有Alu序列。Alu家族的命名每个成员的长度约300bp，由于每个单位长度中有一个限制性内切酶Alu的切点（AGCT）从而将其切成长130和170bp的两段，因而定名为Alu序列（或Alu家族）。序列分析表明人类Alu顺序是由两个约130bp的正向重复构成的二聚体，而在第二个单体中有一个31bp的插入序列，该插入序列在Alu家族的不同成员之间核苷酸顺序相似但不相同。每个Alu顺序两侧为6-20bp的正向重复顺序，不同的Alu成员的侧翼重复顺序也各不相同。Alu序列的5端比较保守，但富含脱氧腺苷酸残基的3端在不同的Alu成员中是有变化的。Alu顺序具有种的特异性在相近的生物体中Alu家族在结构上存在相似性，一般认为灵长类基因组中的Alu顺序多为由两个130bp的正向重复组成的二聚体，而啮类动物则为由一个130bp左右的DNA片段组成的单体。Alu序列在不同的哺乳动物之间存在着一定的相似性，但其序列相差较大，不会产生交叉杂交。人的Alu顺序制备的探针只能用于检测人的基因组中的Alu序列。大多数的由人的DNA制备的克隆中都含有Alu顺序，因此，可以这样认为：用人的Alu序列制备的探针与要筛选的克隆杂交，阳性者即为含有人DNA克隆，阴性者不含人的DNA。Alu顺序广泛散布于整个基因组的原因可能是由于Alu顺序可由RNA聚合酶转录成RNA分子，再经反转录酶的作用形成cDNA,然后重新插入基因组所致。也有人认为Alu序列两侧存在着短的重复顺序，使得Alu顺序很象转座子，因此推测Alu顺序可能也是能够移动的。这可能是它们在整个基因组中含量如此丰富，分布如此广泛的原因之一。Alu序列广泛分布的原因许多核内不均一RNA(hnRNA)中含有大量的Alu顺序，且Alu顺序含有与某些真核基因内含子剪接接头相似的序列，因而，Alu顺序可能参与hnRNA的加工与成熟。Alu序列在人基因组中不寻常地大量存在，提示它与遗传重组及染色体不稳定性有关。最近发现在人的组织细胞中存在染色体外双链环状DAN，被称为人类质粒（humanplasmid），而这些质粒均含有Alu顺序。Alu顺序中的某些区段有形成Z-DNA的能力。Alu顺序可能具有转录调节作用。Alu家族的功能是多方面的SatelliteDNAHighlyrepetitiveDNAsequence:manythousandsofcopiesRepetitiveelements:2bpto20-30bpinlengthTandemarrayTypeFunction卫星DNA是指DNA在氯化铯（CsCl）密度梯度离心中，当重复序列的GC与AT的比例有差异，GC的含量少于AT时，可在DNA主峰旁形成一个伴随峰，即卫星DNA。Minisatellites(variblenumbertandemrepeats,VNTRs)6-25bp,tandemrepeatsmorefrequentlyfoundnearchromosomeends.DNAfingerprintingtechniqueMicrosatellites(simpletandemrepeats,STRs)2-6bp,tandemrepeatsmoreevenlydistributedalongthechromosomes.卫星DNA的功能构成染色体的着丝粒、端粒、Y染色体长臂上的异染色质区；高度重复序列不能转录，形成结构基因的间隔；参与维持染色体的结构，与减数分裂联会有关。GeneticpolymorphismWhenthesameregion,orlocus,ofachromosomehastwo(ormore)slightlydifferentDNAsequenceindifferentchromosomesorindividualsofthesamespecies,thesearedescribedaspolymorphsandthelocusissaidtoshow(genetic)polymorphism.Cause:thechangeofbaseonthelocusSNPSSLPRFLPSNP单核苷酸多态性(singlenucleotidepolymorphism)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在，平均每5001000个碱基对中就有1个，估计其总数可达300万个甚至更多。SSLP简单序列长度多态性（simplesequencelengthpolymorphism）一段小序列（十个碱基左右）在不同个体上有多态性不仅导致基因多态性的事件（同SNP），也可以导致数组重复序列在长度上的变化。重复的每一不同长度都是一种不同的形式常用于分子标记RFLPRestrictionfragmentlengthpolymorphism(限制性片段长度多态性，RFLP)指限制性酶位点上的遗传差异(例如，靶位点上的碱基改变产生)，这些差别引起相关限制性酶切割产生不同长度片段。基本原理PCRRFLP基本原理特定生物类型的基因组DNA经某一种限制性内切酶完全酶解后，会产生分子量不同的片段。点突变产生和去除酶切位点插入和缺失造成酶切位点间的长度发生变化假如DNA顺序中的某个碱基发生了突变，使突变所在部位的DNA序列产生（或缺失）某种限制性内切酶的位点。这样，利用该限制性内切酶消化此DNA时，便会产生与正常不同的限制性片段。这样，在同种生物的不同个体中会出现不同长度的限制性片段类型，即限制性片段多态性（RFLP）聚合酶链反应-单链构象多态性分析（SingleStrandConformationPolymorphismAnalysisofPolymeraseChainReactionProducts,PCR-SSCP）是近年来发展起来的一种基因分析方法。PCR-SSCP分析的基本程序由此可见，PCR-SSCP分析技术是一种DNA单链凝胶电泳技术，它根据形成不同构象的等长DNA单链在中性聚丙烯酰胺凝胶中的电泳迁移率变化来检测基因变异。该技术已被广泛用于癌基因和抗癌基因变异的检测、遗传病的致病基因分析以及基因诊断、基因制图等领域。PCR-SSCP首先PCR扩增特定靶序列，然后将扩增产物变性为单链，进行非变性聚丙烯酰胺凝胶电泳。在不含变性剂的中性聚丙烯酰胺凝胶中电泳时，DNA单链的迁移率除与DNA链的长短有关外，更主要的是取决于DNA单链所形成的构象。在非变性条件下，DNA单链可自身折叠形成具有一定空间结构的构象。这种构象由DNA单链碱基决定，其稳定性靠分子内局部顺序的相互作用（主要为氢键）来维持。相同长度的DNA单链其顺序不同，甚至单个碱基不同，所形成的构象不同，电泳迁移率也不同。PCR产物变性后，单链产物经中性聚丙烯酰胺凝胶电泳，靶DNA中含单碱基置换，或数个碱基插入或缺失等改变时，因迁移率变化会出现泳动变位，从而可将变异DNA与正常DNA区分开。PCR-SSCP分析的基本程序D5 the flow of genetic informationThecentraldogmaProkaryoticgeneexpressionEukaryoticgeneexpressionThecentraldogma1958,FrankCrick,centraldogmaaunidirectionalflowofgeneticinformationfromDNAthroughRNAtoproteini.e.DNAmakesRNAmakesproteinReversetranscription:Intheretroviruses,thesingle-strandedRNAmoleculeisconvertedtoadouble-strandedDNAcopy,whichistheninsertedintothegenomeofthehostcell.e.gHIV(AIDS)RNAreplication:RNAgenomeiscopieddirectlyintoRNA,withouttheuseofDNAasanintermediaryRNAediting:RNAisalteredafteritistranscirbedfromDNAThecentraldogma原核基因表达真核基因表达