资源预览内容
第1页 / 共98页
第2页 / 共98页
第3页 / 共98页
第4页 / 共98页
第5页 / 共98页
第6页 / 共98页
第7页 / 共98页
第8页 / 共98页
第9页 / 共98页
第10页 / 共98页
亲,该文档总共98页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
高通量测序应用与进展报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍高通量测序简介高通量高通量测序测序:一次性对一次性对几百万到十亿条几百万到十亿条DNA分子进行分子进行并行测序并行测序,又称为,又称为下一代测序技下一代测序技术术,其使得可对一个物种的转录组和基因,其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又组进行深入、细致、全貌的分析,所以又被称为被称为深度测序深度测序。 High-throughputSequencingNextGenerationSequencingDeepSequencingwww.sangon.com3高通量测序流程文库扩增低通量A Sanger测序 B 高通量测序并行测序高通量无需建立文库,两端加测序接头PCR扩增报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍高通量测序技术的起源与发展1992年LynxTherapeuticsMPSS2003年PolonySequencing(哈佛)2005年454Pyrosequencing2006年SolexaSequencing-by-Synthesis2007年ABISOLiD2008年HelicostSMSSequencing2010年IontorrentSemiconductorSequensing2011年PacificBiosciencesSMRTSequensingwww.sangon.com6高通量测序技术的传承关系图Lynx MPSSSolexaABISOLiD454Ion TorrentHelicosSMRTIlluminaSolexaRoche454Polony SeqABIIonTorrent现有主要高通量测序仪开发商测序仪品牌技术原理开发商Roche 454焦磷酸测序RocheIllumina Solexa边合成边测序IlluminaABI SOLiD基于磁珠的大规模并行连接测序ABIHelicos单分子荧光测序 HelicosIon Torrent半导体测序ABISMRT单分子实时测序 Pacific Bio454Pyrosequencing基于磁珠的焦磷酸测序:A 磁珠制备设备B 454测序仪C 454测序原理454测序流程454测序流程与BaseCalling454的特点与主要应用读长较长,400600bp通量较低,1Run 1M 序列,400600Mb相对成本较高主要应用:de novo测序IlluminaSolexa简介桥式PCR边合成边测序可逆终止物HiSeq 2000IlluminaSolexa测序流程IlluminaSolexa桥式PCRdioldiol1st cycle denaturation1st cycle annealingdioldioln=35total1st cycle extensiondioldioldioldiol2nd cycle denaturation2nd cycle annealingdioldioldioldioldioldiol2nd cycle extensionIlluminaSolexaBaseCalling123789456T T T T T T T G T T G C T A C G A T Solexa的特点与主要应用读长较短,100150bp通量高,25G每天,120-150G每Run主要应用:RNA测序、表观遗传学研究ABISOLiD简介SOLiDSequencingbyOligoLigation/DetectionOligo连接测序:通过连接酶连接,再对oligo上荧光基团进行检测SOLiD 5500xlABISOLiD测序前期制备A 样品片段化磁珠连接B 乳化PCR3末端修饰C 磁珠富集转到测序玻片ABISOLiD测序原理ABISOLiD荧光结合和结果示例SRR029969.1 VAB_5551_12_381_F3 length=35T11.0203.3.1113211010332111302330201+SRR029969.1 VAB_5551_12_381_F3 length=35!36!8/8:!:!4626=(8.)43),(95,A. SOLiD Oligo荧光基团模式图B. SOLiD 测序结果示例(Color Space)SOLiD的特点与主要应用读长较短,50-75bp精度高,可达Q40通量高, 20-30G每天,1Run 可达120G主要应用:基因组重测序、SNP检测等三种平台的技术差异平台平台454454SolexaSolexaSOLiDSOLiDPCR磁珠乳化PCR桥式PCR磁珠乳化PCR测序载体磁珠玻片玻片测序方式焦磷酸、荧光可逆终止物、荧光连接酶、荧光结果序列FastQFastQCSFastQ三种平台的效能参数差异平平 台台读长读长通量通量周期周期精度精度SolexaHiSeq2000Single-end:1x35bpPaired-end:2x50bpPaired-end:2x100bp25Gb/d1.5d4d8d50bp85%以上以上Q30100bp80%以上以上Q30SOLiD5500xlSingle-end:75bpPaired-end:75x35bpMate-pair:60x60bp2030Gb/d1d/1lane7d/12lane7d/12laneQ40454GSFLX400-600bp400600Mb/Run10hQ20报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍高通量测序应用范围DNADNA测序测序全基因组全基因组denovo测序测序基因组重测序基因组重测序宏基因组测序宏基因组测序人类外显子组捕获测序人类外显子组捕获测序RNARNA测序测序转录组测序转录组测序小小RNA测序测序电子表达谱测序电子表达谱测序表观基因组研究表观基因组研究ChIP-SeqDNA甲基化测序甲基化测序基因组测序基因组测序是对物种的基因组测序是对物种的基因组基因组DNADNA打断后进行高通打断后进行高通量测序,根据是否有已知基因组数据主要分为量测序,根据是否有已知基因组数据主要分为denovo全基因组测序和全基因组测序和基因组重测序基因组重测序。Denovo基因组测序是对基因组测序是对未知基因组序列未知基因组序列的物种进的物种进行基因组从头测序,利用生物信息学分析手段对行基因组从头测序,利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因组序列进行拼接、组装,从而获得该物种的基因组图谱。图谱。全基因组重测序是对全基因组重测序是对已知基因组序列已知基因组序列的物种进行的物种进行不同个体的基因组测序,并在此基础上对个体或不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。群体进行差异性分析。 基因组测序策略Paired-EndMate-End基因组测序流程两种测序策略Paired-end原理www.sangon.com29100bps100bps3000bpsPaired-end基因组重排分析Paired-end和测序深度对测序效果的影响Jun Wang, et al. Nature 456, 60-65(6 November 2008) 基因组测序的生物信息学分析数据产出处理数据产出处理:图像识别与:图像识别与BaseCalling去除接头去除接头序列、检测与去除污染序列等;序列、检测与去除污染序列等;基因组组装基因组组装:原始数据统计、测序深度分析、组:原始数据统计、测序深度分析、组装结果统计等;装结果统计等;基因组注释基因组注释:CodingGene注释、注释、RNA分类注释、分类注释、重复序列注释等;重复序列注释等;基因功能注释基因功能注释:GO功能分类、功能分类、Interpro功能分类功能分类等;等;比较基因组及分子进化分析比较基因组及分子进化分析:SNP/InDel/CNV检测检测等。等。References1、ErinD.Pleasance,PhilipJ.Stephens,SarahOMeara,etal.Asmall-celllungcancergenomewithcomplexsignaturesoftobaccoexposure.Nature,2010,463:184-190.2、MichaelJamesClark,NilsHomer,BrainD.OConnor,etal.U87MGDecoded:TheGenomicSequenceofaCytogeneticallyAberrantHumanCancerCellLine.PloSGenetics,2010,6(1):e1000832.3、WeiChen,ReinhardUllmann,ClaudiaLangnick,etal.Breakpointanalysisofbalancedchromosomerearrangementsbynext-generationpaired-endsequencing.EuropeanJournalofHumanGenetics,2010,18:539-543.4、VanTassellCP,SmithTP,MatukumalliLK,TaylorJF,SchnabelRd,etal.Whole-genomesequencingandvariantdiscoveryinC.elegans.NatMethods,2008,5(2):183-188.5、JunWang,WeiWang,RuiqiangLi,etal.ThediploidgenomesequenceofanAsianindividual.Nature456,60-65(6November2008)6、HuangSW,LiRQ,WangJ,etal.TheGenomeoftheCucumber(CucumissativusLinnaeus).NatureGenetics2009;doi:10.1038/ng.4757、DavidHernandez,etal.Denovobacterialgenomesequencing:Millionsofveryshortreadsassembledonadesktopcomputer.GenomeRes.2008.18:802-809www.sangon.com33基因组重测序案例分析ErinD.Pleasance,etal.Thecompendiumofsomaticmutationsinasmall-celllungcancergenome.Nature,2010,463:184-190.此研究用高通量测序对一个此研究用高通量测序对一个小细胞肺癌小细胞肺癌细细胞系胞系NCIH209基因组进行重测序,以探讨基因组进行重测序,以探讨吸烟引发该细胞系基因组中特定碱基及其吸烟引发该细胞系基因组中特定碱基及其周围序列的突变及细胞损伤修复原理。周围序列的突变及细胞损伤修复原理。 肺癌基因组变异情况统计图肺癌基因组变异情况统计图基因组重排和CNV分析从头基因组测序案例DavidHernandez,etal.Denovobacterialgenomesequencing:Millionsofveryshortreadsassembledonadesktopcomputer.GenomeRes.2008.18:802-809此研究对此研究对Staphylococcus aureusstrainMW2和和Helicobacter acinonychisstrainSheeba两种细菌基因组进行从头测序,并两种细菌基因组进行从头测序,并比较了几种拼接方法的效果。比较了几种拼接方法的效果。多种拼接软件拼接结果比较多种拼接软件拼接结果比较五种拼接方法的拼接结果比对五种拼接方法的拼接结果比对宏基因组测序宏基因组测序是对某一特定环境,如肠道、土壤、海水等中的所有微生物进行基因组测序。通过此方法可对该环境中的微生物种类和优势物种进行检测,揭示微生物群落多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系 。自然环境中很多微生物无法分离培养,而此方法无需对微生物进行分离培养。宏基因组测序方法现在有全基因组的宏基因组测序和16S/18SrRNA宏基因组测序。全基因组的宏基因组测序通过高通量测序技术,对环境样品的总 DNA 直接进行全基因组的宏基因组测序,能够实现微生物群落的物种分类研究、群落结构、系统进化、功能注释以及物种间的代谢网络研究,挖掘具有应用价值的基因资源,开发新的微生物活性物质。与传统的 Sanger法相比,速度快,性价比高,周期短,单个样品的测序量可以接近饱和。 宏基因组测序信息分析主要内容拼接组装物种分类组成分析基因预测和功能注释生成Profiling table主成分分析(PCA)筛选与样品分组显著相关的因子多样品间比较分析16S/18SrRNA宏基因组测序16S/18S rRNA是微生物群落分析和细菌进化研究以及分类研究最常用的靶分子,采用新一代测序技术,对16S/18S rDNA的可变区进行测序分析,不需进行克隆筛选,能全面的反映微生物群体的物种组成,真实的物种分布及丰度信息。 16S/18SrRNA测序信息分析内容物种分类、物种丰度分析OTU(OperationalTaxonomic Units )分析多样性分析系统进化分析多样品间的比较分析ReferenceslMeyer,F;PaarmannD,DSouzaM,OlsonR,GlassEM,KubalM,(2008).ThemetagenomicsRASTserver-apublicresourcefortheautomaticphylogeneticandfunctionalanalysisofmetagenomes.BMC Bioinformatics9:0.doi:10.1186/1471-2105-9-386.lGeorgeIetal.(2010).ApplicationofMetagenomicstoBioremediation.Metagenomics: Theory, Methods and Applications.CaisterAcademicPress.lWongD(2010).ApplicationsofMetagenomicsforIndustrialBioproducts.Metagenomics: Theory, Methods and Applications.CaisterAcademicPress.lNelsonKEandWhiteBA(2010).MetagenomicsandItsApplicationstotheStudyoftheHumanMicrobiome.Metagenomics: Theory, Methods and Applications.CaisterAcademicPress.lCharlesT(2010).ThePotentialforInvestigationofPlant-microbeInteractionsUsingMetagenomicsMethods.Metagenomics: Theory, Methods and Applications.CaisterAcademicPress.lAllen,EE;Banfield,JF(2005).Communitygenomicsinmicrobialecologyandevolution.Nature Reviews Microbiology3(6):489498.lZheng,Hao;Wu,Hongwei(2010).ShortprokaryoticDNAfragmentbinningusingahierarchicalclassifierbasedonlineardiscriminantanalysisandprincipalcomponentanalysis.J Bioinform Comput Biol.8(6):9951011.人类外显子组捕获测序外显子组是指全部外显子组是指全部外显子区域外显子区域的集合,该的集合,该区域包含合成蛋白质所需要的重要信息,区域包含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的涵盖了与个体表型相关的大部分功能性变大部分功能性变异异。与全基因组重测序相比,外显子组测序只与全基因组重测序相比,外显子组测序只需针对外显子区域的需针对外显子区域的DNA,覆盖度覆盖度更深、数更深、数据据准确性准确性更高,更加简便、更高,更加简便、经济经济、高效。、高效。www.sangon.com46人类外显子组捕获测序原理人类外显子组捕获测序分析流程检测序列变异分析示例检测到检测到SNP数统计数统计序列序列InDel检测检测References1、WeiX,WaliaV,etal.ExomesequencingidentifiesGRIN2Aasfrequentlymutatedinmelanoma.NatGenet.2011Apr15.Epubaheadofprint2、JanelO.Johnson,J.RaphaelGibbs,etal.ExomeSequencinginBrown-Vialetto-VanLaereSyndrome.AmJHumGenet.2010October8;87(4):567569.3、TeerJK,MullikinJC.Exomesequencing:thesweetspotbeforewholegenomes.HumMolGenet.2010Oct15;19(R2):R145-51.Epub2010Aug12.4、LeyTJ,MardisER,DingL,etal.DNAsequencingofacytogeneticallynormalacutemyeloidleukaemiagenome.Nature2008;456(7218):66-725、GnirkeA,MelnikovA,MaguireJ,etal.Solutionhybridselectionwithultra-longoligonucleotidesformassivelyparalleltargetedsequencing.NatBiotechnology2009;27(2):182-9.6、MurimChoia,UteI.Scholla,WeizhenJia,etal.(2010)GeneticdiagnosisbywholeexomecaptureandmassivelyparallelDNAsequencing.PNAS.106:19096-19101.7、SarahBNg,KatiJBuckingham,CholiLee,etal.(2010)Exomesequencingidentifiesthecauseofamendeliandisorder.Nature Genetics42,30-35.www.sangon.com50人类外显子组捕获测序案例WeiX,WaliaV,etal.ExomesequencingidentifiesGRIN2Aasfrequentlymutatedinmelanoma.NatGenet.2011Apr15.Epubaheadofprint黑色素瘤黑色素瘤发生率一直在上升,此研究对黑发生率一直在上升,此研究对黑色素瘤细胞进行外显子组捕获测序,发现色素瘤细胞进行外显子组捕获测序,发现了和其相关的了和其相关的高频突变基因高频突变基因。七个新发现的非同义高频突变位点单个基因中突变位点分析基因基因GRIN2A模式图,箭头表示突变位点模式图,箭头表示突变位点转录组测序简介转录组即特定细胞在某一功能状态下所能转录出转录组即特定细胞在某一功能状态下所能转录出来的所有来的所有RNA的总和,包括的总和,包括mRNA和非编码和非编码RNA(Non-codingRNA)。 第二代测序系统可精确检测单个碱基,第二代测序系统可精确检测单个碱基,并且不受到研究中先验信息的干扰,科研人员能并且不受到研究中先验信息的干扰,科研人员能够快速地获得某一物种特定器官或组织在某一状够快速地获得某一物种特定器官或组织在某一状态下几乎所有态下几乎所有mRNA转录本序列,从而能够开展:转录本序列,从而能够开展:UTRs区域界定区域界定、可变剪切研究可变剪切研究、低丰度新转录本低丰度新转录本发现发现、融合基因鉴定融合基因鉴定、cSNP(编码序列单核苷酸(编码序列单核苷酸多态性)研究等。多态性)研究等。 转录组测序测序流程全转录组总RNApolyT富集mRNA去除rRNANon-coding RNA转录组mRNARNA片段化、纯化、检测产量连接两端接头序列逆转录生成cDNA选择适当长度cDNA进行扩增纯化扩增产物,评估产量上机进行高通量测序转录组测序测序流程无参考序列测序流程无参考序列测序流程有参考序列测序流程有参考序列测序流程转录组主要分析内容无参考序列无参考序列转录组分析内容转录组分析内容有参考序列有参考序列转录组分析内容转录组分析内容1 测序数据产量统计,数据成分和质量评估;2 Contig及Scaffold长度分布3 Unigene的长度分布和功能注释,GO分类,Pathway分析,差异表达分析4 蛋白功能预测与分类,差异表达基因GO富集和 Pathway富集分析。 1 基本数据统计,比对参考序列2 序列在基因组上在分布3 测序深度分析、随机性评估和基因差异表达分析4 新基因预测,基因可变剪接鉴定和基因融合鉴定等。ReferencesMaherCA,Kumar-SinhaC,CaoX,etal.Transcriptomesequencingtodetectgenefusionsincancer.Nature,2009Mar5;458(7234):97-101.GuojieZhang,GuangwuGuo,XuedaHu,etal.DeepRNAsequencingatsinglebase-pairresolutionrevealshighcomplexityofthericetranscriptome.GenomeRes.2010May;20(5):646-54.MurchisonEP,TovarC,HsuA,etal.TheTasmaniandeviltranscriptomerevealsSchwanncelloriginsofaclonallytransmissiblecancer.Science.2010Jan1;327(5961):84-7.BrainB.Tuch,RebeccaR.Laborde,XingXuetal.TumorTranscriptomeSequencingRevealsAllelicExpressionImbalancesAssociatedwithCopyNumberAlterations.PloSONE,2010,5(2):e9317FuchouTang,CatalinBarbacioru,EllenNordmanetal.RNA-Seqanalysistocapturethetranscriptomelandscapeofasinglecell.NatureProtocols,2010,ePubFebrary25.SohrabP.Shah,RyanD.Morin,JaswinderKhattraetal.Mutationalevolutioninalobularbreasttumorprofiledatsinglenucleotideresolution.Nature,2009,461:809-813Zhaoetal.Transcriptome-guidedcharacterizationofgenomicrearrangementsinabreastcancercellline.PNAS106(6):1886-91.(2009)GregoryR,DarbyAC,IrvingH,etal.AdenovoexpressionprofilingofAnophelesfunestus,malariavectorinAfrica,using454pyrosequencing.PLoSOne.2011Feb25;6(2):e17418. CrawfordJE,GuelbeogoWM,SanouA,TraorA,VernickKD,etal.(2010)De NovoTranscriptomeSequencinginAnopheles funestusUsingIlluminaRNA-SeqTechnology.PLoSONE5(12):e14202.doi:10.1371/journal.pone.0014202有参考序列转录组测序案例MaherCA,Kumar-SinhaC,CaoX,etal.Transcriptomesequencingtodetectgenefusionsincancer.Nature,2009Mar5;458(7234):97-101.此研究使用此研究使用454和和Solexa两种高通量测序平两种高通量测序平台对台对前列腺癌前列腺癌细胞系细胞系VcaP和和LNCaP转录组进转录组进行测序,以检测和研究前列腺癌细胞系中行测序,以检测和研究前列腺癌细胞系中基因融合基因融合表达情况。表达情况。 基因融合分析基因嵌合分析流程基因嵌合分析流程MIPOL1-DGKB基因融合模式基因融合模式无参考序列转录组测序案例CrawfordJE,GuelbeogoWM,SanouA,TraorA,VernickKD,etal.(2010)De NovoTranscriptomeSequencinginAnopheles funestusUsingIlluminaRNA-SeqTechnology.PLoSONE5(12):e14202.doi:10.1371/journal.pone.0014202此研究通过对此研究通过对3个个按蚊按蚊样品进行高通量测序,样品进行高通量测序,通过拼接组装后,和相近物种进行通过拼接组装后,和相近物种进行比较基比较基因组学分析因组学分析。Denovo序列拼接、组装和比对流程拼接结果统计拼接结果统计拼接和变异检测分析流程图拼接和变异检测分析流程图比较基因组分析各类功能基因中氨基酸在物种间差异比例各类功能基因中氨基酸在物种间差异比例差异同源蛋白差异同源蛋白GO分类分类进化关系分析进化关系分析电子表达谱测序对特定处理条件下的全基因组基因表达谱进行分对特定处理条件下的全基因组基因表达谱进行分析,已被广泛用于功能基因组学和医学等研究领析,已被广泛用于功能基因组学和医学等研究领域。域。电子表达谱测序(电子表达谱测序(DigitalGeneExpression,DGE)又称为基因表达标签测序(又称为基因表达标签测序(mRNAtagprofiling),),其原理是通过两种其原理是通过两种酶切酶切作用对基因中一段长度为作用对基因中一段长度为21nt的序列标签的序列标签进行测序。由于其测序只针对表进行测序。由于其测序只针对表达的基因进行测序,产生的数据量相对较小,是达的基因进行测序,产生的数据量相对较小,是研究基因表达谱的经济而快速的研究手段。研究基因表达谱的经济而快速的研究手段。又称又称Tag-SAGE电子表达谱测序流程图NlaIII限制性酶切限制性酶切电子表达谱分析内容图像识别与原始碱基数据读取。图像识别与原始碱基数据读取。去污染、去接头,标签序列计数统计。去污染、去接头,标签序列计数统计。基因组比对与统计基因组比对与统计,基因序列比对基因序列比对获得所表达的获得所表达的基因列表基因列表基因基因差异表达差异表达分析。分析。聚类与表达类型分析。聚类与表达类型分析。GO基因富集与分类分析。基因富集与分类分析。Pathway富集与分类分析。富集与分类分析。蛋白相互作用网络分析。蛋白相互作用网络分析。反义链转录本与反义链转录本与新转录本检测新转录本检测。 ReferencesMorrissyAS,etal.Next-generationtagsequencingforcancergeneexpressionprofiling.GenomeRes.2009.19(10):1825-1835.tHoenPA,etal.Deepsequencing-basedexpressionanalysisshowsmajoradvancesinrobustness,resolutionandinter-labportabilityoverfivemicroarrayplatforms.NucleicAcidsRes,2008.36(21):e141(1-11).style73.HegedusZ,etal.Deepsequencingofthezebrafishtranscriptomeresponsetomycobacteriuminfection.MolImmunol,2009.46(15):2918-2930.AudicSandClaverieJM.Thesignificanceofdigitalgeneexpressionprofiles.GenomeRes.1997.7(10):986-995.ZhenhuaJeremyWu,CliffordA.Meyer,SibgatChoudhury,etal.GeneexpressionprofilingofhumanbreasttissuesamplesusingSAGE-Seq.GenomeRes.2010.20:1730-1739AndreaL.Eveland,NamikoSatoh-Nagasawa,AlexanderGoldshmidt,etal.DigitalGeneExpressionSignaturesforMaizeDevelopment.PlantPhysiol.,2010154:1024-1039PeterRuzanovandDonaldL.Riddle.DeepSAGEanalysisoftheCaenorhabditiseleganstranscriptome.NucleicAcidsResearch,2010,Vol.38,No.10SaurabhSaha,AndrewB.Sparks,CarloRago,etal.Usingthetranscriptometoannotatethegenome.NatureBiotechnology(2002)20,508-512电子表达谱测序案例分析MorrissyAS,etal.Next-generationtagsequencingforcancergeneexpressionprofiling.GenomeRes.2009.19(10):1825-1835.此研究用高通量电子表达谱测序(此研究用高通量电子表达谱测序(Tag-SAGE)和传统)和传统LongSAGE测序方法对癌症细测序方法对癌症细胞进行研究,比较两种方法效果,揭示了胞进行研究,比较两种方法效果,揭示了电子表达谱在基因发现中的诸多优势,可电子表达谱在基因发现中的诸多优势,可发现更多的基因,减少发现更多的基因,减少GC偏好。偏好。两种方法所检测到的基因数比较GC偏好性和低丰度转录本检测效果小RNA测序小小 RNA是指长度在是指长度在21-31nt的内源性的内源性非蛋白质编码非蛋白质编码RNA,广泛存在于高等和低等生物体内,其对广泛存在于高等和低等生物体内,其对mRNA的转录及转的转录及转录后水平等生命过程起到调节作用。录后水平等生命过程起到调节作用。现已知小现已知小RNA可归纳成三类:微可归纳成三类:微RNA(miRNA),小干扰,小干扰RNA(siRNA)和与和与piwi相互作用的相互作用的RNA(piRNA)。miRNA长度为长度为2124nt,产生于有典型茎环二级结构的原转,产生于有典型茎环二级结构的原转录本录本(pri-miRNA),在动植物的目标,在动植物的目标mRNA的的降解与抑制降解与抑制方方面发挥重要作用。面发挥重要作用。siRNA,长度在,长度在1925nt,产生于长双链,产生于长双链RNA,同样在动植物的目标,同样在动植物的目标mRNA的的降解与抑制降解与抑制方面发挥方面发挥重要作用。重要作用。piRNA,长度,长度2631nt,由与其相互作用的,由与其相互作用的Piwi蛋白定义,目前研究表明其在蛋白定义,目前研究表明其在配子形成配子形成的过程中起作用。的过程中起作用。小RNA测序流程图小RNA测序分析内容基本分析:基本分析:原始数据读取,去接头、去污染序列,长原始数据读取,去接头、去污染序列,长度分布统计,基因组比对等。度分布统计,基因组比对等。高级分析:高级分析:SmallRNA的分类注释的分类注释miRNA/siRNA/piRNA的鉴定的鉴定新新miRNA预测预测 差异表达差异表达miRNA聚类分析等聚类分析等 References1、EugeneBerezikov,NicolasRobine,AnastasiaSamsonova,etal.DeepannotationofDrosophilamelanogastermicroRNAsyieldsinsightsintotheirprocessing,modification,andemergence.GenomeRes.2011.21:203-2152、MiS,CaiT,HuY,ChenY,HodgesE,etal.(2008)SortingofSmallRNAsintoArabidopsisArgonauteComplexesisDirectedbythe5TerminalNucleotide.Cell.3、MontgomeryTA,HowellMD,CuperusJT,LiD,HansenJE,etal.(2008)SpecificityofARGONAUTE7-miR390InteractionandDualFunctionalityinTAS3Trans-ActingsiRNAFormation.Cell4、MorinRD,OConnorMD,GriffithM,KuchenbauerF,DelaneyA,etal.(2008)ApplicationofmassivelyparallelsequencingtomicroRNAprofilinganddiscoveryinhumanembryonicstemcells.GenomeRes.5、HafnerM,LandgrafP,LudwigJ,RiceA,OjoT,etal.(2008)IdentificationofmicroRNAsandothersmallregulatoryRNAsusingcDNAlibrarysequencing.Methods44(1):3-12.小RNA测序案例分析EugeneBerezikov,NicolasRobine,AnastasiaSamsonova,etal.DeepannotationofDrosophilamelanogastermicroRNAsyieldsinsightsintotheirprocessing,modification,andemergence.GenomeRes.2011.21:203-215此研究对黑腹果蝇此研究对黑腹果蝇miRNA进行深度测序,通进行深度测序,通过对其测序结果的注释和分析,揭示了黑过对其测序结果的注释和分析,揭示了黑腹果蝇中腹果蝇中miRNA的的编辑、修饰编辑、修饰等机制。等机制。 果蝇三种组织中MiRNA表达情况MiRNA表达模式分析新miRNA预测miRNA编辑情况分析与统计ChIP-SeqChIP-ChromatinImmunoprecipitation染色质染色质免疫共沉淀,是指通过免疫共沉淀,是指通过蛋白免疫相互作用蛋白免疫相互作用,用抗体把和染色质相互作用的蛋白,如组用抗体把和染色质相互作用的蛋白,如组蛋白、转录因子等,沉淀下来,从而所获蛋白、转录因子等,沉淀下来,从而所获取与其相结合的取与其相结合的DNA序列。序列。ChIP-Seq就是通过高通量测序对就是通过高通量测序对ChIP所得到所得到的序列进行测序,从而进行蛋白和的序列进行测序,从而进行蛋白和DNA相互相互作用相关研究。作用相关研究。ChIP-Seq测序流程ChIP-Seq分析内容ChIPSequencing结果与结果与参考基因组参考基因组序列进行序列进行比对比对ChIPSequencingreads在在全基因组的分布全基因组的分布唯一比对reads在repeats区域的分布唯一比对reads在各基因功能元件上的分布唯一比对reads的全基因组覆盖深度全基因组全基因组peak扫描扫描peak扫描peak长度分布统计peak的全基因组覆盖度peak在基因功能元件上的分布特征Peak相关基因相关基因分析筛选与分析筛选与GO功能富集分析功能富集分析多个样品的多个样品的差异分析差异分析基于peak相关基因的差异分析基于peak的差异分析ChIP-Seq分析流程原始数据数据清理序列比对Peak 扫描Peak相关基因Unique Mapped序列分布分析Peak 分布Genome Browser可视化GO功能分析多个样品的差异分析多个样品的差异分析 ChIP-Seq分析结果示例ChIP-Seq分析结果示例ReferencesJohnsonDS,MortazaviAetal.(2007)Genome-widemappingofinvivoproteinDNAinteractions.Science316:14971502Jothietal.(2008)Genome-wideidentificationofinvivoproteinDNAbindingsitesfromChIP-Seqdata.NuclAcidsRes36(16)52215231.Bernstein,BEetal.(2005)Genomicmapsandcomparativeanalysisofhistonemodificationsinhumanandmouse.Cell120,169181.RobertsonGetal.(2007)Genome-wideprofilesofSTAT1DNAassociationusingchromatinimmunoprecipitationandmassivelyparallelsequencing.NatureMethods4:651657.Schmidetal.(2007)ChIP-SeqDatarevealnucleosomearchitectureofhumanpromoters.Cell131:831832DNA甲基化测序DNA甲基化对甲基化对机体发育和基因表达机体发育和基因表达有很重要的调有很重要的调控作用,和各种控作用,和各种癌症的发生和发展癌症的发生和发展也有很大相关也有很大相关性,所以对基因组性,所以对基因组DNA甲基化进行研究是一直来甲基化进行研究是一直来的热门课题。的热门课题。通过高通量测序来研究通过高通量测序来研究DNA甲基化现在主要有两甲基化现在主要有两种方法,一种是种方法,一种是MeDIP,是通过与,是通过与DNA甲基化位甲基化位点相结合的抗体,进行点相结合的抗体,进行免疫共沉淀免疫共沉淀,然后对所得,然后对所得DNA序列进行测序。另一种是序列进行测序。另一种是BisulfiteSequencing,是通过,是通过Bisulfite处理基因组来区分甲基化位点。处理基因组来区分甲基化位点。MeDIP原理MeDIP-Seq分析内容1.MeDIP-seq序列序列与参考序列的比对与参考序列的比对2.MeDIP-seq序列数据在全序列数据在全基因组的分布趋势基因组的分布趋势2.1MeDIP-seq测序reads在全基因组上每条染色体上的分布2.2MeDIP-seq测序reads在全基因组上的覆盖深度2.3MeDIP-Seq测序reads在CG、CHG和CHH位点上的覆盖深度2.4MeDIP-Seq测序reads在不同基因功能元件上的分布2.5MeDIP-Seq测序reads在不同OE含量区域中的分布3.统计统计MeDIP-seq序列富集区域(序列富集区域(peak)的信息的信息3.1Peak扫描3.2Peak长度数量及比例分布统计3.3单个样品Peak的OE含量分布统计3.4寻找Peak相关基因3.5统计Peak在不同基因功能元件上的分布4.基于基于Peak的多样品间的多样品间差异分析差异分析4.1分析两个样品间的Peak相关差异基因4.2对两个样品间的差异基因进行GO功能富集分析及pathway功能分析89BisulfiteSequencing原理90BisulfiteSequencing分析内容1.Bisulfite-seq序列序列与参考序列的比对与参考序列的比对2.深度和覆盖度分析深度和覆盖度分析2.1C碱基有效测序深度的累积分布2.2不同reads测序深度下的基因组覆盖度3.计算计算C碱基的甲基化水平碱基的甲基化水平4.全基因组全基因组甲基化数据分布趋势分析甲基化数据分布趋势分析4.1甲基化C碱基中CG,CHG与CHH的分布比例(H=A、CorT,以下同)4.2CG、CHG和CHH中的所有C的甲基化水平4.3各条染色体中CG、CHG和CHH中C的甲基化水平(该项分析目前只用于“人”)4.4统计不同基因区域内CG、CHG和CHH中C的甲基化水平4.5不同基因元件区域中CG、CHG和CHH中C的甲基化水平4.6CHG,CHH中甲基化C附近的9bp序列的序列特征分析5.全全基因组基因组DNA甲基化图谱甲基化图谱5.1染色体水平的甲基化C碱基的密度分布(该项分析目前只用于“人”)5.2Scaffold的甲基化C碱基密度分布(该项分析针对物种:非人)5.3不同基因组区域的甲基化分布特征5.4基因组不同转录元件中的DNA甲基化水平6.差异差异甲基化区域(甲基化区域(DMR)分析)分析91ReferencesWeberetal.DeterminedthattheinactiveX-chromosomeinfemalesishypermethylatedonachromosomewidelevelusingMeDIPcoupledwithmicroarray.Nature Genet2005.37:853862.KeshetI,SchlesingerY,FarkashS,etal.Evidenceforaninstructivemechanismofdenovomethylationincancercells.Nat. Genet.2006.38(2):14953.ZhangX,YazakiJ,SundaresanA,et al.Genome-widehigh-resolutionmappingandfunctionalanalysisofDNAmethylationinarabidopsis.Cell2006.126(6):1189201.NovakP,JensenT,OshiroMM,etal.EpigeneticinactivationoftheHOXAgeneclusterinbreastcancer.Cancer Res.2006.66(22):1066470.EhrichM,ZollS,SurS,vandenBoomD.AnewmethodforaccurateassessmentofDNAqualityafterbisulfitetreatment.NucleicAcidsRes2007.35(5):e29KristenH.Taylor,RobinS.Kramer,J.WadeDavis,etal.UltradeepBisulfiteSequencingAnalysisofDNAMethylationPatternsinMultipleGenePromotersby454Sequencing.CancerRes.2007.67;8511报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍常用生物信息学分析平台与资源常用编程分析平台:Perl / BioPerlPython / BioPythonR / BioconductorJAVA / BioJava常用网上资源:NCBI SRA Sequence Read ArchiveUCSC Genome BrowserSEQanswers WiKi & Forum for NGS常用基因组拼接软件VelvetRayABySSSOAPdenovoSSAKESHARCGSMIRAEdena基因组比对软件BLASTBLATMAQSOAPBowtieBWASSAHAELANDSNP分析软件SAMToolsSOAPsnpNGS-BackboneMAQSeqMan NGenCLCBio Genomics谢谢大家!谢谢大家!
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号