资源预览内容
第1页 / 共28页
第2页 / 共28页
第3页 / 共28页
第4页 / 共28页
第5页 / 共28页
第6页 / 共28页
第7页 / 共28页
第8页 / 共28页
第9页 / 共28页
第10页 / 共28页
亲,该文档总共28页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
长非编码RNA测序分析实战讲解之表达定量和差异及功能分析,卜中国科学院计算技术研究所,步骤四:表达值的定量 定量策略&工具 步骤五:差异分析 差异分析工具 步骤六:功能注释 附录:运行命令,3,转录组分析的通用套路,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,测序数据,和参考基因组比对,测序评估及低质量过滤,编码基因表达注释,转录本重构,长非编码鉴定,长非编码表达注释,编码基因差异(特异)表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,长非编码差异表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,Fusions,Junctions,Genome Browser可视化,转录组第五讲,测序中国-测序学堂 转录组第三讲,转录组第四讲,转录组第六讲,步骤三:转录本的构建(Cufflinks/Scripture) 构建流程详解 基因存储文件: Gtf, Bed格式文件 Cuffmerge/cuffcompare合并转录本 转录本构建效果评估 多外显子比率、已知覆盖程度 步骤四:长非编码RNA的鉴定 鉴定流程详解 关键:如何判断编码或是非编码基因 工具:CNCI,CPC, PhyloCSF,上期回顾,6,一个测序实例,取样:晚期肝癌病人的肝组织(共4个) 癌旁组织(N) 原发灶(P) 转移灶(M) 门脉血栓转移灶(V),一组时间序列上的4个点的取样,步骤四:表达值的定量 定量策略&工具 步骤五:差异分析 差异分析工具 步骤六:功能注释 附录:运行命令,8,转录组分析的通用套路,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,鉴定完成后的分析步骤,9,定量策略,FPKM expected number of fragments per kilobase of transcript sequence per millions base pairs sequenced TPM transcript per million RPKM reads per kilobase per million mapped reads,10,定量,工具: Cufflinks(FPKM) Cuffdiff(FPKM)推荐 RSEM(TPM) 推荐 Range(RPKM),FPKM定量,计算工具:cufflinks 输出结果 transcripts.gtf isoforms.fpkm_tracking genes.fpkm_tracking,转录本定量? 基因定量?,定量:cufflinks -G ref.gtf o outdir tophat_outdir_N /accept_hits.bam,长编码RNA表达定量,蓝线:长非编码基因,黑线:非编码基因,N,P,M,V,步骤四:表达值的定量 定量策略&工具 步骤五:差异分析 差异分析工具 步骤六:功能注释 附录:运行命令,14,差异分析,差异分析工具: Deseq Hypothesis testing H0:no difference between tow conditions. Negative Binomial for reads count Cuffdiff Test A.FPKM - B.FPKM with normal distribution SAMseq Nonparametric methods Mann-Whitney statistic Need many samples/replicates in conditions EBseq Empirical Bayesian mode(for TPM),Cuffdiff输出结果,isoforms_exp.diff genes_exp.diff splicing.diff the relative contribution of different isoforms is significantly different tissue 1 is 80/20 for two isoforms and tissue 2 is 50/50 tss.diff,表达差异分析结果,P/N M/N V/N = 342 coding genes,P/N M/N V/N = 312 lincRNA genes,17,动态变化分析(特异性分析),JS score ranging from 0 to 1;,Jensen-Shannon (JS) Score,A perfect tissue-specific pattern will be scored as JS = 1,18,动态变化分析(特异性),步骤四:表达值的定量 定量策略&工具 步骤五:差异分析 差异分析工具 步骤六:功能注释 附录:运行命令,20,功能注释,工具: David Go(For coding genes) http:/david.abcc.ncifcrf.gov/ ncFANs(for lincRNAs) https:/www.bioinfo.org/ncfansv2/,David GO: 数据上传,David GO: 注释数据库选择,GOTERM_BP_FAT,KEGG_PATHWAY,David GO: Functional Annotation Clustering,David GO: Functional Annotation Chart,25,功能注释,步骤四:表达值的定量 定量策略&工具 步骤五:差异分析 差异分析工具 步骤六:功能注释 附录:运行命令,运行命令汇总,差异分析&定量:,cuffdiff -o cuffdiff_outdir T -labels N,P,M,V refgene.gtf N.bam P.bam M.bam V.bam,Cuffdiff2: http:/www.nature.com/nbt/journal/v31/n1/full/nbt.2450.html,谢谢大家,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号