资源预览内容
第1页 / 共17页
第2页 / 共17页
第3页 / 共17页
第4页 / 共17页
第5页 / 共17页
第6页 / 共17页
第7页 / 共17页
第8页 / 共17页
第9页 / 共17页
第10页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
学校代码:学校代码:10200 学号:学号:本科毕业论文本科毕业论文对 RNA 测序平台 Illumina 基因分析器的通道影响的统计分析学生姓名:林莉莎指导教师:朱文圣 副教授所在学院:数学与统计学院所学专业:数学与应用数学中国长春2012 年 5 月对 RNA 测序平台 Illumina 基因分析器的通道影响的统计分析2摘要下一代测序技术以它低廉的成本及准确的产出结果,在生物信息界及医学制药界获得突飞猛进的发展。RNA 测序技术作为下一代测序技术在转录组分析的应用技术,广泛应用于转录组学分析研究。Illumina Genome Analyzer 是提供 RNA 测序的平台,但测序平台并不是很完美,产生的数据不是绝对精确。本文将分析由于测序机器本身而产生的技术影响,特别是在 Illumina 测序过程中的通道分组带来的数据产生的影响。进而,可以对测序平台进行改进与完善。关键词关键词:下一代测序技术,RNA 测序技术,Illumina 测序平台,通道影响 对 RNA 测序平台 Illumina 基因分析器的通道影响的统计分析3AbstractThe next generation of sequencing technology is emerged and highly developed as its low cost and the accurate output results, in the biological information industry and medical pharmaceutical industry. RNA sequencing technology as the application of next generation of sequencing technology in transcriptomic analysis, has widely been used in transcriptome research. Illumina Genome Analyzer is a machine which serves as a platform to produce RNA sequencing data, but each sequencing platform is not perfect at all, thus the resulting data is not absolutely accurate. This paper will analyze the data variation, that exists because of the effect from the machine itself during the sequencing progress, especially between lanes when sequencing proceed by Illumina. For what has been done above, then we can develop and perfect the sequencing platform.Keywords: Next-generation sequence, RNA sequence, Illunima Genome Analyzer, Lane effect对 RNA 测序平台 Illumina 基因分析器的通道影响的统计分析4目目 录录摘要.2 Abstract.3 引言.5 1 简介.6 1.1 生物背景.6 1.2 下一代测序(Next-generation sequence) .6 1.3 RNA 测序(RNA sequence).6 1.4 Illumina Genome Analyzer .7 2 统计模型.9 2.1 列联表独立性检验.9 2.2 超几何分布模型.10 2.3 Poisson 分布模型.11 2.4 Poisson 广义线性模型.12 2.4.1 线性模型定义.12 2.4.2 最小二乘法.13 2.4.3 对数线性模型的应用.13 3 总结与展望.15 参考文献.16 后记与感谢.17对 RNA 测序平台 Illumina 基因分析器的通道影响的统计分析5引言近年来,下一代测序技术(Next-generation sequencing,NGS) ,又叫深度测序技术(deep sequencing)或高通量测序技术(High-throughput sequencing),以它低廉的成本及准确的产出结果,在生物信息界及医学制药界获得突飞猛进的发展。而它产生的海量数据使该技术不得不面临信息学难题,有效地处理和分析测序数据变得举足轻重。作为最新发展起来的有巨大市场空间的新兴技术,高通量测序技术无疑面临着机遇和挑战。当然,作为一个新兴技术,高通量测序技术的缺点尚未被人们所了解。产生的数据可供统计学家分析关于技术性的和生物性的可再生能力,错误率和测量偏度等。在这里我们将讨论某些方面的分析和数据处理是必须作为研究新一代测序技术的表达数据的考虑因素。RNA测序(RNA-sequencing ,RNA-seq)作为下一代测序技术在转录组分析的应用技术,广泛应用于转录组学分析研究。它曾被喻为“转录组学中革命性的工具” 。相比其它测序技术,如微阵列技术(microarray) ,RNA-seq技术无需预先针对已知序列设计探针,就能在单个实验中以较短的时间同步测量成千上万的基因表达,同时避免产生背景噪声及交互影响。现今很多公司在测序平台的开发和完善上都有了很大进展,目前,以 Illumina/Solexa Genome Analyzer, Helicos Heliscope 及 SOLiD 等平台为主。虽然现在的测序平台已经较为完善,但仍不是很完美。因此,产生的数据有较高的精确度及可靠性外,还是由各因素导致的一定的偏差。本文中,我们感兴趣的是
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号