资源预览内容
第1页 / 共56页
第2页 / 共56页
第3页 / 共56页
第4页 / 共56页
第5页 / 共56页
第6页 / 共56页
第7页 / 共56页
第8页 / 共56页
第9页 / 共56页
第10页 / 共56页
亲,该文档总共56页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第八章第八章 生物信息学在基因芯片中生物信息学在基因芯片中的运用的运用主讲人:孙 啸刘志华东南大学 吴健雄实验室生物信息学和基因芯片是生命科学研讨领域中的两种新方法和新技术,生物信息学与基因芯片亲密相关,生物信息学促进了基因芯片的研讨与运用,而基因芯片那么丰富了生物信息学的研讨内容 第一节 概述、基因芯片简介基因芯片的根本原理及生物信息学的作用 基因芯片gene chip,又称DNA微阵列microarray,是由大量DNA或寡核苷酸探针密集陈列所构成的探针阵列,其任务的根本原理是经过杂交检测信息。基因芯片把大量知序列探针集成在同一个基片上,经过标志的假设干靶核酸序列经过与芯片特定位置上的探针杂交,便可根据碱基互补匹配的原理确定靶基因的序列。 根据探针的类型和长度,基因芯片可分为两类。其中一类是较长的DNA探针100mer芯片这类芯片的探针往往是PCR的产物,经过点样方法将探针固定在芯片上,主要用于RNA的表达分析。另一类是短的寡核苷酸探针芯片其探针长度为25 mer左右,普统统过在片原位合成方法得到,这类芯片既可用于RNA的表达监控,也可以用于核酸序列分析。原理原理 - - 经过杂交检测信息经过杂交检测信息一组寡核苷酸探针TATGCAATCTAGCGTTAGATACGTTAGAATACGTTAGATCTACGTTAG由杂交位置确定的一组核酸探针序列GTTAGATC杂交探针组TATGCAATCTAG重组的互补序列靶序列TACGTTAGACGTTAGAATACGTTACGTTAGATGTTAGATC ATACGTTA基因芯片荧光标志的样品 共聚焦显微镜获取荧光图象杂交结果分析探 针 设 计杂交基因芯片制备基因芯片的制备主要有两种根本方法:一是在片合成法,在片合成法是基于组合化学的合成原理,它经过一组定位模板来决议基片外表上不同化学单体的偶联位点和次序。在片合成法制备DNA芯片的关键是高空间分辨率的模板定位技术和固相合成化学技术的精巧结合。 另一种方法是点样法。基因芯片点样法首先按常规方法制备cDNA或寡核苷酸探针库,然后经过特殊的针头和微喷头, 分别把不同的探针溶液,逐点分配在玻璃、尼龙或者其它固相基底外表上不同位点,并经过物理和化学的结合使探针被固定于芯片的相应位点。 靶基因样品的制备及芯片杂交根据基因芯片的检测目的不同,可以把样品制备方法分为用于表达谱丈量的mRNA样品制备用于多态性(或突变)研讨的基因样品的制备杂交信号检测对于用荧光素标志经扩增也可用其他放大技术的序列或样品,与芯片上的探针进展杂交,然后冲洗,采集荧光图像。图像的采集用落射荧光显微镜 或电荷偶联安装照相机 非共聚焦激光扫描仪等进展。 、基因芯片对于生物分子信息检测的作用和意义在生命科学领域中,基因芯片为分子生物学、生物医学等研讨提供了强有力的手段。利用基因芯片技术,可研讨生命体系中不同部位、不同生长发育阶段的基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病形状下基因及其表达的差别。基因芯片技术也有助于研讨不同层次的多基因协同作用的生命过程,发现新的基因功能,研讨生物体在进化、发育、遗传过程中的规律。、基因芯片研讨和运用中所涉及到的生物信息学问题提取什么信息提取什么信息如何提取信息如何提取信息如何处置和利用信息如何处置和利用信息确定芯片确定芯片检测目的目的芯片芯片设计数据管理与分析数据管理与分析探针设计探针设计处理杂交条件处理杂交条件一致性问题一致性问题芯片优化芯片优化提高芯片制备提高芯片制备效率效率公共公共 数据库数据库公用公用 数据库数据库确定目的确定目的选择待检测选择待检测的目的序列的目的序列数据分析数据分析分析杂交检测分析杂交检测结果及可靠性结果及可靠性基因芯片基因芯片 数据库数据库图像处置图像处置数数 据据 库 查 询 序序 列列 分分 析析生生 物物 信信 息息 学学 数数 据据 挖挖 掘掘 数数 据据 可可 视视 化化杂交杂交检测检测图像图像基因芯片数据流图基因芯片数据流图生物信息学在基因芯片中的运用生物信息学在基因芯片中的运用主要表达在三个方面:确定芯片检测目的芯片设计实验数据管理与分析基因芯片研讨与运用中所要处理的信息学问题在基因芯片信息学方面要处理以下几个关键的问题:第一是芯片设计问题第二是可靠性分析问题 第三是数据发掘问题 第二节第二节 基因芯片设计基因芯片设计、基因芯片设计的普通性原那么基因芯片设计主要包括两个方面:(1)探针的设计指如何选择芯片上的探针(2)探针在芯片上的规划指如何将探针排布在芯片上。确定芯片所要检测的目的对象确定芯片所要检测的目的对象查询生物分子数据库查询生物分子数据库获得相应的获得相应的DNA序列数据序列数据 序列对比分析序列对比分析找出特征序列,作为芯片设计的参照找出特征序列,作为芯片设计的参照序列。序列。 数据库搜索数据库搜索得到关于序列突变的信息及其它信息。得到关于序列突变的信息及其它信息。在进展探针设计和规划时必需思索以下在进展探针设计和规划时必需思索以下几个方面:几个方面: (1)互补性互补性 (2)敏感性和特异性敏感性和特异性 (3)容错性容错性 (4)可靠性可靠性 (5)可控性可控性 (6)可读性可读性 、DNA变异检测型芯片与基因表达型芯片的设计对于DNA序列变异分析,最根本的要求是可以检测出发生变异的位置,进一步的要求是可以发现发生了什么样的变化。 从杂交的单碱基错配区分才干来看,当错配出如今探针中心时,区分才干强,而当错配出如今探针两端时,区分才干非常弱。所以,在设计检测DNA序列变异的探针时,检测变化点应该对应于探针的中心,以得到最大的分辨率。、cDNA芯片与寡核苷酸芯芯片与寡核苷酸芯片的设计片的设计cDNA芯片设计的关键在于数据库的建立和数据库信息的利用以及各种文库的建立。cDNA芯片制备方法普通采用点样法,多用于基因表达的监控和分析。寡核苷酸芯片制备普通采用在片合成方法。优化是寡核苷酸芯片设计的一个重要环节,包括探针的优化和整个芯片设计结果的优化。 、寡核苷酸探针的优化设计、基因芯片规划杂杂 交交 模模 式式探探 针针 布布 局局 图图Target T C C G T T A G C T G A C T G CA AG GC CTTTG变异、基因芯片规划基于Tm值梯度场的规划方法 凸点均匀分布规划方法a (b)凸点均匀分布优化结果表示(a)优化前; (b)优化后。、基因芯片优化 高密度寡核苷酸芯片设计的结果是构成芯片合成方案和步骤,产生制造掩膜板的CAD文件。高密度基因芯片制备的一个关键是掩膜板技术,利用掩膜板进展定位并控制探针的在片合成,从而得到很高的探针密度。但是制造掩膜板的代价较高,为了尽能够地提高基因芯片制备效率,需求对设计好的基因芯片进展优化,以减少制备芯片所需求的掩膜板个数,同时也减少芯片探针循环合成次数,这对于基因芯片运用有着重要的意义。第三节第三节 基于芯片的序列分析基于芯片的序列分析、测定未知序列 早期基于芯片杂交的序列分析实验中,芯片上的探针是长度为k普通为8的一切寡核苷酸的组合。这是一种完备的探针集合,根据互补关系,经过各个探针的杂交结果确定DNA靶序列中存在的一切k长度片段,构成靶序列的k长度片段谱,然后根据这些片段重构靶序列。 、直接检测目的序列 在同一块芯片上设计多组探针,每一组探针分别检测一条目的序列,探针的长度在20到30之间。普通要求同一组探针之间相互独立,尽能够不重叠或少重叠,以提高探针的敏感性和特异性。、DNA序列突变检测分析有两种方法可以进展知突变点的分析:一种方法是对于目的序列上知的突变点,以该点为中心,从目的序列选取一个片段,作为设计探针的参考序列。根据参考序列,分别设计四个高度特异的探针,这四个探针除中心位置外均一样并与参考序列互补 另一种方法是对于目的序列上知的突变点,分别设计四组探针,其中每一组探针分别检测一种核苷酸交换。同一组中的各个探针长度一样,相互之间交叠,并且每个探针均覆盖对应的突变点。、基因型和多态性分析在同一物种不同种群和个体之间,有着多种不同的基因型,这往往与个体的不同性状和多种遗传性疾病有着亲密的关系。经过对大量具有不同性状的个体的基因型进展比较,就可以得出基因与性状的关系。 为了进展SNPs研讨,发现目的序列上能够出现的变化,最直接的方法就是根据知的目的序列设计一系列寡核苷酸探针,其中每一个探针用于检测目的序列特定位置上的核苷酸能否发生变化,探察位置位于探针的中心。这种方法又称等长等覆盖移位法 第二种方法为单核苷酸分析法。针对目的序列每个位置上一切能够出现的变化设计相应的探针。 第四节第四节 基于芯片的基因功能基于芯片的基因功能分析分析、基因表达分析基因表达是根据基因的DNA模板进展mRNA和蛋白质合成的过程,各种基因的表达存在差别,一种组织中基因表达程度的差别可达1万倍。功能基因研讨的一种重要的方法就是采用高通量基因表达检测技术,全面分析基因的表达程度,了解基因的功能。 、高密度基因表达芯片、基因表达图谱基于芯片的表达监控实验产生大量的数据,在这些数据背后隐藏着丰富的基因相互作用、基因功能信息,需求经过细致的数据分析提示这些信息,得到有益的结果 这种根据基因芯片获得的新的表达图谱有别于以前的物理图和功能图,它可以更为直接地提示基因组中各基因相互关系。、寻觅基因功能 DeRisi等运用酵母cDNA基因芯片研讨在有丝分裂和孢子形状下基因转录和表达程度的差别。 Affymetrix公司制备的酵母基因表达型芯片,包括酵母基因组开放读码框中的260 000个25mer探针阵列。Wodicka 等采用这种基因芯片对不同生活形状下酵母细胞的基因表达进展了研讨。 第五节第五节 基因芯片检测结果的基因芯片检测结果的分析分析、荧光检测图像处置基因芯片与样本杂交以后,用图像扫描仪器捕获芯片上的荧光图像。在计算机中,一幅图像由二维象素点所组成,通常用一个8-bit的整数存贮象素点的灰度值,取值范围为0,255,其中0代表“黑,255代表“白。 一个理想的基因芯片图像具有以下几个性质: 1芯片单元的外形和尺寸一样; 2每个单元的中心位于象素点上; 3无灰尘等引起的噪声信号; 4最小和均匀的图像背景强度。 图象预处置图象预处置网格定位网格定位背景滤除背景滤除荧光信号提取荧光信号提取归一化处置归一化处置网格定位结果背景区域背景滤除荧光信号提取、检测结果分析假设芯片检测的目的是测定样本序列,那么需求根据芯片上每个探针的杂交结果判别样本中能否含有对应的互补序列片段,并利用生物信息学中的片段组装算法衔接各个片段,构成更长的目的序列。 假设芯片检测的目的是进展序列变异分析,那么要根据全匹配探针以及错配探针在基因芯片对应位置上的荧光信号强度,给出序列变化的位点,并指明发生什么变化。假设芯片检测的目的是进展基因表达分析,那么需求给出芯片上各个基因的表达图谱,定量描画基因的表达程度,进一步的分析还包括根据基因表达方式进展聚类,寻觅基因之间的相关性,发现协同任务的基因、检测结果可靠性分析可靠性分析可以从两个方面进展:一是根据实验统计误差如探针合成的错误率、全匹配探针与错配探针的误识率等,计算出基因芯片最终实验结果的可靠性。二是对基因芯片与样本序列杂交过程进展分子动力学研讨,建立芯片杂交过程的计算机仿真实验模型,以便在制造芯片之前分析所设计芯片的性能,预测芯片实验结果的可靠性。、数据分析基因芯片数据分析包括实验数据管理、数据质量控制、数据处置等进一步将基因芯片实验数据与公共数据库中的信息相关联,利用数据发掘方法进展分析处置,提示各种数据之间的关系,发现新的生物学知识。第六节第六节 基因芯片信息的管理基因芯片信息的管理和利用和利用、芯片信息管理目前已出现一些芯片信息管理数据库,这些数据库主要搜集、管理表达型基因芯片的实验数据。与基因芯片相关的信息包括芯片功能的描画、芯片的描画、实验对象的描画、实验结果和分析结果的描画。 以基因表达型芯片为例,数据库至少含有以下信息: (1)数据来源 (2)杂交目的序列 (3)目的对象 (4)mRNA转录的数量 (5)统计的显著性 、数据集成和交叉索引基因组信息是相互关联的,合理地解释实验检测数据依赖于将实验数据与其它相关数据库的集成。对于基因表达数据,经过用户定义的或缺省的规范进展数据链接,经分析可以得到关于基因调控的概貌。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号