资源预览内容
第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
亲,该文档总共6页全部预览完了,如果喜欢就下载吧!
资源描述
综述与专论2013年第6期生物技术通报 BIOTECHNOLOGY BULLETIN收稿日期 : 2012-12-03 基金项目 : 国家自然科学基金项目(31200914) ,中国博士后科学基金项目(2012M520600) ,山西省留学人员科研资助项目(2010041),山 西省青年科学基金项目(2012021023-4) 作者简介 : 张雁明,男,硕士研究生,研究方向 : 植物基因工程 ; E-mail: zhangyanming19880310126.com 通讯作者 : 韩渊怀,男,博士,教授,研究方向 : 植物基因工程 ; E-mail: swgctd163.com随着 21 世纪生物时代的到来,生命科学的迅猛发展以及相关技术的不断突破为解决当前人类社会所面临的一系列问题, 如人类亚健康、 生态环境破坏、粮食紧张等提供了强有力的技术支持。随着人类基全基因组关联分析 : 基因组学研究的机遇与挑战张雁明1,2 邢国芳1 刘美桃1 刘晓东1,3 韩渊怀1,2(1. 山西农业大学农学院 山西农业大学农业生物工程研究所,太谷 030801 ; 2. 农业部黄土高原作物基因资源与种质创制重点实验室,太原 030031 ; 3. 山西省农业科学院作物科学研究所,太原 030031)摘 要 : 全基因组关联分析(genome wide association study,GWAS)是利用全基因组范围内筛选出高密度的分子标记对所研究的群体进行扫描,分析扫描得出的分子标记数据与表型性状之间关联关系的方法。GWAS 的出现为全面系统地研究基因组学掀开了新的一页,目前主要应用于人类疾病复杂性状的分析,已鉴定出大量与人类复杂疾病或数量性状相关的遗传变异,成为研究人类基因组学的关键手段。在植物基因组中的研究应用虽刚刚起步,但也取得了良好的效果,应用 GWAS 发掘植物复杂数量性状基因、为植物分子育种提供依据已成为国际植物基因组学研究的热点。然而,GWAS 的结果还存在一些问题,并非早期预测和想象的那样简单。现针对 GWAS 的特点,对其在人类基因组和植物基因组中的应用及其未来发展进行综述。关键词 : 全基因关联分析(GWAS) 分子标记 功能基因组学Genome Wide Association Study : Opportunities and Challenges in Genomic ResearchZhang Yanming1,2 Xing Guofang1 Liu Meitao1 Liu Xiaodong1,3 Han Yuanhuai1,2 (1.College of Agronomy,Shanxi Agricultural University and Agricultural Bioengineering Centre,Shanxi Agricultural University,Taigu 030801 ; 2. Key Laboratory of Crop Gene Resources and Germplasm Enhancement on Loess Plateau,Ministry of Agriculture,Taiyuan 030031 ; 3.Crop Institute of Shanxi Academy of Agricultural Sciences,Taiyuan 030031)Abstract: Genome wide association study(GWAS)is about screening for high-density molecular markers in certain populations in the range of the whole genome, then analyzing the correlations between the data of the molecular markers and the phenotypic traits. GWAS opened up a new chapter in genomic and genetic research, enabling linking genomics and genetics in unprecedented scale. GWAS is mainly applied in the analysis of complex traits of human diseases, leading to the identification of a number of genetic variants related to complex diseases and quantitative traits in human, hence it is to become one of the key approaches for human genomics. Application of GWAS in plant genomics just began, yet it has shown great advantages. It is becoming a research trend in plant genomics to use GWAS to discover genes related to complex quantitative traits to guide breeding programs. However, there exist some problems in GWAS, which are not as simple as expected. This review summarizes the current knowledge on GWAS with special emphasis on its applications in human and plant genomes and highlights its potential areas for future research.Key words: Genome wide association study(GWAS) Molecular markers Functional genomics因组计划和多种模式植物基因组测序完成,基于序列 - 单核苷酸多态性(SNP)单体型图谱构建完成和高通量基因分型技术的快速发展,使得大样本全基因组水平基因分型成为可能。全基因组关联分生物技术通报 Biotechnology Bulletin2013年第6期2析(genome wide association study,GWAS)在这些科技水平的支撑下应运而生1,是利用全基因组范围内筛选出高密度的分子标记对所研究的群体进行扫描2,分析扫描所得的分子标记数据与表型性状之间关联关系的方法。此方法基于分子标记水平,需要高密度遗传标记分型,如 SNP、CNV 等,在研究之前不再需要构建任何假设,一般不涉及候选基因的预测,可以直接研究全基因组水平的 DNA 变异。1 GWAS 的提出1996 年,Risch3最早提出了 GWAS 的设想。他认为未来人类复杂疾病的研究不再需要候选基因的预测,能够在全基因组水平检测每一个基因的变异, 进行更大规模的基因检测。2001 年, Hansen 等4最早应用 GWAS 在植物中对 Sea beet(海甜菜)的生长习性进行了分析发现,决定海甜菜抽薹前是否需要进行春化处理的基因(B 基因)与分布于全基因组范围内的 440 个 AFLP 标记中的 2 个显著关联 ;2005 年,Science 杂志上最早报道了 GWAS 应用于人类研究,Klein 等5发现 complement factor H 基因(CFH) 与具有年龄相关性的黄斑变性病症显著相关。随后,科学家采用 GWAS 在人类复杂疾病方面进行了大量研究。其中,在关于人类疾病的研究深入广泛, 相继报道了导致冠心病、 肥胖、 2 型糖尿病、精神分裂症等相关疾病的一系列致病基因、相关基因、易感区域和单核苷酸序列多态性的变异。另外,在植物遗传领域,科学家应用 GWAS 也进行了一系列的探索,其中比较成功的当属对水稻品种的研究。2 GWAS 研究方法与优势GWAS 研究统计分析原理分为以下几种情况 :(1)基于无关个体的关联分析中案例对照研究的设计,主要用于质量性状的研究,可用 4 格表的卡方检验来比较基因频率在研究组和对照组间的差异 ;(2)基于随机人群的关联分析,主要用于数量性状的分析,可用协方差分析来研究 SNP 与某一数量性状的关联分析 ; (3)基于家系的关联分析,在研究遗传标记与质量表型和数量表型的关联时可采用传递不平衡检验(TDT)6,当前应用最广泛的统计分析工具是 FBAT/PBAT 软件7。应用 GWAS 研究时,表型选择应遵循以下 3 个原则 : (1)选择遗传度较高的表型,遗传度低的表型会降低遗传学关联研究的把握度8; (2)性状优于疾病(表型) ,疾病(表型)的状态模糊不清,很难测量,有时则会出现多种疾病(表型)混杂在一起而难以判断 ; (3)选择测量简单准确并且遗传力相对较高的数量表型9,增加分析结果的可信度。GWAS 研究设计类型分为单阶段和两阶段或多阶段设计。其基本原理与经典的候选基因关联分析相同,即假设群体基因组中某 SNP 与疾病(表型)相关联,理论上该 SNP 等位基因频率在案例中应该高于对照9。目前的 GWAS 多采用两阶段或多阶段设计 : 首先对小样本或个体覆盖整个基因组的所有SNP 进行基因分型,筛选出最显著的 SNP,然后将第一阶段筛选出来的 SNP 进行第二阶段的更大样本的基因分型,最后结合两阶段或多阶段的结果进行综合分析10。GWAS 分为 4 步来实现目标性状与遗传标记的关联分析(图 1)11: 第一步,选择材料,应选择包含物种全部遗传变异的材料 ; 第二步,分析群体结构,用 SNPs、AFLPs、SSRs 和 RFLPs 等大量独立的遗传标记来检测并校正材料群体结构 ; 第三步,鉴定目标性状,选择的目标性状应兼顾许多重要特征,如生物学重要性、评价的准确性、相关数据采集的简易性及可重复性 ; 最后,使用生物学分析软件进行关联分析12。图 1 全基因组关联分析流程图2012 年,Yang 等13提出一种“条件和联合关联分析方法” ,这种方法使用来自于整合分析的概括水平统计和参考样品 SNPs 之间的连锁不平衡更正。当系统达到最优化后,采取逐步地全基因组选择过程来筛选基于条件 P 值的 SNPs,估计所有选择 SNP的联合效应。他们已经使用这种方法整合分析了来2013年第6期3张雁明等 : 全基因组关联分析 : 基因组学研究的机遇与挑战自两个独立大量人群的身高和身体质量指数,通过在独立样本中预测分析来确认结果。这种方法计算速度快,适用于个案对照数据,已经在 2 型糖尿病的整合分析中验证了它的功效。GWAS 的优势 : (1)高通量,一个反应可以同时检测成千上万个序列变异;(2)研究不再涉及“候选基因” ,所研究的基因可以是“未知”的 ; (3)研究之前不再需要构建任何假设,即不需要预先用尚未阐明的生物学基础来做依据,不再需要假设某些特定的基因位点与目标性状或疾病相关14。总之,GWAS 降低了大样本全基因组水平分析的成本,加快了人类疾病和植物分子育种的研究进程。 3 GWAS 在人类疾病研究中的应用在人类基因组中,已经应用 GWAS 发现了许多特定基因与疾病相关联。最早的报道是具有年龄相关性的黄斑变性的 GWAS 研究5,随之相继报道了如肥胖、2 型糖尿病及精神分裂症等的 GWAS 研究成果。2006 年,多个国家级著名研究机构报道了关于肥胖的 GWAS 研究,他们采用两阶段研究设计,用FB
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号