资源预览内容
第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
亲,该文档总共6页全部预览完了,如果喜欢就下载吧!
资源描述
玉米 Dof转录因子家族基因的全基因组分析来源: 生物信息学.-2 0 1 0 ,8(3).-198-20 作者:江海洋等 阅读次数: 769 摘要:Dof 转录因子家族在植物生长发育和基因表达调控过程中具有重要的作用,本文利用公布的玉米基因组草图数据,利用生物信息学方法对玉米全基因组 Dof 基因的结构、系统进化关系和保守 motif 进行了分析。结果表明:玉米中共有 18 个 Dof 类型基因,命名为 ZmDof1 - ZmDof18,其蛋白质长度在 211aa 至 618aa 之间,通过系统进化树分析后, 18 个 Dof 基因可以明显的分为三类,此外玉米 Dof 基因的数目远远小于水稻和拟南芥,基因复制现象较少是玉米 Dof 基因数量较少的原因之一,MEME 分析证实了 Dof 基因含有三个保守的 motif。对玉米 Dof 类型基因的系统分析,将有助于玉米 Dof 类型基因的克隆和功能的进一步研究。转录因子( transcrip tion factor) ,又称反式作用因子( transacting factor) ,是指能够与真核基因的顺式作用元件( cis acting element)发生特异性相互作用并对转录有激活或抑制作用的 DNA 结合蛋白,转录因子调控复杂的蛋白间的互作网络。典型的转录因子含有 DNA 结合区、转录调控区、寡聚化位点及核定位信号区等功能。有关转录因子结构和功能的研究是植物分子生物学研究的前沿领域,因其含有 DNA 结合蛋白的不同可以划分为不同的基因家族。因为转录因子在植物基因表达过程中的重要作用,因此从全基因组角度研究某一类型调控因子具有重要的意义。对拟南芥和水稻全基因组的转录因子研究表明,拟南芥中共含有 3 018 个转录因子,占基因总数的 16. 8%。Dof (DNA bindingwith one finger)基因家族是一类植物专有的转录因子,在果蝇、秀丽线虫和酿酒酵母的基因组中尚未发现有 Dof 基因的存在。它含有一个独特的富含 Cys 残基的单锌指 (C2 -C2 )保守结构域,命名为 Dof 结构域,含有 Dof 结构域的蛋白质通称为 Dof 蛋白家族。Dof 蛋白通常包含 2 个主要的结构域:一个位于 N 末端的保守的 DNA 结合结构域和一个位于 C 末端的调控结构域。在 N 末端有 52 个氨基酸组成的高度保守的 DOf 结构域,在此结构域中 CX2CX21 CX2 C基序形成一个单锌指结构,此单锌指结构中 1 个 Zn 可与 4 个 Cys 残基共价结合。并且 Dof 基因的锌指结构亮氨酸残基与锌离子结合方式特殊,造成其与其它的锌指结构有明显不同。Dof 蛋白的转录调控结构域位于 C 末端,如玉米的 ZmDofl 的转录激活结构域是位于 C 末端的 44个氨基酸残基。并且两个结构域之间拥有一个 Ser 骨架,可能作为分子铰链连接这两个结构域。研究表明 Dof 转录因子在植物生长发育过程中参与多种生物学过程,参与植物体内多种基因的表达调控,包括种子贮藏蛋白合成、糖代谢过程光调控、植物防卫机制、种子萌发、赤霉素反应等基因。在玉米中已经克隆了 2 个 Dof 转录因子,主要功能是特异性的结合启动子的 AAAAGG 核心序列,并且有增强启动子活性的功能。随着测序技术的进一步升级,植物全基因组测序物种再进一步扩大,拟南芥、水稻、苜蓿、杨树等模式生物都已经完成全基因组测序,大大加快了这些物种的基因克隆和功能基因组学研究,特别是对特定一类基因家族的全基因组分析研究近年来取得了一定得进展。玉米属于禾本科玉米属植物,原产于美洲大陆的墨西哥、秘鲁、智利等地,玉米作为三大粮食作物之一,是人类生存的基本食物来源和主要的动物饲料原料,同时玉米也是研究作物和光合作用代谢的模式植物。其全基因草图数据于 2008 年完成,对玉米基因组信息的分析和挖掘工作是目前研究的热点。本文利用公布的玉米基因组草图数据,对全基因组 Dof 转录因子基因家族进行筛选,分析 Dof 转录因子的数目并进行分类 ,同时进行系统发生学分析并与水稻的 Dof 转录因子比较分析,该研究全面了解玉米 Dof基因家族的信息和特点,对于玉米 Dof 基因的克隆、功能鉴定具有重要的意义。1数据与方法1. 1数据下载玉米 B73 全基因组数据和蛋白质数据从国际玉米基因组网站 http: / /www. maizegenome. org/data_portal. html 下载。1. 2Dof 类型基因的鉴定首先,从 Sanger 中心的数据库中选取 Dof 结构域的氨基酸序列( PF02701) ,然后利用 Blastp 程序,P - value 设为 10- 4 ,对玉米全基因组蛋白质数据库进行搜索,寻找玉米基因组中所有的候选含 Dof 蛋白。所有符合要求的序列再通过 Pfam (蛋白家族数据库, http: / /pfam. wustl. edu /hmmsearch. shtml)来验证是否含有 Dof 结构域( threshold = 0. 9) 。第三步,所有已被选取基因的核苷酸序列通过 Clust2alW 的方法进行多序列排列,根据排列的结果,去除候选基因中的重复序列。1. 3Dof 基因系统进化树的构建由于 Dof 蛋白氨基酸序列具有较高的相似性,根据排序结果,利用MEGA4. 0 软件对所有序列使用距离法(Neighbor - Joiningmethod)构建系统进化树。1. 4Dof 基因保守 motif 分析玉米 Dof 类型基因的保守 motif 分析通过 MEME(Multip le Expectation Maximization for Motif Elicita2tion)在线分析,MEME 是圣地亚哥超级计算机中心(SDSC) 开发的一套用来寻找一组相关的 DNA 序列或者蛋白质序列的基序(motif)的程序。利用此软件对玉米 Dof 类型基因的保守 motif 进行分析。2结果与分析2. 1Dof 类型基因的确定对玉米全基因组基因进行分析, 利用标准的 Dof 结构域氨基酸序列,通过 B last 分析获得候选 Dof 基因,首先通过序列比对以去除重复的基因,然后利用 Pfam 数据库分析证实候选基因存在 Dof 结构域,去除结构不完成的候选基因,最终共得到 18 个玉米 Dof 家族基因,并命名为 ZmDof1 - ZmDof18(表 1 略 ) ,蛋白的氨基酸长度从 211aa 至 618aa,长度差异较大,但是每一个蛋白质经过 pfam 分析都含有典型的锌指结构,具有典型的 Dof 结构域。玉米基因组远远大于模式植物拟南芥和水稻,但在水稻中共发现 30 个 Dof 类型基因,拟南芥中发现 36 个 Dof 类型基因,都远远的大于玉米中的 18 个 Dof 基因。此外,因为玉米基因组并没有拼接完整。对 Dof 进行 BAC 定位,发现 18 个基因分别位于不同的 BAC 克隆上 ,通过下面的系统进化树分析把 18 个玉米 Dof 基因分为 a、b、c 三类。2. 2Dof 类型基因的结构域分析对 18 个玉米 Dof 基因的 Dof 结构域氨基酸序列进行 ClustalW 排列分析( 图 1 略 ) ,可以明显的看出 18 个基因都含有一个明显的锌指结构,这也是 Dof 结构域的重要特点,其中 18 个基因同时都含有保守的 4个半胱氨酸 C (图 2 略) ,同时在保守的锌指结构之中,黑色部分标注的氨基酸序列完全一致,进一步要说明了该 18 个候选基因确实都含有了Dof 结构域的所有的功能单元。2. 3Dof 类型基因的系统进化树分析经过分析,玉米基因组中共含有 18 个 Dof 类型基因,为了研究基因之间的进化关系, 我们利用 MEGA4. 0 软件的 NJ 法对 18 个基因构建系统进化树(图 2 略) 。从进化树可以看到,玉米中 Dof 基因具有较高的同源性, 18 个 Dof 类型基因可以明显的分为 3 个分枝 ,其中最大的分枝a 含有 12 个基因 ,而分枝 b 含有 2 个基因,分枝 c 含有 4 个基因。水稻和拟南芥的 Dof 基因家族都划分为 4 类,与玉米具有明显不同的特点和进化模式。2. 4Dof 类型基因保守 motif 分析对 Dof 基因的蛋白序列在 MEME 网站进行在线分析 motif 结构与类型,可以明显的看出不同的 Dof 基因所含有的保守 motif 的数目和位置都有较大的差异(图 3 略) , 其中 ZmDof3、ZmDof6 、ZmDof8、ZmDof2 含有 3 个保守的 motif,而 ZmDof12、ZmDof7 、ZmDof17、ZmDof1、ZmDof9、 ZmDof14、 ZmDof16、ZmD2of13、ZmDof11、ZmDof18含有 2 个保守 motif,而 Zm2Dof4、ZmDof5 、ZmDof10 、ZmDof15 只含有 1 个保守的 motif。进一步对保守的 motif 序列进行分析(表 2) ,motif1 含有 47 个氨基酸,motif2 含有 30 个氨基酸,而 motif3 含有 16 个氨基酸。3讨论随着基因组学的不断发展,全基因组测序变得越来越简单,生物信息学的发展十分的迅速,利用生物信息学方法研究基因组中的遗传信息近年来成为热点。植物转录因子在细胞的发育、抗逆、信号转导方面具有重要的作用, Dof 基因作为转录因子家族重要的一员,在植物种子贮藏蛋白合成基因的调控和植物防卫机制上具有重要的作用。随着植物基因组测序的不断公布,利用全基因组数据分析和研究某一家族基因对于该基因家族的克隆和功能验证具有重要的意义。水稻、拟南芥是最先测序的两个模式植物,对于它们的 Dof 基因家族分析已经完成,大大的增强了我们对于 Dof 基因家族的理解,认识了 Dof 基因家族的类型、分布以及结构特点。玉米目前已经克隆了 2 个 Dof 类型的基因 ,对基因功能的研究证实了它们在种子萌发、光调节基因的调控上发挥了重要的作用。利用了玉米全基因组数据,利用生物信息学方法分析得到了 18 个玉米 Dof类型基因,蛋白质的长度从 211aa 至 618aa 都有分布 ,蛋白长度的变化较大一方面说明了 Dof 基因的起源和进化模式复杂,另一方面也说明了 Dof 类型基因在功能上多样性,不同的 Dof 基因可以参与不同的代谢途径调控。此外水稻基因组中共含有 30 个 Dof 基因,拟南芥基因组中共含有 36 个 Dof 基因,玉米基因组大约是水稻的 4 倍,拟南芥的 16 倍,但是Dof 类型基因的数目却远远小于这两种模式植物,说明基因组大小与 Dof 基因家族大小并不成正比。同样的现象我们在对于玉米抗病基因的分析中也观察到,结果证实是由于玉米抗病基因发生的基因复制现象较少引起的的。在对玉米和拟南芥中的 Dof 基因中的基因复制现象进行分析后发现,拟南芥中的 Dof 基因复制现象大于玉米( 数据未展示) ,证实了玉米 Dof 基因偏少的原因在于 Dof 基因发生基因复制的现象较少。对玉米的 Dof 基因的结构域和系统进化树分析表明,玉米 Dof 类型基因结构上具有较高的相似性,进化树具有 3 个明显的分枝,我们命名为a、b、c 三种类型,水稻和拟南芥都分为 4 种类型。一方面说明了 Dof基因在不同植物中的进化模式有所不同,另一方面也说明了不同植物 Dof 基因的功能上也有所差异。4结论Dof 转录因子基因家族是植物中专有的一类基因家族,在植物生长发育和基因表达调控过程中发挥重要的作用。目前玉米中对这类基因的研究并不多见,其功能大多也处于未知状态。本研究利用玉米基因组草图数据,采用生物信息学方法全基因组分析了玉米的 Dof 转录因子基因类型、结构和进化关系。在玉米中共发现含有 18 个 Dof 类型基因,基因数目少于同是单子叶植物的水稻。玉米 D
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号