资源预览内容
第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
第9页 / 共10页
第10页 / 共10页
亲,该文档总共10页全部预览完了,如果喜欢就下载吧!
资源描述
1 出芽酵母基因序列出芽酵母基因序列 GCGC 含量统计含量统计 小组成员:崔泽嘉小组成员:崔泽嘉 张娟荣张娟荣 杨家珺杨家珺 何何京京 (2013-2014 学年第二学期)学年第二学期) 2 目录目录 一、课程项目报告1 二、小组成员及主要贡献2 三、报告内容3 四、实验过程4 五、实验结果6 六、误差来源及分析7 七、生物学意义8 八、 参考文献10 3 一、一、 小组成员及主要贡献小组成员及主要贡献 姓名姓名班级班级主要贡献主要贡献 崔泽嘉生物信息1202程序编写 张娟荣生物信息1202文献资料查阅 杨家珺生物信息1202PPT 制作与演讲 何京生物信息1202课程项目报告制作 二、报告内容二、报告内容 1、基本要求: 基因和基因间序列作为两个独立样本;每个基因序列(或基 因间序列)作为一个个体;GC 含量作为随机变量;比较两个随机 变量分布特征;阐述其生物学意义。 GC 含量=GC 数量/基因长度 2、猜想: 1.基因中的 GC 含量较高 原因:CG 含量与 DNA 的稳定性有关,为了保持基因的稳定性, 可能 GC 含量较高。 2.基因间的 GC 含量较高 原因:由于基因片段除了复制之外,还需要转录,为了及时方便 的打开,可能 GC 含量较少。 3、实验过程及结果分析 4、GC 含量的生物学意义 4 三、实验过程三、实验过程 1、主要思路: 编写程序导入基因文件,编写函数循环计算每段序列的 GC 含量,将计 算好的每段 GC 含量存入一个数组,再从数组中计算总体的均值及方差。 2、设计方案: 调用ifstream file输入基因文件, 按顺序向前搜索, 每遇到 “” 调用getline 函数一行一行读基因序列,若遇到”G”或”C”则计数,否则继续向前搜索.编写 jisuan 函数统计每段 GC 含量,为了确保 jisuan 函数程序能够循环调用,使用 return 语句返回函数。创建数组 H存放每段计算出的 GC 含量,再编写程序 计算各段 GC 含量的均值及方差。 3、定义: 样本:基因组序列、基因间序列 个体:每一段基因序列 随机变量:GC 含量 4、主要代码: #include using namespace std; #include /头文件以进行文件输入 #include/头文件以创建类 double Jisuan(string jy) int t,m=0,n=0,i=0; double h; while(jyi!=0) if(jyi=C|jyi=G) m+; i+; else if(jyi=A|jyi=T) 5 n+; i+; elsei+; t=m+n; if(m!=0 couth);/遇到开始按行读 Hj=Jisuan(line); j+; /coutjendl; for(int i=0;ij;i+) /coutHiendl; aver+=Hi; aver=aver/i; cout平均值:averendl; for(i=0;ij;i+) vari+=(Hi-aver)*(Hi-aver); vari=vari/i; cout方差为:variendl; return 0; 6 五、实验结果五、实验结果 1、计算结果 基因基因基因间基因间 均值:0.40238均值:0.339116 方差:0.00245471方差:0.00328109 2、试调分析 基因组序列 基因间序列 7 基因组序列 GC 含量分布条形图 基因组序列 GC 含量分布条形图 六、误差来源及改进六、误差来源及改进 误差:程序计算误差;绘图误差。 改进:代码可进一步简短;使用 perl、python 语言更简单;用 matlab 绘 图更直观。 七、实验心得及体会七、实验心得及体会 通过本次的课程设计提高了我们的编程及创新能力,文献阅读能力,PPT 制作水平等,促进了大家的交流合作,同时使我们对 C+编程有了更深的理 解,但是由于学得不深,对于文件的导入、函数的循环调用等不是很了解,不 太清楚计算机到底是怎样存储的数据的,数据存储的利用率的高低。 以后要加强理论知识的学习与实践操作能力的培养,熟练掌握一门编程 语言,争取早日成为一名合格的生物信息人。 8 八、生物学意义八、生物学意义 背景: GC 含量是在所研究的对象(例如放线菌)的全基因组中,(鸟嘌呤)(Guanine)和 胞嘧啶(Cytosine)所占的比例。一种生物的基因組或特定 DNA、RNA 片段有特定 的 GC 含量。在 DNA 链中 G 和 C 是以三个氢键相连,而 T 和 A 则是两个氢键相 连的。氢键的多少体现连接的能量,氢键多的不容易被打断。在双链 DNA 中, 腺嘌呤与胸腺嘧啶(A/T)之比,以及鸟嘌呤与胞嘧啶(G/C)之比都是 1。但是, (A+T)/(G+C)之比则随 DNA 的种类不同而异。GC 含量愈高,DNA 的密度也 愈高,同时热及碱不易使之变性,因此利用这一特性便可进行 DNA 的分离或测 定。 基因表达与哺乳动物 DNA 碱基 GC 含量的关系: 哺乳动物染色体的特性是 DNA 的碱基组成可大量改变即等值区 (isochores) 。与以前的研究相矛盾之处是,Lercher 等(HumMoI Genet,2003, 12:2411)最近的研究发现基因表达广度与 GC 含量相关,由此推测可能存在一 种选择压力,它有助于富含 GC 的等值区中管家基因的集中。Lercher 等应用不同 的基因表达研究方法(EST,SAGE 和微阵列)和不同的 GC 含量检测方法在人和 小鼠体内进行实验,以重新评估基因表达与 GC 含量的相关性。结果显示,GC 含量与基因表达之间有很弱的相关性, 并可随所使用的基因表达检测方法的不同 而变化。这种弱相关性的预测值很低。由此推断特定基因的表达依赖于其所在区 域的 GC 含量的观点是不成立的。 对 DNA 甲基化异常的病理学意义及甲基化检测方法 : 亚硫酸盐降低 CG 含量的 PCR 用于脆性 X 染色体诊断得 PCR 方法。由于 亚硫酸盐能使相应区域的 DNA 反义链中的 CCG 转变为 UCG,PCR 反应时即成为 TCG,从而使甲基化 CGG 重复序列的 GC 比由 100 %降为 66 %。 该方法对其他疾 病的诊断没有广泛性的借鉴价值 ,但就脆性 X 染色体诊断而言 ,则极大地简化 了诊断过程。 人类性染色体假常态区 GC 含量的进化研究: 9 根据前人的研究结论,在人、鸟类、啮齿类、线虫、昆虫、植物和酵母的基 因组中,重组率和 GC 含量之间有一个显著的正相关性;而且,在哺乳动物和酵母中, 研究人员发现重组本身具有致突变性质,重组被认为是碱基组成进化的主要动力 之一。重组推动了碱基组成的进化,虽然这一主流假说已经被广泛接受,碱基组成 的进化机制却还没有被阐明。根据前人的研究,有两个模型最有可能用来解释碱 基组成的进化机制:偏向性基因转换模型(the biased gene conversion model, BGC) 指出,由于在减数分裂过程中错配的修复机制是偏向于GC,所以在那些GC/AT的杂 合位点 GC 倾向于被固定下来,基因转换的过程使得重组频繁区域的 GC 含量得到 相应的升高;局部偏向性突变模型(the regional mutation biased, RMB)认为,是由于 基因组不同区域的GCAT:ATGC比例不同,才导致这些区域间的碱基组成差异。 重组的致突变性质能够增加 ATGC 新突变产生的概率,在中性条件下,如果局部 的突变是偏向于 ATGC 的产生,那么该区域的 GC 含量就是增加,反之亦然。 有力 的证据从各方面支持着偏向性基因转换模型和局部偏向性突变模型,因为 BGC 模 型认为 GC 有优先被固定下来的优势,而 RMB 模型则认为碱基组成的进化是中性 的,所以可以通过研究进化过程中等位基因的固定是否具有偏向性来区分两者在 碱基组成进化中的作用。 人的 X 和 Y 染色体在两端的两个很小的区域配对并发 生重组,这样的区域称为假常态区(pseudoautosomal region, PAR)。 位于 X/Y 染色体 短臂的假常态区为 PAR1,长约 2.6 Mb,与类人猿的假常态区高度同源,PAR1 在雄性 减数分裂过程中的重组率是基因组平均水平的 20 倍。X/Y 染色体的长臂有一个 较小的假常态区 PAR2,约 330 kb 大小,重组率只有基因组平均水平的 5 倍多。 PAR1 是研究重组在碱基组成进化中作用的理想材料,该区域中基因越靠近端粒 GC 含 量就越高,形成了一个 GC 含量逐渐升高的梯度。由于在 PAR1 中,越靠近端粒的部 分重组率就越高,所以我们期望在 PAR1 中重组率和 GC 含量也同样有一个显著的 正相关性。 10 八、参考文献八、参考文献 1.ZHOU Cui - lan , YIN Yu - fang , ZHANGJia ,et al. Biological Implications of DNA Methylation and DNA Methylation Assays,1672 - 7444 (2005) 02 - 0148 06. 2.Monk M. Epigenetic programming of differential gene expression in development and evolution J . Dev Genet ,1995 ,17 (3) : 188 -197. 3.Ehrlich M. DNA methylation in cancer :too much but also too little J . Oncogene , 2002 , 21 (35) : 5400 - 5413. 4. Li Q , Ahuja N , Burger PC ,et al. Methylation and silencing of the Thrombospondin - 1 promoter in human cancer J . Oncogene ,1999 , 18 : 3284 - 3289. 5. Deng G. Methylation of Cp Gin a small region of the hMLH1 pro2 moter invariably correlates with the absence of gene expression J . Cancer Res , 1999 , 59 (9) : 2029 - 2033. 6. Grigg G. Sequencing 5 - methylcytosine residues in genomic DNA J . Bioessays , 1994 , 16 (6) : 431 - 436. 7.Hiltunen MO , Alhonen L , Koistinaho J , et al . Hypermethylation of the APC (adenomatous polyposis coli) gene promoter region in human colorectal carcinoma J . Int J Cancer , 1997 , 70 (6) :644 - 648. 8.Melki JR. Concurrent DNA hypermethylation of multiple genes in acute myeloid leukemia J . Cancer Res , 1999 , 59 (15) : 3730- 3740. 9. Panagopoulos L , Lassen C , Kristoffersson U ,et al. A methylation PCR app
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号