生物信息学题库-－金锄头文库

一、选择题:1. 以下哪一个是mRNA条目序列号： A. J01536. NM_15392C. NP_52280D. AAB2. 确定某个基因在哪些组织中表达的最直接获取相关信息方式是： . UnigeneB. EntrezC. LocusLinkD. PCR3. 一个基因可能对应两个Unigene簇吗？可能B. 不可能4. 下面哪种数据库源于mRNA信息： dbESTB. PDBC. OMIMD. HTGS5. 下面哪个数据库面向人类疾病构建： A. ESTB. PDB. OMIMD. HTGS6. Refseq和GenBank有什么区别： A. Refseq包括了全世界各个实验室和测序项目提交的DNA序列B. GenBank提供的是非冗余序列. Refseq源于GenBank，提供非冗余序列信息D. GenBank源于Refseq7. 如果你需要查询文献信息，下列哪个数据库是你最佳选择： A. OMIMB. Entrez PubMedD. PROSITE8. 比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法，下列哪种说法正确：A. 因为GenBank的数据比EMBL更多，Entrez给出的搜索结果将更多B. 搜索结果很可能一样，因为GenBank和EMBL的序列数据实际一样搜索结果应该相当，但是ExPASy中的SwissProt记录的输出格式不同9. 天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于： N/W/YB. Q/W/YC. F/W/YD. Q/N/W10. 直系同源定义为：不同物种中具有共同祖先的同源序列B. 具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C. 同一物种中由基因复制产生的同源序列D. 同一物种中具有相似的并且通常是冗余的功能的同源序列11. 下列那个氨基酸最不容易突变： A. 丙氨酸B. 谷氨酰胺C. 甲硫氨酸半胱氨酸12. PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变： A. 1%B. 20%. 80%D. 250%13. 下列哪个句子最好的描述了两个序列全局比对和局部比对的不同：A. 全局比对通常用于比对DNA序列，而局部比对通常用于比对蛋白质序列B. 全局比对允许间隙，而局部比对不允许C. 全局比对寻找全局最大化，而局部比对寻找局部最大化全局比对比对整体序列，而局部比对寻找最佳匹配子序列14. 假设你有两条远源相关蛋白质序列。为了比较它们，最好使用下列哪个BLOSUM和PAM矩阵： BLOSUM45和PAM250B. BLOSUM45和PAM1C. BLOSUM80和PAM250D. BLOSUM10和PAM115. 与PAM打分矩阵比较，BLOSUM打分矩阵的最大区别是：A. 最好用于比对相关性高的蛋白B. 它是基于近相关蛋白的全局多序列比对它是基于远相关蛋白的局部多序列比对D. 它结合了全局比对和局部比对16. 如果有一段DNA序列，它可能编码多少种蛋白质序列： A. 1B. 2C. 3. 617. 要在数据库查询一段与某DNA序列编码蛋白质最相似的序列，应选择： A. blastn B. blastpC. tblastnD. tblastp blastx18. 为什么ClustalW（一个采用了Feng-Doolittle渐进比对算法的程序）不报告E值：A. ClustalW报告E值使用了全局比对C. 使用了局部比对D. 因为是多序列比对19. Feng-Doolittle方法提出“一旦是空隙，永远是空隙”规则的依据是：A. 保证空隙不会引物序列加入而填充B. 假定进化早期分歧的序列有较高优先级别假定最近序列空隙应该保留D. 假定最远序列空隙应该保留20. 根据分子钟假说： A. 所有蛋白质都保持一个相同的恒定进化速率B. 所有蛋白质的进化速率都与化石记录相符合C. 对于每一个给定的蛋白质，分子进化的速率是逐渐减慢的，就如同不准时的钟对于每一个给定的蛋白质，其分子进化的速率在所有的进化分支上大致是恒定21. 系统发生树的两个特征是： A. 进化分支和进化节点树的拓扑结构和分支长度C. 进化分支和树根D. 序列比对和引导检测方法22. 下列哪一个是基于字母特征的系统发生分析的算法： A. 邻位连接法（NJ法）B. Kimura算法最大似然法（ML）D. 非加权平均法（UPGMA）23. 基于字母特征和基于距离的系统发生分析的算法的基本差异是：基于字母特征的算法没有定义分支序列的中间数据矩阵B. 基于字母特征的算法可应用于DNA或者蛋白质序列，而基于距离仅能用于DNA C. 基于字母特征的算法无法运用简约算法 D. 基于字母特征的算法的进化分支与进化时间无关24. 一个操作分类单元（OTU）可指：A. 多序列比对蛋白质序列C. 进化分支D. 进化节点25. 构建进化树最直接的错误来源是：多序列比对错误B. 采样的算法差异C. 假设进化分支是单一起源D. 尝试推测基因的进化关系26. 第一个被完整测定的基因组序列是： A. 啤酒酵母的3号染色体B. 流感病毒 X174D. 人类基因组27. 普通的真核生物线粒体基因组编码大约多少个蛋白质： 10 B. 100C. 1000D. 1000028. 根据基因组序列预测蛋白质编码基因的算法的最大问题是： A. 软件太难使用. 假阳性率太高，许多不是外显子的序列部分被错误指定C. 假阳性率太高，许多不是外显子功能未知D. 假阴性率太高，丢失太多外显子位点29. HIV病毒亚型的系统演化研究可以： A. 证实HIV病毒是由牛病毒演化而来 . 用于指导开发针对保守蛋白的疫苗C. 证实哪些人类组织最容易遭受病毒侵染30. 一个典型的细菌基因组大小约为多少bp： A. 20000. C. D. 31. 细菌基因组与真核生物基因组分析工具存在较大差异的主要原因是：A. 细菌拥有不同的密码子B. 细菌没有细胞核C. 细菌很少有基因与真核同源细菌DNA的基因含量、组成结构很不一样32. 下列具有最小基因组的原核生物可能是：A. 嗜极生物B. 病毒胞内细菌D. 杆菌33. 要证明某大肠杆菌中的某个基因是水平转移而来，需要：A. 分析该大肠杆菌中该基因的GC含量与其他基因是否有很大差异B. 分析该大肠杆菌中该基因的密码子使用与其他基因是否有很大差异C. 系统发生分析该基因与其他物种中基因的同源关系获取以上三个方面的信息34. C值矛盾是指： A. 某些基因组中核苷酸C的含量少B. 真核生物基因组大小同编码蛋白质的基因个数没有相关性真核生物基因组大小同屋中的复杂性相关性很小D. 真核生物基因组大小同进化上的年龄相关性小35. 成百上千个48bp的重复序列单元最可能出现在： A. 散布性重复序列中B. 假基因中端粒中D. 片段复制区域36. 从头预测真核基因的原因有：A. 外显子/内含子边界难以确定B. 内含子长度可能只有几个碱基对C. 编码区域的GC含量并不总是与非编码区相同以上三个方面的原因37. 人类基因组大小大约是多少Mb： A. 130 B. 300 3000 D. 3000038. 各种重复元件在人类基因组中大约占的百分比为： A. 5%B. 25%50%D. 95%39. 蛋白质编码区域占人类基因组百分比是： 1-5%B. 5-10%C. 10-20%D. 20-4-%40. 人类基因组中GC含量高的区域：A. 基因密度相对较低基因密度相对较高C. 基因密度多变D. 基因所含密码子相对较少41. 人类复合孟德尔遗传的基因疾病约占疾病基因的： 1%B. 10%C. 50%D. 60%42. 单基因疾病趋向于：在普通人群较少见，并且发生时间较早 B. 在普通人群较常见，并且发生时间较早C. 在普通人群较少见，并且发生时间较晚D. 在普通人群较常见，并且发生时间较晚C值真核生物基因组大小同屋中的复杂性相关性很小Feng-Doolittle假定最近序列空隙应该保留HIV用于指导开发针对保守蛋白的疫苗PAM250 80%Refseq源于GenBank，提供非冗余序列信息比较从E 搜索结果应该相当成百端粒中从头以上单基在普通人群较少见，并且发生时间较早蛋白1-5% 第一X174 各种50%根据对于每一个给定的蛋白质，其分子进化的速率在所有的进化分支上大致是恒定根据假阳性率太高，许多不是外显子的序列部分被错误指定构建多序列比对错误基于字母特征的算法没有定义分支序列的中间数据矩阵假设BLOSUM45和PAM250普通10 确定Unigene 人类1% 人类3000人类基因密度相对较高如果6如果PubMed 天冬N/W/Y为什使用了全局比对系统树的拓扑结构和分支长度细菌DNA的基因含量、组成结构很不一样下列半胱氨酸下列胞内细菌下列全局比对比对整体序列下列最大似然法（ML）下面dbEST下面OMIM要在blastx要证获取以上一个一个蛋白质序列一个可能以下NM_15392与PAM它是基于远相关蛋白的局部多序列比对直系不同物种中具有共同祖先的同源序列名词解释1. 生物信息学（bioinformatics）：是一门结合生物技术和信息技术从而揭示生物学中新原理的科学。2. 鸟枪法测序（shotgun method）一种测序方法，包括从基因组中获得随机的、已测序的克隆片段，并且对初始基因的位置一无所知。3. BLAST：基本局部相似性比对搜索工具。在序列数据库中快速查找与给定的序列具有最优局部对准结果的序列的一种序列对算法。4. 整体联配（global alignment）：对两个核苷酸或蛋白质序列的全长所进行的比对。5. FASTA：是第一个被广泛使用的数据库相似性搜索算法，这个程序通过扫描序列中“词”的小配对，从而寻找最优局部比对。6. 算法（algorithm）：在计算机程序中包含的一种固定过程。7. 序列比对（alignment）：将两个或多个序列排在一起，以达到最大一致性的过程（对于氨基酸序列是比较他们的保守性），这样评估序列间的相似性和同源性。8. 多序列比对（multiple sequence alignment）：三个或多个序列之间的比对，如果序列在同一列有相同结构位置的残基和（或）祖传的残基，则会在该位置插入空位。9. 最佳联配（optimal alignment）：两个序列之间有最高打分值的排列。10. 空位（gap）：在两条序列比对过程中需要在检测序列或目标序列中引入空位，以表示插入或删除。11. 模块替换矩阵（BLUSUM）在替换矩阵中，每个位置的打分是在相关蛋白局部比对模块中观察到的替换的频率而获得的，每个矩阵被修改成一个特殊的进化距离。12. 可接受点突变（PAM）一个用于衡量蛋白质序列的进化突变程度的单位。13. 互补序列（complementary sequence）能够与其他DNA片段根据碱