资源预览内容
第1页 / 共51页
第2页 / 共51页
第3页 / 共51页
第4页 / 共51页
第5页 / 共51页
第6页 / 共51页
第7页 / 共51页
第8页 / 共51页
第9页 / 共51页
第10页 / 共51页
亲,该文档总共51页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2.3 2.3 基因组基因组数据库数据库收集并收集并贮存各种生物完整基因存各种生物完整基因组染色体的染色体的DNA序列、序列、结构及功能注构及功能注释的数据的数据库。主要包括主要包括NCBI的的Genome数据数据库,EBI的的Genome Reviews数据数据库以及加利福尼以及加利福尼亚大大学圣克学圣克鲁斯分校的斯分校的UCSC基因基因组数据数据库。2.3.1 NCBI2.3.1 NCBI的基因组的基因组数据库数据库http:/www.ncbi.nlm.nih.gov/genome该数数据据库目目前前已已收收集集了了10400种种以以上上物物种种的的基基因因组的的完完整整染染色色体体序序列列图谱、遗传图谱和和物物理理图谱,分分为古古生生物物、细菌菌、真真核核生生物物、病病毒毒、类病毒五大病毒五大类群。群。人人基基因因组组一一号号染染色色体体图图谱谱Map Viewer2.3.2 EBI2.3.2 EBI的的基因组浏览数据库基因组浏览数据库2.3.3 UCSC2.3.3 UCSC基因组浏览器基因组浏览器http:/genome.ucsc.edu加州大学圣克鲁兹分校基因组数据库加州大学圣克鲁兹分校基因组数据库工具栏工具栏点点击“Genomes”,进入入“定位定位”检索方式。索方式。点点击“Blat”,进入入“序列比序列比对”检索方式。索方式。点点击“Tables”,进入入“表表单”检索方式。索方式。“表表单”检索的参数索的参数选择:a)clade 进化分支;化分支;b)genome 物种;物种;c)assembly 版本;版本;d)group 数据数据组织类型,默型,默认为“genes and gene prediction tracks”;e)track 数据数据检索方式,默索方式,默认为“USCS tracks”;f)table 输出数据表,默出数据表,默认为“knownGene”;g)output format 数据数据输出格式;出格式;h)output file 输出文件名。出文件名。点点击“get output”下下载基因基因组数据。数据。2.4 2.4 蛋白质蛋白质序列数据库序列数据库早早期期的的蛋蛋白白质序序列列数数据据库主主要要有有:由由NCBI建建立立的的Protein序序列列数数据据库、由由美美国国国国家家生生物物医医学学研研究究基基金金会会建建立立的的PIR序序列列数数据据库和和由由瑞瑞士士生生物物信息研究所建立的信息研究所建立的Swiss-Prot序列数据序列数据库。目目前前,PIR、TrEMBL已已与与Swiss-Prot蛋蛋白白质序序列列数数据据库合合并并为UniProtKB蛋蛋白白质序序列列数数据据库。2.4.1 NCBI2.4.1 NCBI蛋白质序列数据库蛋白质序列数据库2.4.2 UniProtKB2.4.2 UniProtKB蛋白质蛋白质序列数据库序列数据库包含所有已知序列的野生型蛋白包含所有已知序列的野生型蛋白质的信息,其的信息,其核心的蛋白核心的蛋白质序列数据序列数据库为UniProtKB。数据数据库中所提供的蛋白中所提供的蛋白质结构与功能信息非常构与功能信息非常全面。全面。http:/www.uniprot.org/UniProtKB蛋蛋白白质序序列列数数据据库格格式式文文件件所所包包含含的内容有:的内容有:功能功能名称和分类名称和分类亚细胞定位亚细胞定位病理和生物技术病理和生物技术翻译后加工修饰翻译后加工修饰表达表达相互作用相互作用结构结构家族和结构域家族和结构域序列序列交叉参考交叉参考发表论文发表论文注册信息注册信息杂项杂项相似蛋白质相似蛋白质注册号注册号标识符标识符人类胰核糖核酸酶的数据库文件人类胰核糖核酸酶的数据库文件第一部分第一部分功能功能第二部分第二部分名称和分类名称和分类第三部分第三部分亚细胞定位亚细胞定位第四部分第四部分病理和生物技术病理和生物技术第五部分第五部分翻译后加工修饰翻译后加工修饰第六部分第六部分表达表达第七部分第七部分相互作用相互作用第八部分第八部分结构结构第九部分第九部分家族和结构域家族和结构域第十部分第十部分序列序列第十一部分第十一部分交叉参考交叉参考第十二部分第十二部分发表论文发表论文第十三部分第十三部分注册信息注册信息第十四部分第十四部分杂项杂项第十五部分第十五部分相似蛋白质相似蛋白质2.5 2.5 结构结构数据库数据库结构构数数据据库收收集集并并贮存存生生物物大大分分子子三三维结构构原原始始测量量数数据据,其其中中主主要要是是蛋蛋白白质分分子子三三维结构构数据数据库。生生物物大大分分子子的的三三维结构构数数据据格格式式文文件件可可通通过特特定的定的显示示软件而直件而直观地以地以图形方式表示出来。形方式表示出来。2.5.1 2.5.1 蛋白质蛋白质结构数据库结构数据库主要的蛋白主要的蛋白质三三维结构数据构数据库是是PDB(Protein Data Bank)数据)数据库。此外,。此外,NCBI的的Structure数据数据库(MMDB,the Molecular Modeling Database)也)也包含包含PDB的全部数据。的全部数据。生物大分子的三生物大分子的三维结构构X射射线衍射衍射测量数据均以文本文量数据均以文本文件形式件形式贮存,其后存,其后缀为.pdb,可用,可用专门的的软件打开或件打开或显示。示。2.5.2 2.5.2 三维结构三维结构显示软件显示软件常常用用的的生生物物大大分分子子三三维结构构显示示软件件包包括括:RasMol软件件(Bernstein HJ)和和Cn3D软件件(NCBI)和和Swiss-PdbViewer(SIB)等。)等。下下载地址(适用于地址(适用于Windows XP):):http:/www.rasmol.org/software/RasMol_2.7.5_Windows_Installer.exeftp:/ftp.ncbi.nih.gov/cn3d/Cn3D-4.3.msihttp:/spdbv.vital-it.ch/download/binaries/SPDBV_4.10_PC.zip为了帮助用了帮助用户从浩如烟海的生物从浩如烟海的生物实验数据中数据中获取有用的数据取有用的数据资料,并料,并对数据数据进行科学的分析行科学的分析和和处理,各生物信息数据理,各生物信息数据库系系统均开均开发了一系了一系列的列的实用工具用工具软件,主要的有:件,主要的有:GQurey NCBI数据数据库检索工具索工具软件;件;SRS EBI的数据的数据库检索工具索工具软件;件;UniProt 蛋白蛋白质序列序列检索工具索工具软件。件。2.6 2.6 生物生物数据库的信息检索数据库的信息检索2.6.1 GQurey2.6.1 GQurey检索工具:检索工具:网址:网址:http:/www.ncbi.nlm.nih.gov/gqueryGQurey(以以前前称称为Entrez)是是NCBI开开发的的数数据据库检索索系系统。通通过该检索索系系统,用用户可可对NCBI中中的的数数据据资料料快快速速进行行交交叉叉检索索,这些些数数据据资料料包包括括核核苷苷酸酸序序列列、蛋蛋白白质序序列列、生物大分子生物大分子结构、全基因构、全基因组以及文献摘要。以及文献摘要。目前,目前,GQurey链接的数据接的数据库主要有:主要有:PubMed:生物医学文献数据:生物医学文献数据库;Nucleotide(GenBank):核核苷苷酸酸序序列列数数据据库;Protein:蛋白:蛋白质序列数据序列数据库;Structure:生物大分子三:生物大分子三维结构;构;Genome:基因:基因组数据数据库;PopSet:种群研究数据:种群研究数据资料;料;OMIM:在:在线人人类孟德孟德尔遗传学;学;Taxonomy:基因数据:基因数据库中的生物分中的生物分类学;学;UniGene:基因表达和微:基因表达和微阵列数据列数据库;UniSTS:遗传标志和作志和作图数据数据库。1.在在浏览器地址器地址栏输入入 http:/www.ncbi.nlm.nih.gov/nuccore/核苷酸序列检索步骤核苷酸序列检索步骤2.在检索框内输入关键词进行检索,必要时可设置在检索框内输入关键词进行检索,必要时可设置“Limits”和和“Advanced”。序序列列检索索系系统(Sequence Retrieval System,SRS)是是由由Biowisdom公公司司开开发的的生生物物信信息息数数据据库资料料检索索工工具具软件件。但但该检索索系系统现已已停停止止服服务。用用户可通可通过EMBL-EBI提供的提供的链接接进行行检索。索。2.6.2 SRS2.6.2 SRS检索工具:检索工具:网址:网址: http:/www.ebi.ac.uk/services2.6.3 BioMart2.6.3 BioMart检索工具检索工具BioMart也是也是EBI中常用的数据中常用的数据库检索工具之一。索工具之一。该检索工具的特点是可以跨数据索工具的特点是可以跨数据库进行核酸及蛋行核酸及蛋白白质序列的序列的检索。索。利用利用BioMart,可以方便的,可以方便的检索到某一物种全部的索到某一物种全部的或限定范或限定范围的核酸或蛋白的核酸或蛋白质序列、基因序列、基因组位置、位置、表达、表达、结构以及其他注构以及其他注释信息等。信息等。http:/asia.ensembl.org/biomart/martview/1.选择数据数据库(database):):2.选择数据集(数据集(dataset):):3.设置置“过滤器(器(filters)”:4.设置置“属性(属性(attributes)”:5.单击单击“Results”获得检索结果。获得检索结果。2.6.4 UniProt2.6.4 UniProt检索检索工具:工具:网址:网址:http:/www.uniprot.org/由由NIH提提供供资助助,由由EBI、SIB和和PIR三三方方联合合开开发的的主主要要针对UniProtKB蛋蛋白白质序序列列数数据据库的的检索工具索工具软件。件。课外练习课外练习1.使用使用GQuery,EMBL-EBI,BioMart,UniProt等等检索工具,通索工具,通过关关键词(基因名称或蛋白(基因名称或蛋白质名名称)、注册号(称)、注册号(AC)、)、标识符(符(GI或或ID)等方)等方式式检索一段核酸或蛋白索一段核酸或蛋白质序列。序列。2.对检索索结果果进行理解和分析。行理解和分析。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号