资源预览内容
第1页 / 共41页
第2页 / 共41页
第3页 / 共41页
第4页 / 共41页
第5页 / 共41页
第6页 / 共41页
第7页 / 共41页
第8页 / 共41页
第9页 / 共41页
第10页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第三章 关键词或词组为基础的 数据库检索(I)生物信息学检索数据库的方法 u 用关键词或词组进行数据库检索(Text-based database searching)u 用核苷酸或蛋白质序列进行数据库检索(Sequence-based database searching)Gene nameAuthorAccession numberDatabase关键词或词组为基础的数据库检索关键词名词、描述性词、词组序列注册号 (Accession number)检索体系NCBI EntrezSequence Retrieval System (SRS)Integrated database retrieval system (DBGET)Trends in Biotechnology 1998, 16 (supplement 1):3- 5.最准确可靠检索须知(1)u 连接词 AND, OR, NOT(Boolean operators)rice AND enzyme (AND为缺省值,可略去)rice AND enzyme NOT kinase retrotransposon OR retroelement注意事项:1、AND, OR, NOT must be entered in UPPERCASE2、Boolean operators are processed in a left-to-right sequencerice AND (microarray OR expression profile)rice AND microarray OR expression profile3、The order can be changed by enclosing individual concepts in parentheses (processed first)PubMed27000 records 504 records u 用引号将两个单词组成一个词组16S rRNA = 16S AND rRNA “16S rRNA”pseudopod* =pseudopod OR pseudopodia OR pseudopodium 检索须知(2)Nucleotide 16S rRNA “16S rRNA”380000 sequences 3300000 sequences exact matchu wild card, *, 放在单词后使检索范围扩大,但 专一性降低u 表示范围, :, 连接前后关键词,限定范围110:500Sequence Length 2009/3/1:2009/9/30Publication Date 1. Entrezhttp:/www.ncbi.nlm.nih.gov/gquery/NCBI 的检索体系优点:三种检索体系中最容易操作的体系,帮助 文档完备Entrez HelpEntrez可对6大类40个数据库进行检索Nucleic Acids Research 2013, 41:D8-D20Entrez可对6大类40个数据库进行检索针对基因组已测序完成的物种针对GenBank中具有大于7万条EST的物种Prokaryotic, chloroplast, mitochondrial, virus, protist, plant针对17个广泛研究的模式生物Entrez系统中数据库之间的连接NCBI主页选择“All Databases”或Entrez主页 ,输入关键词各个数据库中检索到的信息数量点击相应数据库查看信息目录, 每一条信息与其它数据库的相关 信息链接检索方法(1):跨库检索 (cross-database search)检索方法(2):选择数据库检索NCBI主页选择数据库,输入关键词检索到的信息目录,每一条信息 与其它数据库的相关信息链接查看信息内容序列数据库的搜索精简搜索结果查询insulin基因的序列不是想要的结果!如何精简?精简搜索结果的方法1:使用Limits查询人(human)的insulin基因的序列关键词 查询范围: insulin title human organism 精简搜索结果的方法2:使用Advanced search如何定义查询范围?LOCUS DQ176424 1980 bp DNA linear PLN 12-MAR-2006 DEFINITION Oryza sativa (indica cultivar-group) pathogen-induced defense- responsive protein 8 (DR8) gene, complete cds. ACCESSION DQ176424 VERSION DQ176424.1 GI:73918052 KEYWORDS HTG. SOURCE Oryza sativa Indica GroupORGANISM Oryza sativa Indica GroupEukaryota; Viridiplantae; Streptophyta; Embryophyta;Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; BEP clade; Ehrhartoideae; Oryzeae; Oryza. REFERENCE 1 (bases 1 to 1980)AUTHORS Wang,G., Ding,X., Yuan,M., Qiu,D., Li,X., Xu,C. and Wang,S.TITLE Dual function of rice OsDR8 gene in disease resistance and thiamine accumulationJOURNAL Plant Mol. Biol. 60 (3), 437-449 (2006)PUBMED 16514565gbdiv_plnPropertiesTitleModification Date1000:2000Sequence LengthAccessionGI任意搜索范围:Xa21All Fieldsbiomol_genomicProperties biomol_mrna: mRNA biomol crna: cRNAPublication Date :记录记录公开日期Keyword: EST GSS HTG HTC TPA TSA OrganismAuthorJournal注意:关键词和字段名(field)均不区分大小写ORIGIN 1 ggtacattat atattctgtt tggaatatga tcaggcctag tgggaactgc tttaagttta61 cttattcgag ctgagttagg acaacctggg gccctattag gggatgatca attatataat121 gttattgtta cagcacacgc ttttgtaata atttttttct tagttatacc tataatgatcFEATURES Location/Qualifierssource 1.646/organism=“Dicathais orbita“/organelle=“mitochondrion“/mol_type=“mRNA“/db_xref=“taxon:69583“/clone=“20006E09“/note=“mitochondrial and ribosomal sequences produced bysuppressive subtractive hybridization“CDS 646/gene=“COXI“/codon_start=1/transl_table=5/product=“cytochrome oxidase subunit I“/protein_id=“ACT34372.1“/db_xref=“GI:253740054“/translation=“GTLYILFGMWSGLVGTALSLLIRAELGQPGALLGDDQLYNVIVTAHAFVMIFFLVMPMMIGGFGNWLVPLMLGAPDMAFPRLNNMSFWLLPPALLLLLSSAA 第四章讲讲述使用序列进进行检检索Feature Key: promoter, mRNA, CDS, exon, intron, polyA_signalCOXIGene Namegene_in_mitochondrionProperties如何定义查询范围?humanORGN AND 50SLEN:60SLEN AND 1999MDAT 精简搜索结果Aim: Find all human nucleotide sequences with the poly(A) signal. 不同数据库的Search fields不同,详见Limits/Advanced选项!j mol evolJOUR AND drosophilaORGN “polyA_signal“FKEY AND humanORGN Aim: Find all human protein sequences with lengths between 50 and 60 amino acids that were entered into the database during 1999. Aim: Find Drosophila population studies published in the Journal of Molecular EvolutionSearch Field Descriptions for Sequence Database查询人insulin基因的RefSeq序列精简搜索结果的方法3:直接输入搜索字段自动将俗名转换为学名查询人insulin基因的RefSeq序列精简搜索结果的方法4:组合多次搜索结果使用Clipboard临时收集多条序列永久保存收集的序列需要注册,然后Send to Collections第三章 关键词或词组为基础的 数据库检索(II)生物信息学文献数据库Pubmed的搜索http:/www.ncbi.nlm.nih.gov/PubMed/u美国国家医学图书馆的数据库u数据来源 MEDLINE:已经规范处理的数据,已标注MeSH Terms,记录标有pubmed-indexed for medline In Process Citations:尚未经规范处理的数据,记录 标有pubmed-in process Publisher-Supplied Citations:由出版商提供的电子 文献,记录标有PubMed-as supplied by Publisher 搜索结果举例Pubmed自动将检索词翻译为MeSH词汇使用MeSH词汇能获得更加全面、准确的结果精简PubMed搜索结果的方法:使用AdvancedPubMed数据库的搜索12“huazhong agricultural university“AffiliationPubMed数据库的字段:Affiliation AD Article Identifier AID All Fields ALL Author AU Book book Comment Corrections Corporate Author CN Create Date
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号