资源预览内容
第1页 / 共27页
第2页 / 共27页
第3页 / 共27页
第4页 / 共27页
第5页 / 共27页
第6页 / 共27页
第7页 / 共27页
第8页 / 共27页
第9页 / 共27页
第10页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计算机检索的原理图示,数据库(文档) 文献记录 计算机 用户提问 查出文献,数据库的类型,1、文献型数据库:也称为书目数据库或目录数据库,是二次文献数据库。 2、指南数据库:也称指示性数据库,其内容是关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,是指引用户从其他有关信息源获取更详细的信息的一类数据库。 3、数值数据库:又称数据型数据库,主要是储存数据信息。 4、全文数据库:是指储存文献全文或者其中主要部分的一种数据库,计算机检索基本技术,计算机检索式(逻辑表达式): 检索词+有关算符,计算机检索策略的构建,(1)布尔逻辑检索(boolean logic): 是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。 布尔逻辑运算符:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT),1) 布尔逻辑算符: 逻辑“与”“AND” * 逻辑“或” “OR” + 逻辑“差”“NOT” - ( ),例子: 1.查找“胰岛素治疗糖尿病”的检索式为: 胰岛素and糖尿病 2.查找“关于高清晰电视的研发”的检索式为: 高清晰电视+HDTV 3.查找“能源(非太阳能)相关文献“的检索式为: 能源 not 非太阳能,使用逻辑算符时应注意的事项:,1)逻辑算符的优先级为:NOT、AND、OR 可用括弧来改变优先级顺序: ()NOTANDOR 2)在逻辑组配时,算符的两侧必须各留有一个空格。,(2) 截词检索 (truncation) 截词符,截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。 截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。,截词符:,它是使计算机保留检索词的相同词干部分,允许检索词可有一定范围的变化。 截词符一般有“?”、“+”(不同数据库有不同的截词符) 截词有四种形式: 前方一致:如“Textile?”可同时查出含有Textile和Textiles的文献。 后方一致:如“?polymer”可同时查出含有Homopolymer, Copolymer文献。 中间一致:如“?Wave?”可同时查出含有WAVES, microwave等的文献。 中间屏蔽:如“Fib?s”相当于查出含有Fibers和Fibres的文献。,使用截词应注意的几个问题,一、截词符要紧接在词干后面,截词符和词干之间不能有空格。 二、避免将检索词的词干截得过短,一般应在三个字母以上。 三、截词应该使用得合理。一般不可能出现词尾变化的单词,其后不必再使用截词。 四、从希望出现的单词中取尽可能多的公共字母作为词干,以提高查准率,(3) 位置算符(又称邻接算符),1/ “(W)”含义为“With” 这个算符表示两侧的检索词必须紧密相连,除开空格外和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒。 另外“(W)”还可以使用其简略形式“()”。 Wn( 或nW) 表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入on个单元词。,举例说明,检索策略为: (1) COMMUNICATION(W)SATELLITE” 或“communication()satellite” 系统将只检索含有communication satellite 词组的记录。 (2) “COMMUNICATION(2W)SATELLITE”时,系统将只检索含有 communication satellite, communication though satellite, communication in the satellite,2/ “(N)”含义为“Near” 这个算符表示两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。 “(nN)”是(N)算符的变形,不同之处为允许两词间插入最多为on个其他词包括实词和系统禁用词。,举例说明,检索策略为: “COTTON(2N)PROCESSING”时, 凡含有cotton processing, processing of cotton和processing of Egyptian cotton的文献记录都算命中。,3/ “(F)”含义为“Field” 检索词必须在同一字段中。 如:检索策略:POLLUTION(F)CONTROL 可查出control and management of industrial pollution一检索词在同一字段中。 4/ “(S)”含义为“Sentence” 检索词必须在同一句子中 如:COMMUNICATION(S)SATELLITE可查出含有communication satellite和satellite communication词组,使用位置算符时应注意的事项:,1、以上是计算机检索中常用的位置算符,但并非所有的系统都可用,不同的检索系统有其自己的规定。 2、位置算符优先于逻辑算符。 3、位置算符的执行顺序是按语句中位置算符的输入次序从左至右执行的。如有括号,则优先执行括号内的位置算符。,4)字段限制,注意:目前各个检索系统所设立的字段是各不相同的,即同一字段,也可能采用不同的字段代码表示。 如题名字段:Ei CPX Web 中, 用 highway transport* within TI 来表示; OCLC Firstsearch 中,用 TI: highway transport* 来表示。 在进行字段检索时,为了避免出现检索误差, 应先看一下该数据库的使用指南或说明。,禁用词表,在西文数据库中,系统对信息进行标引时,不能做标引词或检索词的语词 包括“介词、冠词、代词、连接词、某些形容词或副词”等 如a、and、for、in、she、should、the、well、only,如何提高查全率,选择上位词和相关词;如:查找关于孙中山的文献,先用孙中山查,再用孙文、国父查找。 调节检索式的网罗度,删除不必要的组面,如and(并且); 进行族性检索(分类检索或用or连接相关检索词); 截词检索;comput*代替computer,如何提高查准率?,提高专指度(用下位词或换专指性强的自由词) 用逻辑算符and 或 not连接相关检索项;如查找克林顿,但不要关于莱温斯基的信息。检索式:克林顿 not 莱温斯基 用文献外部特征限制输出结果(在中文图书中查找); 用“二次检索” 排除误检; 限制检索字段,指定邻接和优先关系。,计算机检索的特点,检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出,构造检索提问式示例: 课题:数字化图书馆的文献检索服务 检索概念分析: document retrieval(文献检索) 并列概念 document delivery (文献传递) document delivery system(文献传递系统) digital library(数字图书馆) 同义词 virtual library(虚拟图书馆) electronic library(电子图书馆) 检索提问式: (document W retrieval or document W delivery ) and (digital W librar* or electronic W librar* or virtual W librar*),例:检索计算机网络方面的文献,检索表达式为: 计算机*网络 网络*计算机 两个检索表达式是等价的。 可以检索有关计算机网络文献的文献,也可以检索有关网络计算机方面的文献,检索“美日两国铜质量散热管专利的实证研究”的文献,其检索表达式应为: (专利 or 专利文献)and(美国 or 日本) and 铜 and 散热管,管仁国教授在2010年发表的所有论文,检索表达式: AU=guan, renguo AND PY=2010,写出计算机检索策略表达式:,1. 基于计算机视觉(机器视觉)的缺陷检测 2. Pretent、pretenting、pretented 3. Fibers、fibres 4. Woman、women 5. Virus(非人类的 human) 6. environment protection 7. 晶体生长:Crystal growth,growth crystal, growth of crystal,,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号