资源预览内容
第1页 / 共41页
第2页 / 共41页
第3页 / 共41页
第4页 / 共41页
第5页 / 共41页
第6页 / 共41页
第7页 / 共41页
第8页 / 共41页
第9页 / 共41页
第10页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
,打开网络知识宝库钥匙,网络信息检索与利用,湖州师院图书馆,主讲人:吕秀云,第二章 网络信息检索基础知识,2.1 网络信息检索产生与发展 2.1.1 网络信息检索含义 信息检索(p19)(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据信息用户的需要查找出相关信息的过程。,网络信息检索(NIRnetworked information retrieval)是指信息用户通过利用计算机、通讯、网络等现代化技术为处理解决各种问题而查找、识别、获取网上相关的事实、数据、文献信息的活动及过程。,2.1.2 网络信息检索产生与发展 1)手检(基础) 优点: (1) 不要特殊设备,查找方法简单、灵活; (2)可以边查边思考,随时修改检索策略;查准率较高; (3)检索费用较低等 。 缺点:检索效率低 、检索途径少、查全率较低等。,2)机检 (p31) (1) 脱机检索阶段(1954-1964) 是指定期由专职检索人员把许多用户课题汇总,批量处理多用户提出的问题,并把结果提供给用户。此时输入计算机的信息(文献的题录、文摘等)几乎全部存储在磁带上,检索提问穿成纸带或卡片,检索结果不能立即获得,必须等待成批或定期检索处理。 特点:优点: 批处理可同时进行多项检索;(多项问题) 可处理检索关系相当复杂的检索词汇(多主题); 一次输入作业,提供多种输出服务能力。它可用于生产普通印刷索引、专题书目、回溯检索和定期检索。 不足:缺乏灵活性 、反馈差 、间接性等。,(2)联机检索阶段(1965-1975) 信息中心的主机借助于电话线与远距离终端相连,形成联机实时检索系统。用户可在检索终端进行人机对话或检索。 (3)光盘数据库检索阶段(1976-1990) 光盘的应用,更使得联机检索服务行业竞争加剧,呈现出多元化发展态势。 光盘检索优点: 可以免去联机检索必须支付的联机系统使用费; 有些出版商出于保密、版权及控制等方面的考虑,还不可能将收费信息产品很快上网。在这种情况下,CD-ROM就成为获取此类信息的最佳途径(有利于保护知识产权);,CD-ROM可以替代或补充馆藏,其多媒体的书籍、游戏和参考资料是用户最欢迎的类型之一。它具有信息存储密度高、容量大、读取速度快、存储的信息类型多等优点。 缺点: 不可随时改写信息、必须借助于一定的设备等。,(4) 网络化检索阶段(1990-至今) Internet技术的发展,特别是WWW技术的成功应用,使信息检索由原来的集中式网络时期进入到分布式网络发展新时期。,2.1.3 网络信息检索的特点及方式 1.网络信息检索的特点 : 1)交互性与动态性; 2)便捷性与快速性; (全文、多途径) 3)超时空性; 4)自由性; 2.网络信息检索的方式: (p32) 1)回溯检索; 2)定题检索; 3)人机对话; 4)联机订购;,3 网络信息检索未来 以人工智能为代表的信息检索自动化技术是网络信息检索工具的基本技术。包括自动标引、自动文摘、自动分类、自动推送等信息自动化技术极大地促进了检索效率的提高。多媒体检索必将成为一种通用的网络信息检索技术。,智能化是网络信息检索工具的发展方向,即由“智能代理”充当用户与检索工具的中介,包括用户的检索工具选择、策略的灵活运用、搜索并整理检索结果等。 多媒体检索必将成为一种通用的网络信息检索技术。,2.2网络信息检索原理及文献信息有序化的方法、规则 2.2.1 网络信息检索原理 ( p32) 网络信息检索包括信息的存储与检索两个过程。信息存储是指搜集相关信息,利用信息检索语言,编制的检索工具或建立检索系统的过程; 信息检索是利用该检索工具或检索系统,检索出所需相关信息的过程。(参图2-1),检索课题 (需求),网 络 信 息 源,信 息 检 索 语 言,信息检索系统,检 索 结 果,鉴别与利用检索结果,图2-1 信息存储、检索的一般模式(p33),主 题 分 析,文献存储标识,文献提问标识,信息存储是指搜集相关信息,利用信息检索语言,编制的检索工具(搜索引擎)或建立检索系统(数据库)的过程;,手工检索工具,目前多以光盘版或网络版出现在网上。 如:全国报刊索引、国外科技资料目录各分册等; 检索网上的信息检索工具搜索引擎, 如:http:/cn.yahoo.com/、天网搜索等。,2.2.2 文献信息有序化的方法、规则 p20 1)根据文献的外部特征组织文献: (1)按文献的名称组织文献信息:以书名、刊名、篇名等的字顺或音序组织排列文献。 (2)按文献创作者的名称组织文献信息:以作者、译者、编著等责任者的姓名或团体责任者名称的字顺或音序组织文献信息。 (3)按文献的特定代码组织文献信息即以代码特有的顺序号(如专利号、技术标准号、ISSN、ISBN、化学分子式等等)组织文献信息,网络信息资源的组织也不例外。,2)根据文献的内部特征组织文献: (1)按照文献内容学科分类组织文献分类组织法(p18) 中国图书馆图书分类(字母/数字) 国际十进分类法(数字) 国际专利分类法 (字母/数字/字母) (2)按照代表文献所描述的主题内容的主题词的音序、字顺等组织文献主题组织法(p18-19) 汉语主题词表以及各种主题索引,3)检索语言: 检索语言是专供信息组织和信息检索使用的一种人 工语言。其基本功能包括以下几个方面:对文献的信 息内容进行标引、对内容相同及相关的信息加以集中 或揭示其相关性、对信息进行系统化及有序化、便于 将标引和检索的标识进行匹配。网络信息检索工具中 常用的信息检索语言包括分类语言、主题语言、引文 语言、名称语言、代码语言等等。 检索语言的主要作用: 是有序化的组织文献信息;编制检索系统;链接用户与 检索系统的桥梁与纽带等。 网上最常用的信息检索语言有:分类语言(专题)、主题语言(关键词)、引文语言等。,(1)分类语言(分类组织):是以号码为基本字符,以科学分类为基础,用表示文献信息学科性质的分类号来表达文献主题概念的检索语言。 分类法是应用逻辑分类的原理,以学科分类为基础,按照文献信息内容的学科属性及专业特点,对文献信息进行系统化组织的一种方法。 (以雅狐为例: http:/cn.yahoo.com) 分类标识分类号 ,如:http:/www.lib.hutc.zj.cn/,分类法在网络信息资源的组织与检索中得到了广泛的应用。网络检索系统使用的分类法类型基本为两种: 一是文献信息工作中使用的文献分类法(如中图法;利用重庆维普咨询公司的中文科技期刊数据库:,中国图书馆图书分类法 中图法 由五大部类、二十二大类、简表、详表、复分表 几部分构成。 部类 大纲(大类) 简表 详表 A 马克思列宁主义、毛泽东思想、邓小平理论 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理,N 自然科学总论 O 数理化科学 P 天文、地球科学 Q 生物科学 R 医药卫生 S 农业科学 T 工业科学 TP3 计算机科学 U 交通运输 V 航天航空 X 环境保护科学 Z 综合性科学,R1 预防医学、卫生学 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学 R73 肿瘤学 R74 神经病学与精神病学 R75 皮肤病学与性病学 R76 耳鼻咽喉科学 R77 眼科学 R78 口腔科学 R79 外国民族医学 R8 特种医学 R9 药学,YAHOO的分类结构 类目体系参见 :http:/cn.yahoo.com,另一种是由各检索系统根据自身网站的特点自行编制的。下面以YAHOO为例介绍分类法在网络信息检索系统中的应用。(网上以此编排为多),说明:“”表示这个主题在YAHOO等级式索引中多次出现, “()”中的数字代表在该主题词下收录的文件数量.,(2)主题语言 (主题组织) 主题法,就是以自然语言中的词语或规范化的词语作为揭示文献信息主题的标识,并以此标识编排组织和查找文献信息的排检方法。,主题法又分标题词语言、叙词语言、关键词语言等。 关键词是指 出现在文献的题目、摘要乃至正文中,对表征文献主题内容具有实质意义的语词。 关键词法是指将文献中能描述其主题概念的那些具有关键性的词抽取出来,一般不进行规范化处理,按字顺排列,以提供主题检索途径的方法。 标识即为检索的入口词,如:文献信息的篇名、作者、关键词等)http:/www.lib.hutc.zj.cn/ 主题语言优点: 直观性、专指性、灵活性、实用性(适合计算机检索)等。,如:http:/e.pku.edu.cn/ 检索“研究性学习”的相关资料,(3)引文语言 引文(Citation)是指各种著作、论文中引用的参考文献。 引文语言是利用引文揭示与组织文献信息的一种人工语言,即引文语言是一些引文语词的集合。 引文索引法是一种特殊的信息组织方法,是利用文献与文献之间的相互引证关系来组织信息,即以一些文献作为标引词,来标引和检索另一些文献,用以揭示报道文献信息间的引证关系和学科间内在联系的方法。 引文索引是一种利用引文索引法组织信息的方法,是将索引条目(标引词)按照科学的方法加以编排,所形成的索引。利用文献与文献之间索引条目(标引词)的相互引证来提供引文检索途径。,引文索引主要作用: 引文索引的编排组织打破了学科专业界线,把文献之间关系、作者之间的关系以及文献与作者之间的关系有机地联系起来,从多维角度反映了文献乃至学科之间的相互交叉、渗透关系,所以尤其适用于交叉学科、边缘学科或刚刚露头的领域的文献检索;便于用户了解到某一作者的文章被他人利用的情况,反映出该作者在某学术领域中的作用与知名度。 引文索引的组成部分: 引文索引由三个来源相同的部分组成,但它们具有不同的排列方式。,1.引文索引。列出一段时间发表文献的全部被引文献,按被引文献的第一著者排列,其下按时间先后列出各被引文献的出处,包括年份、刊名、卷次、页次等,再在各条被引文献之下依次列出引证过它的全部文献。 2.来源索引。是引文索引最基本的部分,按引证著者姓名的字顺排列,报道当年和上一年在SCI所覆盖的来源期刊中发表的文章。 3.轮排主题索引。此部分是以文献篇名的关键词轮排主题索引,相当于一般关键词索引,只是在配词时予以限定,以避免过于繁琐。其控制的方法是限定一些词,只能作配词而不能作为实词进行搭配,这就相对地减少了一些词的轮排机会,保证索引体积不至臃肿,检出不至过泛,从而保证检索效率的提高。,利用“中文科技期刊引文数据库” (http:/www.tydata.com/) 科学引文索引(sci) 社会科学引文索引(ssci) 中国社会科学引文索引(cssci) 名称语言、代码语言等(略) 文献外部特征组织法:书名、作者、刊名、机构等; 文献内容特征组织法:主题(关键词)、分类、引文等。,2.2.3 网络信息检索工具(p37) 搜索引擎:是对网上的信息资源进行搜集整理、然后提供用户查询的系统,它包括:信息搜集、信息整理
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号