资源预览内容
第1页 / 共40页
第2页 / 共40页
第3页 / 共40页
第4页 / 共40页
第5页 / 共40页
第6页 / 共40页
第7页 / 共40页
第8页 / 共40页
第9页 / 共40页
第10页 / 共40页
亲,该文档总共40页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
信息组织与分类编目提纲提纲1 1、互联网的发展趋势、互联网的发展趋势2 2、网络环境下的信息组织与分类编目、网络环境下的信息组织与分类编目3 3、信息组织与分类编目的关系、信息组织与分类编目的关系4 4、信息组织的基本任务、信息组织的基本任务1)社会原因)社会原因用户信息需求(市场导向)。用户信息需求(市场导向)。2)技术原因)技术原因IT四定律(摩尔定律、贝尔定律、吉尔四定律(摩尔定律、贝尔定律、吉尔德定律和麦特卡尔夫定律德定律和麦特卡尔夫定律)。3)经济原因)经济原因信息经济(电子商务、网络经济、数字信息经济(电子商务、网络经济、数字经济)在经济)在IT四定律推动下兴起四定律推动下兴起。(2 2)互联网迅猛发展的原因互联网迅猛发展的原因2003年年6月月Google搜索的网页为搜索的网页为30亿个,而亿个,而2004年年11月,月,Google副总裁比尔副总裁比尔考兰宣布,考兰宣布,Google数据库中数据库中网页已经超过网页已经超过80 亿个;自亿个;自2003年开始:中国网页基本年开始:中国网页基本保持翻番增长,保持翻番增长, 2003年网页年网页3亿个、亿个、2008年年161亿个、亿个、2009年年336亿个,比亿个,比2008年增长了年增长了1倍多,比倍多,比2003年年增长了增长了100倍多。倍多。2010年年11月,新兴搜索引擎月,新兴搜索引擎Blekko CEO里奇里奇斯科伦塔表示,由于网页总量已经突破斯科伦塔表示,由于网页总量已经突破1万亿,万亿,“垃圾信息也呈现加速增长态势垃圾信息也呈现加速增长态势”。他还表示:。他还表示:“我们将借我们将借助大规模的人工手段清理这类内容。助大规模的人工手段清理这类内容。”从而推广从而推广“受信赖受信赖”的内容。的内容。 (3 3)网络环境下信息资源发展状况)网络环境下信息资源发展状况 1 1)信息数量庞大且增长迅速)信息数量庞大且增长迅速2 2)信息内容丰富)信息内容丰富网络信息资源内容极为丰富,覆盖面广,涵盖了各网络信息资源内容极为丰富,覆盖面广,涵盖了各学科各领域,且种类繁多,几乎无所不包。学科各领域,且种类繁多,几乎无所不包。网网络络信信息息没没有有统统一一的的管管理理机机构构和和发发布布标标准准,且且变变化化、更更迭迭、新新生生、消消亡亡等等随随时时发发生生,质质量量良良莠莠不不齐齐,重重复复严严重重(我我国国重复网页比例达到重复网页比例达到25%左右),难以控制。左右),难以控制。3 3)信息质量差异增大)信息质量差异增大网络以超文本、超媒体、集成式地提供信息,除文本信网络以超文本、超媒体、集成式地提供信息,除文本信息外,还有图表、图形、图象、声音、动画、视频等。息外,还有图表、图形、图象、声音、动画、视频等。提供了丰富的学习、娱乐功能。提供了丰富的学习、娱乐功能。4 4)信息形式多样)信息形式多样5 5)信息交流方式多样)信息交流方式多样现现代代社社会会信信息息高高度度的的分分散散无无序序性性与与人人们们利利用用信信息息的的高高度度选选择择性性形形成成了了尖尖锐锐矛矛盾盾,信信息息组组织织通通过过人人工工和和机机器器干干预预,使使信信息息有有序序增增值值,形形成成信信息息资资源源,进进而而提提供供有有效效的的利利用用(如如搜搜索索引引擎擎谷谷歌歌和和百百度度的的发发展展、新新兴兴搜搜索索引引擎擎Blekko对对谷谷歌歌的的挑挑战战,又又如如雅雅虎虎用用分分类类目目录录展展开开网网络络信信息息、图图书书馆馆为为馆馆藏藏图图书书编编制制机机读读目目录录供供用用户户查查询询、再再如如中中国国期期刊刊网网中的作者、关键词各种索引等)。中的作者、关键词各种索引等)。从从这这一一角角度度看看,信信息息组组织织可可以以说说是是信信息息管管理理的的基基本本环环节节,是是信信息息资资源源开开发发利利用用的的基基础础,同同时时也也是是信信息息管管理理学学科科研研究究的核心内容。的核心内容。2 2、网络环境下的信息组织与分类编目、网络环境下的信息组织与分类编目(1 1)网络环境下信息组织的必要性)网络环境下信息组织的必要性随着互联网的普及和升级(随着互联网的普及和升级(Web1.0-Web2.0),数字文),数字文本复制的便利和自由发表的可能性,使得信息数量急剧增本复制的便利和自由发表的可能性,使得信息数量急剧增加。但社会信息量的增长并不意味着用户获取信息的增长,加。但社会信息量的增长并不意味着用户获取信息的增长,恰恰相反,无序的信息不仅无助于信息的使用,反而会加恰恰相反,无序的信息不仅无助于信息的使用,反而会加剧信息增长与使用的矛盾。人们生动地称这种情况是剧信息增长与使用的矛盾。人们生动地称这种情况是“信信息超载,知识缺乏息超载,知识缺乏”。越来越多的人认识到,。越来越多的人认识到,“原始信息本原始信息本身并不能产生价值身并不能产生价值”,只有将其有效的组织,按特定的需,只有将其有效的组织,按特定的需要集中和揭示,才能产生价值。要有效开发利用信息资源,要集中和揭示,才能产生价值。要有效开发利用信息资源,必须采用相应的方法加以控制和处理,信息组织是关键措必须采用相应的方法加以控制和处理,信息组织是关键措施之一。施之一。(1 1)网络环境下信息组织的必要性(续)网络环境下信息组织的必要性(续)(2 2)信息组织的概念与目的)信息组织的概念与目的n1)概念:信息组织亦称为信息资源组织,)概念:信息组织亦称为信息资源组织,它是根据信息检索的需要,以文本及各种类它是根据信息检索的需要,以文本及各种类型的信息源为对象,通过对其内容、特征等型的信息源为对象,通过对其内容、特征等的分析,选择,标引,处理(方法),使其的分析,选择,标引,处理(方法),使其成为有序化集合的活动。成为有序化集合的活动。n2)目的:建立信息资源收藏系统和检索工)目的:建立信息资源收藏系统和检索工具,方便人们对信息资源的开发利用。具,方便人们对信息资源的开发利用。(3 3)信息载体(媒体)对信息组织的意义)信息载体(媒体)对信息组织的意义n信息交流的方式(媒体)有口头方式,印刷方式,数信息交流的方式(媒体)有口头方式,印刷方式,数字方式;以记录方式(硬载体依托,包括印刷型的纸字方式;以记录方式(硬载体依托,包括印刷型的纸张和数字型的硬盘、光盘)进行交流,有助于克服口张和数字型的硬盘、光盘)进行交流,有助于克服口语交流局限,便于进行信息的组织。语交流局限,便于进行信息的组织。 (4 4)信息源与文献的关系)信息源与文献的关系n信息源或信息体通常信息源或信息体通常指一切记录形式存在指一切记录形式存在的信息载体,只是更的信息载体,只是更侧重于新型媒体形式侧重于新型媒体形式的强调。因此广义上,的强调。因此广义上,文献与信息源、信息文献与信息源、信息体是同义词或近义词。体是同义词或近义词。(5 5)信息组织的过程)信息组织的过程n信息组织过程包括标引和描述。控制语言及规则称为信息组织的信息组织过程包括标引和描述。控制语言及规则称为信息组织的规范。这些规范既包括对信息源外部描述的规范(如文献编目规规范。这些规范既包括对信息源外部描述的规范(如文献编目规则及各种元数据如则及各种元数据如MARC);也包括对内容描述的检索语言(如);也包括对内容描述的检索语言(如各种文献分类表及其规则,各种规范的主题词表及其规则等)。各种文献分类表及其规则,各种规范的主题词表及其规则等)。 信息组织的各种形式信息组织的各种形式图书馆目录图书馆目录信息组织的各种形式信息组织的各种形式搜索引擎搜索引擎1)任务:)任务:对原始信息源的记录,如图书的记录、网页的快照进行对原始信息源的记录,如图书的记录、网页的快照进行排列。排列。直接组织原始信息本身,如对图书按一定方式排列,有题名直接组织原始信息本身,如对图书按一定方式排列,有题名排列法,分类排列法,固定排列法(如按时间顺序)等;排列法,分类排列法,固定排列法(如按时间顺序)等;2)类型:)类型: 按检索工具的对象和特点划分类型按检索工具的对象和特点划分类型A文献目录;文献目录;B搜索引擎;搜索引擎; C索引数据库等。索引数据库等。 按检索工具的标识特征划分类型按检索工具的标识特征划分类型A外部特征的信息组织(如依据著者名,题名,机构名等);外部特征的信息组织(如依据著者名,题名,机构名等); B内部特征的信息组织(如依据分类号,主题词);内部特征的信息组织(如依据分类号,主题词);C引证关系的信息组织(依据引用关系,如引证关系的信息组织(依据引用关系,如SCI对期刊论文的相互引用对期刊论文的相互引用关系进行信息组织)。关系进行信息组织)。(6 6)信息组织的任务和类型)信息组织的任务和类型对原始信息进对原始信息进行描述:对外部行描述:对外部特征和内部特征特征和内部特征的记录;的记录;提供检索点:提供检索点:如外部特征的责如外部特征的责任者名,题名,任者名,题名,机构名等;如内机构名等;如内部特征的分类号,部特征的分类号,主题词;主题词;对原始信息内对原始信息内容的浓缩:包括容的浓缩:包括编写内容提要或编写内容提要或文摘。文摘。(7 7)信息组织的处理方式)信息组织的处理方式(1)信息组织与分类编目之间是总体与部分,扩展)信息组织与分类编目之间是总体与部分,扩展与基础的关系;信息组织既包括以印刷文献为主与基础的关系;信息组织既包括以印刷文献为主体的文献编目、分类标引和主题标引,也包括以体的文献编目、分类标引和主题标引,也包括以网络信息为主体的网站、搜索引擎、数据库和数网络信息为主体的网站、搜索引擎、数据库和数字图书馆等信息组织方法。字图书馆等信息组织方法。(2)网络环境下分类编目仍是信息组织的重要方法;)网络环境下分类编目仍是信息组织的重要方法;网络资源指南如雅虎就借鉴了文献分类法的原理,网络资源指南如雅虎就借鉴了文献分类法的原理,而国外图书馆联机公共检索目录而国外图书馆联机公共检索目录(OPAC=Online Public Access Catalog)已)已经用于网络信息资源的检索。传统的分类编目和经用于网络信息资源的检索。传统的分类编目和网络信息组织正在相互渗透。网络信息组织正在相互渗透。3 3、信息组织与分类编目的关系、信息组织与分类编目的关系 所所谓谓信信息息标标引引,亦亦称称文文献献标标引引,是是指指主主要要分分析析信信息息的的内内容容属属性性,并并用用某某种种检检索索语语言言(如如分分类类号号G203代代表表信信息息资资源源及及管管理理,G202代代表表信信息息处处理理技技术术;用用规规范范的的主主题题词词,如如激激光光器器代代替替莱莱塞塞,用用番番茄茄代代替替西西红红柿柿)表表达达分分析析出出的的属属性性或或特特征征,从从而而赋赋予予信信息息或或文文献献检检索索标标识识的的过过程程。这这种种方方式式的的信信息息组组织织主主要要采采用用两两类类基基本本方法方法分类法和主题法。分类法和主题法。4 4、信息组织的基本任务、信息组织的基本任务(1 1)信息标引)信息标引标引过程一般包括两个环节:一是主题分析,在了解和确定信息标引过程一般包括两个环节:一是主题分析,在了解和确定信息的内容属性之后,将这些属性概括为主题并用自然语言表述,的内容属性之后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或主题概念因素之间的结构关系;二是同时分析主题概念之间或主题概念因素之间的结构关系;二是转换标识,即用专门的检索语言中的标识或语词表达概括信息转换标识,即用专门的检索语言中的标识或语词表达概括信息(文献)内容的主题概念或概念因素,构成一定形式的检索标(文献)内容的主题概念或概念因素,构成一定形式的检索标识。如对西红柿病虫害防治一书的主题标引为:识。如对西红柿病虫害防治一书的主题标引为: 番茄番茄病虫害病虫害防治方法防治方法首先进行主题分析,本书主要谈的是西红柿病虫害及其防治方法,首先进行主题分析,本书主要谈的是西红柿病虫害及其防治方法,如用汉语主题词表进行主题标引,对内容分析后可直接从如用汉语主题词表进行主题标引,对内容分析后可直接从西红柿第一字西红柿第一字“西西”的汉语拼音的汉语拼音xi去查西红柿,结果发现西红柿去查西红柿,结果发现西红柿不是正式主题词,因此只能用它的学名不是正式主题词,因此只能用它的学名“番茄番茄”这个词去标引,这个词去标引,按其标引规则其标引结果如上。按其标引规则其标引结果如上。(2 2)信息标引过程)信息标引过程 如如果果用用中中国国图图书书馆馆分分类类法法来来进进行行分分类类标标引引的的话话,则则在在主主题题分分析析之之后后,将将其其标标引引为为S436.412(番番茄茄病病虫虫害害及及其其防防治治)。分分析析过过程程如如下下:西西红红柿柿是是一一种种农农作作物物,因因此此在在分分类类表表中中先先找找到到S农农业业科科学学(一一级级类类目目),第第二二步步考考虑虑S农农业业科科学学下下面面有有S1农农业业基基础础科科学学、S2农农业业工工程程、S3农农学学、S4植植物物保保护护等等二二级级类类目目,依依其其内内容容应应归归入入S4植植物物保保护护,然然后后在在其其下下位位类类中中发发现现S436园园艺艺作作物物病病虫虫害害及及防防治治,进进一一步步找找到到S436.412(番茄病虫害及其防治)。(番茄病虫害及其防治)。 (2 2)信息标引过程)信息标引过程 主主题题法法则则是是通通过过主主题题名名称称来来揭揭示示信信息息或或文文献献内内容容并并加加以以组组织织的的方方法法;分分类类法法是是通通过过学学科科知知识识的的分分类类体体系系来来揭揭示示信信息息或或文文献内容并加以组织的方法。献内容并加以组织的方法。 两两者者相相同同之之处处:两两者者都都是是为为揭揭示示信信息息(文文献献)内内容容,都都需需要要对对信信息息文文献献进进行行主主题题分分析析;一一般般都都使使用用预预先先编编制制的的专专门门语语言言工工具具(主主题题词词表表或或分分类类表表);赋赋予予的的检检索索标标识识都都是是对对信信息息文文献献主题概念的表达。主题概念的表达。 两者之间的差异:两者之间的差异: 1)表达主题概念的标识形式及特点不同;表达主题概念的标识形式及特点不同; 2)标识揭示、组织信息,文献的角度不同;标识揭示、组织信息,文献的角度不同; 3)分类法和主题法的功能、作用是互相补充的。分类法和主题法的功能、作用是互相补充的。(3 3)分类法和主题法的比较)分类法和主题法的比较 信信息息描描述述是是对对原原始始文文献献外外部部特特征征进进行行记记录录,从从而而提提供供责责任者、题名等检索途径。如下图:任者、题名等检索途径。如下图:(4 4)信息描述)信息描述 信信息息描描述述以以其其记记录录的的结结果果元元数数据据为为中中介介,对对原原始始信信息息进行各种操作,信息描述(元数据)的作用是:进行各种操作,信息描述(元数据)的作用是: 识识别别:确确认认并并对对要要进进行行组组织织的的信信息息进进行行个个别别描描述述,使使用户能识别被组织的信息对象;用户能识别被组织的信息对象; 定定位位:提提供供信信息息资资源源位位置置的的信信息息,以以使使用用户户访访问问并并使使用;用; 检检索索:通通过过在在描描述述数数据据中中提提供供检检索索点点,便便于于用用户户对对资资源的检索和利用;源的检索和利用; 选选择择:通通过过记记录录信信息息资资源源的的特特征征,供供用用户户对对信信息息资资源源的使用价值进行判断,决定是否使用该资源。的使用价值进行判断,决定是否使用该资源。 (5 5)信息描述的作用)信息描述的作用 元元数数据据是是关关于于数数据据的的数数据据,或或关关于于数数据据的的结结构构化化数数据据。元元数数据据的的含含义义是是逐逐步步发发展展的的,早早期期的的元元数数据据主主要要指指网网络络信信息息的的描描述述数数据据,用用于于网网络络信信息息资资源源的的组组织织(如如用用HTML描描述述网网页页的的数数据据);其其后后,逐逐步步扩扩大大到到各各种种以以电电子子形形式式存存在在的的信信息息的的描描述述数数据据(如如MARC和和DC)。由由于于传传统统的的书书目目数数据据与与数数字字信信息息的的描描述述数数据据本本质质上上并并无无不不同同。因因此此,目目前前元元数数据据这这一一术术语语实实际际上上适适用用于于各各种种类类型型的的信信息息源源的的描描述述记记录录,即即,网网络络快快照照是是元元数数据据;电电子子文文本本的的描描述述数数据据是是元元数数据据;编编目目数数据据也也是是元元数数据据(如如手手工工编编制制的的目目录录款款目目记记录录和和机机读读目目录录记记录录MARC)。)。(6 6)元数据()元数据(MetadataMetadata) 元元数数据据是是信信息息描描述述的的工工具具,可可用用来来描描述述信信息息组组织织的的对对象象,包包括括不不同同的的信信息息类类型型,可可以以是是图图书书、期期刊刊、磁磁带带、录录像像带带、光光盘盘、缩缩微微品品,也也可可以以是是其其中中的的论论文文、科科技技报报告告以以及及各各种种形形式式的的网网络络信信息息等等;描描述述的的成成分分,通通常常是是从从信信息息源源中中抽抽取取出出来来的的某某些些外外部部或或内内容容特特征征,如如题题名名、版版本本、出出版版数数据据、相相关关说说明明等等。实实际际上上,元元数数据据的的含含义义与与传传统统文文献献领领域域中中的的著著录录款款目目性性质质相相同同,是是一一种种数数字字环环境境中中使使用用的的著著录录数数据据。因因此此,我我们们将将元元数数据据与与描描述述记记录录、文文献献记记录录作作为为同同义义词词使使用用。一一个个元元数数据据款款目目构构成成一一个个信信息息源源的的基基本本描描述述记记录录,是是检检索索系系统统的的基基本本构构成成单单元元,它它可可以以代代表表信信息息源源本本身身(文文献献本本身身)用用来来组组织织目目录录、索引、数据库、搜索引擎等检索系统。索引、数据库、搜索引擎等检索系统。(7 7)元数据的类型)元数据的类型主要参考文献n中国互联网络信息中心http:/www.cnnic.net.cn/n马张华.信息组织(2版).北京:清华大学出版社,2003n俞立君,陈树年.文献分类学.武汉:武汉大学出版社,2001n王松林.信息资源编目(修订本).北京:北京图书馆出版社,2005结束语结束语谢谢大家聆听!谢谢大家聆听!40
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号