资源预览内容
第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
亲,该文档总共3页全部预览完了,如果喜欢就下载吧!
资源描述
1,信息组织的理论基础(系统论、耗散结构论、协同论)。系统论:在信息组织中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联性, 那么信息系统的整体功能将大于各个信息单元的功能之和。也是就是说, 这将能发挥信息资源的价值与作用。基于这一原理,信息组织的目标是建立信息系统。耗散结构理论: 所要建立的信息系统应该是一个开放的系统。现实存在的包括信息组织和信息检索在内的信息系统正是这样一个开放系统,它与外界进行着信息的交换,既采集信息也输出信息。协同论: 一个信息系统是由多个子系统构成的,建立各子系统之间的协同作用机制是非常重要的, 这正是来自协同论的指导思想:无论什么系统从无序向有序的演化,都是大量子系统之间相互作用而又协同一致的结果。2,自动标引技术可以分为自动主题标引技术和自动分类标引技术两大类,是信息组织自动化的基础。鉴于汉语的特性,自动分词更是中文信息计算机自动化处理的基础和前提。3,自动分类标引是指由计算机代替人工对文献信息进行分类,赋予其分类标识,以描述文献主题内容的活动。按自动分类的实现途径进行划分,可将自动分类分为自动聚类和自动归类。4,自动归类是指先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号。自动归类根据使用的技术通常分为基于词的自动归类(词典法)和基于专家系统的自动分类(知识法)两大类。5,自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。6,自动主题标引是指由计算机自动确定语词标识来表达信息资源主题的过程,包括自动抽词标引和自动赋词标引两种基本形式。7,自动抽词标引是指直接从原文中抽取词或短语作为标引词来描述信息资源的主题内容。 它主要是从文献的正文、文摘或标题中直接选取标引词,利用该词再文献中出现的频率作为抽词程序的基础。8,自动赋词标引是指由计算机从受控词表中自动选取词语来表达文献主题内容。分为基于关联词表的自动赋词标引和基于中介词典的自动赋词标引。9,信息资源描述是指根据信息组织和检索的需要,对信息资源的内容特征和形式特征进行分析、 选择和记录的活动。在传统文献组织检索系统的编制中,信息资源描述又被称为文献著录或书目著录。信息描述的结果,是描述记录或称为款目,亦即元数据。它是一种文献的缩影,可以用来作为信息资源的代替物组织检索系统。10,信息资源的标引,也称文献标引,是指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而富于文献检索标识的过程。11,标引语言是表达文献主题概念和文献需求主题概念的简明性、单义性和关联性概念标识系统,是根据标引和检索的需要而编制的人工语言。标识的简明性,即标识的形式简洁、含义明确;标识的单义性,即标识与概念的唯一对应,排除了同义现象和多义现象;标识的关联性,即标识之间建立了联系,以反映概念之间的关系。12,标引语言的类型:依据构成原理可将标引语言分为分类语言、主题语言、代码语言;依标识组合时间的先后,可将标引语言分为先组式语言、后组式语言和散组式语言。13,中图法的基本序列,也称基本部类或部类,是分类法编制中为建立知识分类体系,对知 识门类所进行的最概括、最本质的划分与排列,是确立基本大类的基础。基本序列是:马克思主义、列宁主义、毛泽东思想、邓小平理论哲学、宗教社会科学总论自然科学总论综合性图书14,基本大类,也称分类大纲,是分类法中划分的第一级类目,是在基本序列基础上展开的知识分类体系框架。基本大类都是传统的、稳定的、较为概括的学科或知识领域。分为22个大类。A 马克思主义、列宁主义、毛泽东思想B 哲学、宗教C 社会科学总论D 政治、法律E 军事F 经济G 文化、科学、教育、体育H 语言、文字I 文学J 艺术K 历史、地理N 自然科学总论O 数理科学和化学P 天文学、地理科学Q 生物科学R 医学、卫生S 农业科学T 工业技术U 交通运输V 航空、航天X 环境科学、劳动保护科学(安全科学)Z 综合性图书15,体系分类法的宏观结构,即它的各个组成部分及其之间的组织方法、相互联系和作用的方式。 它由分类表。 编制说明和索引组成。分类表: 也称类目表, 它是根据类目之间的关系,按照一定的组织原则组织起来的类目一览表。分类表示分类法的主体,因此人们有时将分类表等同于分类法。编制和使用说明:一般是对分类表的编制目的和适用范围、编制原则、体系结构、辅助表、标记符号、注释等予以介绍和解释,以使人们对分类表有一个基本的、全面了解。 索引: 又称类目索引, 它是一种按类名即类目相关概念名称子顺查找相应类号的类表辅助工具。16,分类法的为微观结构,即类目的构成要素及其组织。类目(包括复分表的子目):是构成分类法的最基本要素,每个类目代表具有某种共同属性的文献集合。一个类目表是由类号、类名、类级、注释和参照组成的。类号:是类目的代号,也叫标记符号,决定类目在分类体系中的位置。 文献经过分类标引之后,作为组织分类文献排架标识、组织分类检索工具的检索标识。 类名: 是类目的名称, 用描述文献信息内容的术语直接或间接表达类目的含义和内容范围。类级:是类目的级别,在印刷排版中用排版的缩格和字体表示,代表该类目在分类体系中的等级(划分的层次)、显示类目间的等级关系。注释和参照:对类目的含义及内容范围、分类方法、与其他类目的关系等进行说明。17,信息描述项目:用以揭示文献信息内容和形式特征的记录事项,也称为著录事项,是组成书目描述的基本单元。每个描述项目又由若干个元素组成。ISBD 规定了九个著录项目:题名与责任项、版本项、文献特殊细节项、出版发行项、载体形态项、丛编项、附注项、文献标准编号及有关记载项、提要项。“.”各大项前置符(每段起首除外)“=” 并列题名、并列责任者、并列版本说明等“.” 用于标识多卷集文献的分辑标识,不同责任者的集合题名等“+ ”用于载体形态项的附件说明等。18,关键词索引的类型:一类是带上下文的关键词索引,包括题内关键词索引、题外关键词索引、双重关键词索引;另一类是不带关键词的索引,包括单纯关键词索引、词对式关键词索引、简单关键词索引。19,一个HTML文档通常由文档头、文档名称、表格、段落和列表等组成。称为文档元素简称元素。 它们是文本文档的基本构件,并且使用超文本标记语言规定的标签来标识这些元素。20,在 HTML 的表格设计中,注意掌握下列要点: TABLE , TABLE 必须要包含整个表的定义; 在表格中的第一项是表的名称(captain)它是可有可无的; TR, /TR标签定义的行的数目没有限制;在一行中 ,使用 , 或者 , 标签定义的数据单元数目也没有限制;表的每一个单元的属性可单独设置,因此表格的形式可以多种多样;数据单元中的内容可以是文字、数字, 也可以是图标或者是两者兼有,而且还可以设置超级链接。21, XML 的三个特征:可扩展性,结构化,有效性。xml 的特点:灵活性与简洁性,开放性与可扩展,使用性,高效性。22,元数据是关于数据的数据,同时也是结构化的数据。它对信息资源进行描述和解释,促进信息资源的检索、管理和利用。 元数据可以为各种形态的信息资源提供规范的描述方案和检索工具,为分布的、由多种信息资源组成的信息系统提供整合的工具和纽带。23,元数据的功能:支持资源发现,组织数字信息资源,支持资源的互操作,支持数字识别和支持存档和保存。24,都伯林核心元素的定义:资源名:赋予资源的名称,创建者:资源内容的主要责任者,日期: 与资源本身生命周期中的一个事件相关的日期,资源标识符: 在给定的文本环境中对资源的参照引用,类型:有关资源内容的特征和类型,形式,资源的物理或数字化的表现形式。覆盖范围:资源内容所涉及的外延与覆盖的范围。25,每条 MARC 记录分为四个区:头标区、目次区、数据区和记录结束符。26,按照信息组织的级次分:参考数据库、源数据库按照信息内容分:文献、事实、数值、多媒体按照信息结构化程度分:隐含的模式信息、不规则的结构27,数据集成子系统的功能是从各种数据源处收集数据并且给上层应用提供一个单一的、一致的关系数据库接口。由包裹器、映射器、抽象器基本组成模块。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号