资源预览内容
第1页 / 共30页
第2页 / 共30页
第3页 / 共30页
第4页 / 共30页
第5页 / 共30页
第6页 / 共30页
第7页 / 共30页
第8页 / 共30页
第9页 / 共30页
第10页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
图书馆学专业优秀论文图书馆学专业优秀论文 汉语框架语义知识库信息组织与表示方法汉语框架语义知识库信息组织与表示方法研究研究关键词:现代汉语关键词:现代汉语 框架语义知识库框架语义知识库 XMLXML 语言语言 RDFRDF OWLOWL 语言语言 WebWeb 信息检索信息检索摘要:本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为 处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可 读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及 智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个 以 Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语 义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种 资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体 (Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的 海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概 念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表 达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表 示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不 同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领 域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来 构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述, 成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记 上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充 分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义 一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性, 便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用 RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些 繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判 定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部 分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论 基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标 词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉 语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词 典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识 库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言 XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识 表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以 证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记 语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得 出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组 织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展, 使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息 检索的查全率和查准率。正文内容正文内容本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处 理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、 可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能 化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以 Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义 词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资 源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体 (Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的 海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概 念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表 达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表 示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不 同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领 域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来 构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述, 成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记 上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充 分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义 一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性, 便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用 RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些 繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判 定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部 分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论 基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标 词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉 语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词 典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识 库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言 XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识 表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以 证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记 语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得 出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组 织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展, 使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息 检索的查全率和查准率。 本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对 象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可 理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、 个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义 词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资 源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体 (Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的 海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概 念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表 达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表 示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不 同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领 域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来 构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述, 成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记 上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充 分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义 一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性, 便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用 RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些 繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判 定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部 分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论 基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标 词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉 语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词 典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识 库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言 XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识 表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以 证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记 语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得 出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组 织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展, 使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息 检索的查全率和查准率。 本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对 象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可 理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、 个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以 Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义 词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资 源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体 (Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的 海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概 念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表 示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不 同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领 域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来 构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述, 成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记 上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充 分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号