资源预览内容
第1页 / 共79页
第2页 / 共79页
第3页 / 共79页
第4页 / 共79页
第5页 / 共79页
第6页 / 共79页
第7页 / 共79页
第8页 / 共79页
第9页 / 共79页
第10页 / 共79页
亲,该文档总共79页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
内蒙古科技大学硕士学位论文 - 1 - 摘 要摘 要 XML 正在迅速成为 Internet 上信息表示和数据交换的重要标准。由于其强大的数据表达能力,XML 完全可以在互联网和数据库之间扮演更加重要的角色。XML 是典型的半结构化数据,关系数据库管理系统由于关系模型本身的缺陷,并不适合管理 XML 数据。现在互联网上存在大量以文件形式存放的 XML 数据,这些数据包含了丰富的信息,同时对信息的更新需求也变的更加迫切。因此 XML 数据库的研究及对 XML 数据的更新成为新的研究热点。 众所周知,面向对象的方法具有很强的建模能力,本课题针对面向对象的 XML 数据,设计与实现了基于集中式和分布式两种存储模式的更新系统。论文分析研究系统实现的理论基础,包括数据模型、更新语言、存储结构、索引结构等;扩展了基于高级数据模型的 XML 查询语言 XML-RL,使其支持面向对象的更新;针对两种存储模式,即集中式存储模式和分布式存储模式,分别设计与实现了扩展的 XML-RL 更新语言的逻辑操作符和物理操作符,使得系统可以完成对多态元素,多态引用, 独占元素和独占引用的更新。并进行了功能和性能的测试,测试结果表明,扩展的 XML-RL 更新语言能有效的完成面向对象的XML 数据的更新。 通过更新系统的性能测试,以及两种存储模型下的更新性能的比较,为建立高效、准确、实用的面向对象的XML数据管理系统打下了一定的基础。 关键词:扩展关键词:扩展 XML-RL 更新语言;存储模式;索引技术;逻辑操作符;更新操作符更新语言;存储模式;索引技术;逻辑操作符;更新操作符 内蒙古科技大学硕士学位论文 - 2 - The Study and Implementation of Object-Oriented XML Database Management System Update Technology Abstract XML is emerging as the dominant standard for information exchange and data representation. Since its powerful data representation, XML can completely do more than the bridge between World-Wide-Web and database. XML is semistructured, and relational database isnt suitable for management of it for its limitation of relational data model. Now there is a large number of XML data storedas files on the World-Wide-Web, At the same time, the demand of informations demand is more and more urgent. So the study in XML database and the update for XML data are going to new hotspots. As we know object-oriented methods have strong modeling ability, we design and implement the update system basing on the muster and distributing two kinds of repository model. The theory of the system impementtation is introduced that include data model, update language, storage models, index model and so on. And expanded the XML-RL query language basing on high level data model XML query language, causes its support object-oriented update. In view of two kinds of storage models, namely muster storage model and distributing storage model, designed ang implemented two kinds of logical instruction character and physical instruction character of the extending XML-RL update language, causes the system to be allowed to complete the update of polymorphism element,polymorphism quotation, monopoly element and monopoly quotation. And has carried test on the function and the performance. Test results show that the extending XML-RL update language can effectively complete object- oriented XML data updates. Through performance of the update system was tested, as well as update performance comparison of two kinds of storage models, make a function for establishing an efficient, accurate and practical object-oriented XML data management system. Key Words: Extending XML-RL ;Storage Model;Indexing Techniques; Logical Instruction Character; Physical Instruction Character独 创 性 说 明独 创 性 说 明 本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得 内蒙古科技大学或其他教育机构的学位或证书所使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并 表示了谢意。 签名:_ 日期:_ 关于论文使用授权的说明关于论文使用授权的说明 本人完全了解内蒙古科技大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可 以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保 存论文。 (保密的论文在解密后应遵循此规定)(保密的论文在解密后应遵循此规定) 签名:_ 导师签名:_ 日期:_ 内蒙古科技大学硕士学位论文 - 1 - 1 绪论绪论 一直以来,HTML 是主要的 Web 语言,它以其简单精练的语法、极易掌握的通用性与易学性,为 WWW 技术的发展带来了一场前所未有的信息革命,使互联网得以普及发展以至今日的辉煌。但随着 Web 应用的不断深入,电子文档的容量越来越大,内容越来越复杂,而 HTML 的语法过于简单,它使用的是一套固定的标签集,用户不能改动,这使得 HTML 越来越不堪重负,XML 的出现解决了 HTML 的缺陷,并成为了21 世纪的“世界语”。XML 由于其语言自身的规范性、灵活性、可扩展性和强大的语言表达能力,被普遍应用于诸多领域,如数字图书馆、电子商务等。不久的将来,大量XML 格式的数据文档随之出现在互联网上。因此,如何高效、准确地完成对 XML 数据的查询及更新成为当前的一个研究热点。 1.1 XML介绍 1.1.1 XML 概念及特点 XML(eXtensible Markup Language) 1即可扩展的标记语言,是W3C 于1982 年正式推荐的 Web 上的数据表示和交换标准,它是 SGML(Standard Generalized Markup Language) 2和HTML(Hypertext Markup Language) 3二者派生的语言。XML 的设计目标是实现简便并且能与 SGML 和 HTML 共同操作。XML 最重要的特征是:被标记的各个数据保持其含义,因此系统间交换数据的可能性极大提高。XML 最基本的概念是:结构化标记数据1,实现了“文档结构化”的语言规范。 XML 以其良好的数据存储格式、可扩展性、高度结构化便于网络传输等优势将在许多领域一展伸手。XML 被广泛应用,主要是因为 XML 所具有的特性4,正是因为它的这些特性,有人认为它带来了“Internet 的第二次革命”。 (1) 简单性。XML 为程序员和文档作者提供了一个友好的环境。XML 的严格定义和规则集使人和计算机都能够更加容易地阅读文档。XML 文档语法包含一个非常小的规则集,使开发者能立刻开始工作。其中的基本结构可以被用来表示复杂的信息集合,而不需要改变结构本身。 (2) 可扩展性。XML 在两个意义上是可扩展的。首先,它允许开发者创建他们自己的文档描述方式(DTD5、XML-Schema6、RELAX 等),有效地创建可用于多种应用的“可扩展的”标记集;其次,有许多附加的标准对 XML 的能力进行扩展,它们可以向XML 增加样式、链接和引用能力。 内蒙古科技大学硕士学位论文 - 2 - (3) 互操作性。XML 是平台无关的,它可以在多种平台上使用,而且可以用不同的工具进行解释。由于文档的结构是相容的,所以解释他们的语法分析器就比较容易创建。XML 支持用于字符编码的许多标准,允许它在全世界不同的计算机环境中使用。 (4) 开放性。XML 标准在 Web 上是完全开放的,可以免费下载。XML 文档本身也是开放的,任何人都可以对一个 XML 文档进行语法分析和检查其有效性。XML 也可以让不同的用户创建其特有的格式,这也充分说明了它的开放性。 XML 之所以受到如此重视,并且大有替代 HTML 成为新的数据显示标准的趋势,主要是因为它和HTML 相比有如下特点7: (1) 使用有意义的标记; (2) 数据的语义与显示方式分开; (3) 可自定义标记; (4) 严格的语法控制,更加有利于计算机自动处理。 1.1.2 XML 的应用领域 XML 被广泛应用于不同的领域,主要应用领域8体现在以下 4 个方面: (1) 企业间的电子商务。企业间利用 WWW 实现商品信息的交换和接发定单,从而使通信成本降低,软件成本降低;利用 XML 进行电子目录等产品信息的交换和自动更新,可以实现目录的自动分类处理和服务,而且可以实现多国语言的目录服务。 (2) 知识管理。XML 可以对各种文档和资料进行真正实用的知识管理。使用 XML的文档结构化和文档含义化功能,可以统一进行多项目索引管理,而且新老文档可以混合使用。在知识管理中XML 必将成为今后的发展主流。 (3) 文档管理。用 XML 管理文档数据,面向多种形态媒体可输出同一数据,易于维护文档,降低
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号