资源预览内容
第1页 / 共29页
第2页 / 共29页
第3页 / 共29页
第4页 / 共29页
第5页 / 共29页
第6页 / 共29页
第7页 / 共29页
第8页 / 共29页
第9页 / 共29页
第10页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
集中式系统与分布式系统集中式DBS:是指数据库中的数据集中存储 在一台计算机上,数据的处理集中在一台计 算机上完成。分布式DBS的定义:是指数据存放在计算机网络的不同场地的计 算炒中,每一场地都有自治处理能力并完成 局部应用;而每一场地也参与(至少一种)全 局应用程序的执行,全局应用程序可通过网 络通信访问系统中的多个场地的数据。分布式数据库系统包括两个重要组成部分: 分布式数据库和分布式数据库管理系统。分布式DB:是指计算机网络环境中各场 地上数据库的逻辑集合。分布式DBMS:是指分布式数据库系统 中的一组软件,它负责管理分布环境下逻辑 集成数据的存取、一致性、有效性和完备性。 同时由于数据的分布性,在管理机制还必须 具有计算机网络通信协议上的分布管理特性。分布式数据库系统的透明性分布式数据库系统具有位置透明性和复制 透明性,使用户看到的系统如同一个集中 式系统。位置透明性:用户和应用程序不必知道它 所使用的数据在什么场地。复制透明性:用户不必关心数据库在网络 中各个结点的数据库复制情况,更新操作 引起的波及由系统去处理。分布式数据库系统的优缺点分布式数据库系统的优点:(1) 具有灵活的体系结构(2) 适应分布式的管理和控制机构(3) 经济性能优越(4) 系统的可靠性高、可用性好(5) 局部应用的响应速度快可扩展性好,易于集成现有系统。分布式数据库系统的缺点:(1) 系统开销大,主要花在通信部分 复杂的存取结构,原来在集中式系统 中有效存取数据的技术,在分成式系统中 都不再适用(3)数据的安全生和保密性较难处理。分布式数据库系统的分类分布式数据库系统分为三类:同构同质型DDBS,同构异质型DDBS,异构DDBSo(1) 同构同质型DDBS:是指各个场地 都采用同一类型的数据模型,并且是同一型 号数据库管理系统。(2) 同构异质型DDBS:是指各个场地 都采用同一类型的数据模型,但是数据库管 理系统是不同型号的。(3) 异构型DDBS:是指各个场地的数 据模型是不同的类型。集中式系统与分布式数据存储分布式系统分布式数据存储可以从数据分配和数据分片两个角 度考察。数据分配是指数据在计算机网络各场地上的分配策 略。包括:(1) 集中式:所有数据均安排在同一个场地上。(2) 分割式:所有数据只有一份,分别被安置在 若干个场地。(3) 全复制式:数据在每个场地重复存储。(4) 混合式:数据库分成若干可相交的子集,每 一子集安置在一个或多个场地上,但是每一场地未 必保存全部数据。对于上述分配策略,有四个评估因素:(1) 存储代价;(2) 可靠性;(3) 检索代价;(4) 更新代价。存储代价和可靠性是一对矛盾的因素;检索 代价和更新代价也是一对矛盾的因素。数据分片是指数据存放单位不是全部关系, 而是关系的一个片段。也就是关系的i部分。 包括:(1) 水平分片:按一定的条件把全局关系的 所有元组划分成若干不相交的子集,每个子 集为关系的一个片段。(2) 垂直分片:把一个全局关系的属性集分 成若干子集,并在这些子集上做投影运算, 每个投影为垂直分片。(3) 混合型分片:将水平分片与垂直分片方 式综合使用则为混合型分片。数据分片应遵循的准则为:(1) 完备性条件:必须把全局关系的所有数 据映射到各个片段中,绝不允许发生属于全 局关系的某个数据不属于任何一个片段。(2) 重构条件:划分所采用的方法必须确保 能够由各个片段重建全局关系。不相交条件:要求一个全局关系被划分 后得到的各个数据片段互相不重叠。分布式数据库系统的体系结构分布式DBS的体系结构分为四级:全局外模 式、全局概念模式、分片模式和分配模式。(1) 全局外模式:它们是全局应用的用户视 图,是全局概念模式的子集。全局概念模式:全局概念模式定义了分 布式数据库中所有数据的逻辑结构。(2) 分片模式:分片模式定义片段以及定义 全局关系与片段之间的映象。这种映象是 一对多的,即每个片段来自一个全局关系, 而一个全局关索可分成多个片段。分配模式:片段是全局关系的逻辑部分, 一个片段在物理上可以分配到网络的不同 场地上。分配模式根据数据分配策略的选 择定义片段的存放场地。分布式DBS的分层体系结构有三个特征:(1) 数据分片和数据分配概念的分离,形成了 “数据分布独立性”概念。(2) 数据冗余的显式控制。局部DBMS的独立性。分布透明性分布透明性指用户不必关心数据的逻辑分片, 不必关心数据物理位置分配的细节,也不必关 系各个场地上数据库数据模型。分布透明性可归 入物理独立性的范围。包括三个层次:分片透明性、位置透明性和 局部数据模型透明性。分布式数据库管理系统的功能及组成 主要功能有:(1) 接受用户请求,并判定把它送到哪里,或 必须访问哪些计算机才能满足该请求。(2) 访问网络数据字典,或者至少了解如何请 求和使用其中的信息。(3) 如果目标数据存储于系统的多个计算机上, 就必须进行分布式处理。(4) 通信接口功能,在用户、局部DBMS和其 他计算机的DBMS之间进行协调。(5) 在一个异构型分布式处理环境中,还需提 供数据和进程移植的支持。这里的异构型是 指各个场地的硬件、软件之间存在一定差别。 DDBMS组成应包括以下四个子系统:(1) 查询子系统(2) 完整性子系统(3) 调度子系统可靠性子系统分布式数据库系统中存在的问题在集中式系统中,主要目标是减少对磁盘的访问 次数。对于分布式系统,压倒一切的性能目标是使通过 网络传送信息的次数和数据量最小;查询处理的传输代价分布式系统中,影响查询的主要因素是数据 在网络中的传输时间,数据传输量是衡量查询时 间的一个主要指标。查询处理应使“网络中数据传输量最小”。 为了达到性能目标,在分布式系统中,通常采用 基于半联接的查询优化策略。面向对象数据模型的基本概念(1) 对象:客观世界中的实体经过抽象称为 问题空间中的对象,它是对一组信息及其操 作的描述。对象由三部分组成:一组变量;一组消 息;一组方法(2) 类:是具有相同的变量名和类型、相同 的消息和使用相同的方法的对象的集合。类中的每个对象称为类的实例(3) 继承性:允许不同类的对象共享他们 公共部分的结构和特性。单重继承性:一个子类继承某一个超类 的结构和特性,称为单重继承性。多重继承性:一个子类继承多个超类的 结构和特性,称为多重继承性。对象标识:与对象的物理存储位置无 关,也与数据的描述方式和值无关的一个标 识。在对象创建的瞬间,由系统赋给每个对象一 个“标识”,即系统内的一个唯一的指针, 在对象生存期内,这个标识不可改变。在面向对象语言中,对象标识是一个指 针一级的概念(5)对象包含:不同类的对象之间存在的 包含关系称为对象包含,包含其他对象的对 象称为复合对象。Notice:继承是“is a”联系,包含是is part of”联系。比如卡车是车的子类(继承),车 包含轮胎(包含)持久化程序设计语言OOPL:面向对象语言对现有的OOPL进行扩充,使之能处理数据 库,这样的OOPL称为持久性程序设计语言。 持久化语言与嵌入式SQL语言的不同:(1)格式转换对程序员透明;(2)程序员可直接操纵持久数据。.止匕扌既持久诂据:量指创建这些数据的程序运行终 止后数据依然存在于系统之中。持久指针:持久化指针不像内存中的指针, 它在程序执行后及数据重组后仍保持有效。在概念上,持久指针可以看作是数据库中指 向对象的指针。查找数据库对象的三种方法:(1) 根据对象名找对象;(2) 根据对象标识找对象;(3) 将对象按聚集形式存放,然后利用程序 循环找所需对象。持久化C+系统C+中可以说明一个称为Persistent_Object(持久对象)的类及其属性 和方法来文持持久性,而其他的类作为该 类的子类继承其持久性。ODMG (Object DataBase ManagementGroup)对C+的扩充有两个方面:C+对象定义语言(ODL)C+对象操纵语言(OML)
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号