资源预览内容
第1页 / 共74页
第2页 / 共74页
第3页 / 共74页
第4页 / 共74页
第5页 / 共74页
第6页 / 共74页
第7页 / 共74页
第8页 / 共74页
第9页 / 共74页
第10页 / 共74页
亲,该文档总共74页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数据库系统概论 An Introduction to Database System 第六章 数据库设计(续-3) 第六章 数据库设计 6.1 数据库设计概述 6.2 需求分析 6.3 概念结构设计 6.4 逻辑结构设计 6.5 数据库的物理设计 6.6 数据库实施 6.7 数据库运行与维护 6.8 小结 6.5 数据库的物理设计 n什么是数据库的物理设计 n数据库在物理设备上的存储结构与存取方法 称为数据库的物理结构,它依赖于给定的计 算机系统。 n为一个给定的逻辑数据模型选取一个最适合 应用环境的物理结构的过程,就是数据库的 物理设计。 6.5 数据库的物理设计 n数据库物理设计的步骤 n确定数据库的物理结构 n对物理结构进行评价,评价的重点是时间和 空间效率 n如果评价结果满足原设计要求则可进入到物 理实施阶段,否则,就需要重新设计或修改 物理结构,有时甚至要返回逻辑设计阶段修 改数据模型。 数据库物理设计 确定数 据库的 物理结 构 评价数据 库的物理 结构 逻辑结 构设计 数据库 实施 物理 模型 逻辑 模型 6.5 数据库的物理设计 6.5.1 数据库的物理设计的内容和方法 6.5.2 关系模式存取方法选择 6.5.3 确定数据库的存储结构 6.5.4 评价物理结构 6.5 数据库的物理设计 6.5.1 数据库的物理设计的内容和方法 6.5.2 关系模式存取方法选择 6.5.3 确定数据库的存储结构 6.5.4 评价物理结构 6.5.1 数据库的物理设计的内容和方法 n设计物理数据库结构的准备工作 n 1. 充分了解应用环境,详细分析要运行的 事务,以获得选择物理数据库设计所需参数 n 2. 充分了解所用RDBMS的内部特征,特别 是系统提供的存取方法和存储结构 数据库的物理设计的内容和方法(续) n选择物理数据库设计所需参数 n 数据库查询事务 n查询的关系 n 查询条件所涉及的属性 n 连接条件所涉及的属性 n 查询的投影属性 数据库的物理设计的内容和方法(续) n选择物理数据库设计所需参数(续) n数据更新事务 n被更新的关系 n每个关系上的更新操作条件所涉及的属性 n 修改操作要改变的属性值 n 每个事务在各关系上运行的频率和性能要 求 数据库的物理设计的内容和方法(续) n关系数据库物理设计的内容 n1. 为关系模式选择存取方法(建立存取路径) n2. 设计关系、索引等数据库文件的物理存 储结构 6.5 数据库的物理设计 6.5.1 数据库的物理设计的内容和方法 6.5.2 关系模式存取方法选择 6.5.3 确定数据库的存储结构 6.5.4 评价物理结构 6.5.2 关系模式存取方法选择 n数据库系统是多用户共享的系统,对同 一个关系要建立多条存取路径才能满足 多用户的多种应用要求。 n物理设计的第一个任务就是要确定选择 哪些存取方法,即建立哪些存取路径。 关系模式存取方法选择(续) nDBMS常用存取方法 n索引方法,目前主要是B+树索引方法 n聚簇(Cluster)方法 nHASH方法 一、索引存取方法的选择 n选择索引存取方法的主要内容 根据应用要求确定 n 对哪些属性列建立索引 n 对哪些属性列建立组合索引 n 对哪些索引要设计为唯一索引 索引存取方法的选择(续) n选择索引存取方法的一般规则 n如果一个(或一组)属性经常在查询条件中出 现,则考虑在这个(或这组)属性上建立索引( 或组合索引) n如果一个属性经常作为最大值和最小值等聚 集函数的参数,则考虑在这个属性上建立索 引 n如果一个(或一组)属性经常在连接操作的连 接条件中出现,则考虑在这个(或这组)属性 上建立索引 索引存取方法的选择(续) n关系上定义的索引数过多会带来较 多的额外开销 n 维护索引的开销 n 查找索引的开销 二、聚簇存取方法的选择 n什么是聚簇 n为了提高某个属性(或属性组)的查询速度 ,把这个或这些属性(称为聚簇码)上具有 相同值的元组集中存放在连续的物理块称为 聚簇 n许多关系型DBMS都提供了聚簇功能 n聚簇存放与聚簇索引的区别 建立聚簇索引 (复习) n聚簇索引 n建立聚簇索引后,基表中数据也需要按指定的 聚簇属性值的升序或降序存放。也即聚簇索引 的索引项顺序与表中元组的物理顺序一致。 例: CREATE CLUSTER INDEX Stusname ON Student(Sname); 在Student表的Sname(姓名)列上建立一个聚 簇索引,而且Student表中的记录将按照Sname值的升 序存放 建立聚簇索引 (复习) n在一个基本表上最多只能建立一个聚簇索引 n聚簇索引的用途:对于某些类型的查询,可 以提高查询效率 n聚簇索引的适用范围 n 很少对基表进行增删操作 n 很少对其中的变长列进行修改操作 聚簇存取方法的选择(续) n聚簇的用途 n1. 大大提高按聚簇属性进行查询的效率 例:假设学生关系按所在系建有索引,现在要查 询信息系的所有学生名单。 n信息系的500名学生分布在500个不同的物 理块上时,至少要执行500次I/O操作。 n如果将同一系的学生元组集中存放,则每读 一个物理块可得到多个满足查询条件的元组 ,从而显著地减少了访问磁盘的次数。 聚簇存取方法的选择(续) n2. 节省存储空间 n聚簇以后,聚簇码相同的元组集中在一起 了,因而聚簇码值不必在每个元组中重复 存储,只要在一组中存一次就行了 聚簇存取方法的选择(续) n聚簇的局限性 n1. 聚簇只能提高某些特定应用的性能 n2. 建立与维护聚簇的开销相当大 n对已有关系建立聚簇,将导致关系中元组 移动其物理存储位置,并使此关系上原有 的索引无效,必须重建。 n当一个元组的聚簇码改变时,该元组的存 储位置也要做相应移动。 聚簇存取方法的选择(续) n聚簇的适用范围 n1. 既适用于单个关系独立聚簇,也适用于多个关 系组合聚簇 例:假设用户经常要按系别查询学生成绩单,这 一查询涉及学生关系和选修关系的连接操作,即 需要按学号连接这两个关系,为提高连接操作的 效率,可以把具有相同学号值的学生元组和选修 元组在物理上聚簇在一起。这就相当于把多个关 系按“预连接”的形式存放,从而大大提高连接操 作的效率。 聚簇存取方法的选择(续) n2. 当通过聚簇码进行访问或连接是该关系的 主要应用,与聚簇码无关的其他访问很少或 者是次要的时,可以使用聚簇。 n尤其当SQL语句中包含有与聚簇码有关的 ORDER BY,GROUP BY,UNION, DISTINCT等子句或短语时,使用聚簇特 别有利,可以省去对结果集的排序操作 聚簇存取方法的选择(续) n选择聚簇存取方法 n1. 设计候选聚簇 n对经常在一起进行连接操作的关系可以建 立组合聚簇; n如果一个关系的一组属性经常出现在相等 比较条件中,则该单个关系可建立聚簇; n如果一个关系的一个(或一组)属性上的值 重复率很高,则此单个关系可建立聚簇。 即对应每个聚簇码值的平均元组数不太少 。太少了,聚簇的效果不明显。 聚簇存取方法的选择(续) n2. 检查候选聚簇中的关系,取消其中不必要的关系 n从独立聚簇中删除经常进行全表扫描的关系; n从独立/组合聚簇中删除更新操作远多于查询操 作的关系; n从独立/组合聚簇中删除重复出现的关系 n当一个关系同时加入多个聚簇时,必须从这多 个聚簇方案(包括不建立聚簇)中选择一个较优 的,即在这个聚簇上运行各种事务的总代价 最小。 三、HASH存取方法的选择 n选择HASH存取方法的规则 n当一个关系满足下列两个条件时,可以选择 HASH存取方法 n该关系的属性主要出现在等值连接条件中 或主要出现在相等比较选择条件中 n该关系的大小可预知,而且不变; 或 该关系的大小动态改变,但所选用的 DBMS提供了动态HASH存取方法。 6.5 数据库的物理设计 6.5.1 数据库的物理设计的内容和方法 6.5.2 关系模式存取方法选择 6.5.3 确定数据库的存储结构 6.5.4 评价物理结构 6.5.3 确定数据库的存储结构 n确定数据库物理结构的内容 n1. 确定数据的存放位置和存储结构 n 关系 n 索引 n 聚簇 n 日志 n 备份 n2. 确定系统配置 1. 确定数据的存放位置 n影响数据存放位置和存储结构的因素 n硬件环境 n应用需求 n存取时间 n存储空间利用率 n维护代价 这三个方面常常是相互矛盾的 例:消除一切冗余数据虽能够节约存储空间和减少维 护代价,但往往会导致检索代价的增加 必须进行权衡,选择一个折中方案。 确定数据的存放位置(续) n基本原则 n根据应用情况将 n易变部分与稳定部分 n存取频率较高部分与存取频率较低部分 分开存放,以提高系统性能 确定数据的存放位置(续) 例: n数据库数据备份、日志文件备份等由于只 在故障恢复时才使用,而且数据量很大, 可以考虑存放在磁带上。 n如果计算机有多个磁盘,可以考虑将表和 索引分别放在不同的磁盘上,在查询时, 由于两个磁盘驱动器分别在工作,因而可 以保证物理读写速度比较快。 确定数据的存放位置(续) 例(续): n可以将比较大的表分别放在两个磁盘上, 以加快存取速度,这在多用户环境下特别 有效。 n可以将日志文件与数据库对象(表、索引 等)放在不同的磁盘以改进系统的性能。 2. 确定系统配置 nDBMS产品一般都提供了一些存储分配参数 n 同时使用数据库的用户数 n 同时打开的数据库对象数 n 使用的缓冲区长度、个数 n 时间片大小 n 数据库的大小 n 装填因子 n 锁的数目 n 等等 确定系统配置(续) n系统都为这些变量赋予了合理的缺省值。但是 这些值不一定适合每一种应用环境,在进行物 理设计时,需要根据应用环境确定这些参数值 ,以使系统性能最优。 n在物理设计时对系统配置变量的调整只是初步 的,在系统运行时还要根据系统实际运行情况 做进一步的调整,以期切实改进系统性能。 6.5 数据库的物理设计 6.5.1 数据库的物理设计的内容和方法 6.5.2 关系模式存取方法选择 6.5.3 确定数据库的存储结构 6.5.4 评价物理结构 6.5.4 评价物理结构 n评价内容 n对数据库物理设计过程中产生的多种方案进 行细致的评价,从中选择一个较优的方案作 为数据库的物理结构 6.5.4 评价物理结构 n评价方法 n定量估算各种方案 n 存储空间 n 存取时间 n 维护代价 n对估算结果进行权衡、比较,选择出一个较优 的合理的物理结构 n如果该结构不符合用户需求,则需要修改设计 第六章 数据库设计 6.1 数据库设计概述 6.2 需求分析 6.3 概念结构设计 6.4 逻辑结构设计 6.5 数据库的物理设计 6.6 数据库实施 6.7 数据库运行与维护 6.8 小结 6.6 数据库的实施 n数据库实施的工作内容 n用DDL定义数据库结构 n组织数据入库 n编制与调试应用程序 n数据库试运行 数据库实施 定义数 据库结 构 数据 装载 数据库 试运行数据库物 理设计 数据库运 行和维护 物理 模型 编制与 调试应 用程序 数据库 系统 一、定义数据库结构 n确定了数据库的逻辑结构与物理结构后 ,就可以用所选用的DBMS提供的数据定 义语言(DDL)来严格描述数据库结构 。 定义数据库结构(续) 例,对于前面的例子,可以用SQL语句如下定义 表结构: CREATE TABLE 学生 (学号 CHAR(8), ); CREATE TABLE 课程 ( ); 定义数据库结构(续) 接下来是在这些基本表上定义视图: CREATE VIEW ( ); 如果需要使用聚簇,在建基本表之前,应先用 CREATE CLUSTER语句定义聚族。 二、数据装载 n数据库结构建立好后,就可以向数据库中装载 数据了。组织数据入库是数据库实施阶段最主 要的工作。 n数据装载方法 n人工方法 n计算机辅助数据入库 数据装载(续) n人工方法:适用于小型系统 n步骤
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号