资源预览内容
第1页 / 共131页
第2页 / 共131页
第3页 / 共131页
第4页 / 共131页
第5页 / 共131页
第6页 / 共131页
第7页 / 共131页
第8页 / 共131页
第9页 / 共131页
第10页 / 共131页
亲,该文档总共131页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
An Introduction to Database System 中国人民大学信息学院中国人民大学信息学院数据库系统概论数据库系统概论AnIntroductiontoDatabaseSystem第六章第六章 关系数据理论关系数据理论An Introduction to Database System第六章第六章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*6.4 模式的分解模式的分解6.5 小结小结An Introduction to Database System6.1 问题的提出问题的提出关系数据库逻辑设计针对具体问题,如何构造一个适合于它的数据模式数据库逻辑设计的工具关系数据库的规范化理论An Introduction to Database System问题的提出问题的提出一、概念回顾二、关系模式的形式化定义三、什么是数据依赖四、关系模式的简化定义五、数据依赖对关系模式影响An Introduction to Database System一、概念回顾一、概念回顾v关系v关系模式v关系数据库v关系数据库的模式An Introduction to Database System二、关系模式的形式化定义二、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组:R(U,D,DOM,F)R:关系名U:组成该关系的属性名集合D:属性组U中属性所来自的域DOM:属性向域的映象集合F:属性间数据的依赖关系集合An Introduction to Database System三、什么是数据依赖三、什么是数据依赖1.完整性约束的表现形式v限定属性取值范围:例如学生成绩必须在0-100之间v定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键An Introduction to Database System什么是数据依赖(续)什么是数据依赖(续)2.数据依赖v一个关系内部属性与属性之间的约束关系v现实世界属性间相互联系的抽象v数据内在的性质v语义的体现An Introduction to Database Systemv数据依赖是现实世界事物之间的相互联系的一种表达,是属性固有的语义的体现。v在设计数据库时,设计人员对需求进行详细的分析,才能归纳出与客观事实相符合的数据依赖。v因此,数据依赖是一种语义的表示,不能说数据依赖不好,或者好。v一般情况下,数据依赖是函数依赖(FD)。例如例如v比如我们要设计一个学生成绩管理的数据库,我们会分析实际的成绩管理系统的情况,发现:学生的学号Xh是唯一的,通过学号,可以知道学生的姓名xm、性别xb、班级bj等信息。一个学生的学号,就决定了某一个学生的姓名、性别。因此,我们写为Xhxm,xhxb,xhbj。Xhxm,我们说,xm是依赖于xh的,xh决定了xm.这就是一个函数依赖。v比如我们要设计一个学生成绩管理的数据库,我们会分析实际的成绩管理系统的情况,发现:一个学生会学习多门课程(kc),然后每门课程有个成绩(cj)。我们不能写为kccj,因为同一门课程可能有多个同学去学习,这样写不符合实际情况。因此,如果考虑到这个因素,就可以得出xh,kccj。也就是说,cj是依赖于xh和kc这两个属性的。给定唯一的xh和唯一的kc,只有一个成绩与其对应如果考虑到还有重修,则xh,kccj也不对了。因为某个学生可能在第一学期学习了“高等数学”,得了30分,第二学期不得不重修“高等数学”,因此,唯一的xh和kc的组合,就有两个成绩与其对应了,因此不能说cj是由xh和kc决定的了。在这种情况下,xh,kc,xqcj因此,具体的函数依赖是要根据需求和实际情况确定的,反映了各个属性间的逻辑联系An Introduction to Database Systemv又如,某个学生是属于一个院系的,没有学生可以同时属于两个院系。每个院系都只有一个系主任。通过这样的语义,我们可以推出这两个依赖:XhdeptNamedeptNamedeptChairAn Introduction to Database System什么是数据依赖(续)什么是数据依赖(续)3.数据依赖的类型v函数依赖(FunctionalDependency,简记为FD)v多值依赖(MultivaluedDependency,简记为MVD)v其他An Introduction to Database System四、关系模式的简化表示四、关系模式的简化表示v关系模式R(U,D,DOM,F)简化为一个三元组:R(U,F)v当且仅当U上的一个关系r满足F时,r称为关系模式R(U,F)的一个关系An Introduction to Database System五、五、数据依赖对关系模式的影响数据依赖对关系模式的影响例1建立一个描述学校教务的数据库:学生的学号(Sno)、所在系(Sdept)系主任姓名(Mname)、课程名(Cname)成绩(Grade)单一的关系模式:StudentU Sno, Sdept, Mname, Cname, Grade An Introduction to Database System数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)属性组U上的一组函数依赖F:FSnoSdept,SdeptMname,(Sno,Cname)Grade SnoCnameSdeptMnameGradeAn Introduction to Database System关系模式关系模式Student中存在的问题中存在的问题1. 数据冗余太大2. 更新异常(Update Anomalies)3. 插入异常(Insertion Anomalies)4. 删除异常(Deletion Anomalies)An Introduction to Database System19 学号学号Sno姓名姓名Sname系名系名DeptName系地点系地点DeptLoc课程课程Cname成绩成绩Grade20010101张华张华Computer文约楼文约楼英语英语8620010101张华张华Computer文约楼文约楼高等数学高等数学9020010101张华张华Computer文约楼文约楼数据库数据库9220010101张华张华Computer文约楼文约楼操作系统操作系统8820010102王艳艳王艳艳Computer文约楼文约楼英语英语9220010102王艳艳王艳艳Computer文约楼文约楼高等数学高等数学8620010601刘树林刘树林Maths文华楼文华楼英语英语8820010601刘树林刘树林Maths文华楼文华楼高等数学高等数学8420010601刘树林刘树林Maths文华楼文华楼数学分析数学分析90表6.1 关系 ScInfoAn Introduction to Database System数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)结论:nStudent关系模式不是一个好的模式。n“好”的模式:不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少原因:由存在于模式中的某些数据依赖引起的解决方法:通过分解关系模式来消除其中不合适的数据依赖An Introduction to Database System分解关系模式分解关系模式v把这个单一模式分成3个关系模式:S(Sno,Sdept,SnoSdept);SC(Sno,Cno,Grade,(Sno,Cno)Grade);DEPT(Sdept,Mname,SdeptMname)An Introduction to Database System22l上述三个关系模式对应的实例:表6.2 表6.3 表6.4SnoSnameDeptName20010101张华张华Computer20010102王艳艳王艳艳Computer20010601刘树林刘树林MathSnoCnameGrade20010101英语英语8620010101高等数学高等数学9020010101数据库数据库9220010101操作系统操作系统8820010102英语英语9220010102高等数学高等数学8620010601英语英语8820010601高等代数高等代数8420010601数学分析数学分析90DeptNameDeptLocComputer文约楼文约楼Math文华楼文华楼表表6.4关系关系Depatments表表6.2关系关系Students表表6.3关系关系Reports现在问题来了现在问题来了 (1).v为什么你要这样分解,不那样分解?An Introduction to Database System23 lSnoSnameDeptNameDeptLoc20010101张华张华Computer文约楼文约楼20010102黄河黄河Computer文约楼文约楼20010601刘林刘林Math文华楼文华楼SnoCnameGrade20010101英语英语8620010101高等数学高等数学9020010101数据库数据库9220010101操作系统操作系统8820010102英语英语9220010102高等数学高等数学8620010601英语英语8820010601高等代数高等代数8420010601数学分析数学分析90表表6.2关系关系SD表表6.3关系关系Reports现在问题来了(现在问题来了(2).v到底什么是好的关系模式什么是“好”?如何定义“好”?v什么是研究发现问题定义问题形式化描述数学形式分析问题、解决问题、比较可重复性和可检验An Introduction to Database System现在问题来了(现在问题来了(3).v我们一定要进行所谓的分解么?看问题的角度技术的进步代价的权衡An Introduction to Database SystemAn Introduction to Database System第六章第六章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*6.4 模式的分解模式的分解6.5 小结小结An Introduction to Database System6.2 规范化规范化规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System6.2.1 函数依赖函数依赖v函数依赖v平凡函数依赖与非平凡函数依赖v完全函数依赖与部分函数依赖v传递函数依赖An Introduction to Database System一、函数依赖一、函数依赖定义定义6.1设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作XY。An Introduction to Database System说明说明 1.所有关系实例均要满足2.语义范畴的概念3.数据库设计者可以对现实世界作强制的规定An Introduction to Database System二、平凡函数依赖与非平凡函数依赖二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,如果XY,但YX,则称XY是非平凡的函数依赖若XY,但YX,则称XY是平凡的函数依赖v例:在关系SC(Sno,Cno,Grade)中,非平凡函数依赖:(Sno,Cno)Grade平凡函数依赖:(Sno,Cno)Sno(Sno,Cno)CnoAn Introduction to Database System平凡函数依赖与非平凡函数依赖(续)平凡函数依赖与非平凡函数依赖(续)若XY,则X称为这个函数依赖的决定属性组,也称为决定因素(Determinant)。若XY,YX,则记作XY。若Y不函数依赖于X,则记作XY。An Introduction to Database System三、完全函数依赖与部分函数依赖三、完全函数依赖与部分函数依赖定义定义6.2在R(U)中,如果XY,并且对于X的任何一个真子集X,都有XY,则称Y对X完全函数依赖,记作XFY。若XY,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作XPY。An Introduction to Database System完全函数依赖与部分函数依赖(续)完全函数依赖与部分函数依赖(续)例1中(Sno,Cno)Grade是完全函数依赖,(Sno,Cno)Sdept是部分函数依赖因为SnoSdept成立,且Sno是(Sno,Cno)的真子集FPAn Introduction to Database System四、传递函数依赖四、传递函数依赖定义定义6.3在R(U)中,如果XY,(YX),YXYZ,则称Z对X传递函数依赖。记为:XZ注:如果YX,即XY,则Z直接依赖于X。例:在关系Std(Sno,Sdept,Mname)中,有:SnoSdept,SdeptMnameMname传递函数依赖于Sno传递An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System6.2.2 码码定义定义6.4设K为R中的属性或属性组合。若KU,则K称为R的侯选码(CandidateKey)。若候选码多于一个,则选定其中的一个做为主码(PrimaryKey)。FAn Introduction to Database System码(续)码(续)v主属性与非主属性包含在任何一个候选码中的属性,称为主属性(Primeattribute)不包含在任何码中的属性称为非主属性(Nonprimeattribute)或非码属性(Non-keyattribute)v全码整个属性组是码,称为全码(All-key)An Introduction to Database System码(续)码(续)例2关系模式S(Sno,Sdept,Sage),单个属性Sno是码,SC(Sno,Cno,Grade)中,(Sno,Cno)是码例3关系模式R(P,W,A)P:演奏者W:作品A:听众一个演奏者可以演奏多个作品某一作品可被多个演奏者演奏听众可以欣赏不同演奏者的不同作品码为(P,W,A),即All-KeyAn Introduction to Database System外部码外部码定义定义6.5关系模式R 中属性或属性组X 并非R的码,但X 是另一个关系模式的码,则称X 是R 的外部码(Foreignkey)也称外码v如在SC(Sno,Cno,Grade)中,Sno不是码,但Sno是关系模式S(Sno,Sdept,Sage)的码,则Sno是关系模式SC的外部码v主码与外部码一起提供了表示关系间联系的手段An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System6.2.3 范式范式v范式是符合某一种级别的关系模式的集合v关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式v范式的种类:第一范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第五范式(5NF)An Introduction to Database System6.2.3 范式范式v各种范式之间存在联系:v某一关系模式R为第n范式,可简记为RnNF。v一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System6.2.4 2NFv1NF的定义如果一个关系模式R的所有属性都是不可分的基本数据项,则R1NFv第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库v但是满足第一范式的关系模式并不一定是一个好的关系模式An Introduction to Database System2NF(续)(续)例4关系模式S-L-C(Sno,Sdept,Sloc,Cno,Grade)Sloc为学生住处,假设每个系的学生住在同一个地方v函数依赖包括:(Sno,Cno)FGradeSnoSdept(Sno,Cno)PSdeptSnoSloc(Sno,Cno)PSlocSdeptSlocAn Introduction to Database System 2NF(续)(续)vS-L-C的码为(Sno,Cno)vS-L-C满足第一范式。v非主属性Sdept和Sloc部分函数依赖于码(Sno,Cno)SnoCnoGradeSdeptSlocS-L-CAn Introduction to Database SystemS-L-C不是一个好的关系模式(续)不是一个好的关系模式(续)(1)插入异常(2)删除异常(3)数据冗余度大(4)修改复杂An Introduction to Database SystemS-L-C不是一个好的关系模式(续)不是一个好的关系模式(续)v原因Sdept、Sloc部分函数依赖于码。v解决方法S-L-C分解为两个关系模式,以消除这些部分函数依赖SC(Sno,Cno,Grade)S-L(Sno,Sdept,Sloc)An Introduction to Database System2NF(续)(续)函数依赖图:SnoCnoGradeSCS-LSnoSdeptSlocv关系模式SC的码为(Sno,Cno)v关系模式S-L的码为Snov这样非主属性对码都是完全函数依赖An Introduction to Database System 2NF(续)(续)v2NF的定义定义定义6.6若R1NF,且每一个非主属性完全函数依赖于码,则R2NF。例:S-L-C(Sno,Sdept,Sloc,Cno,Grade)1NFS-L-C(Sno,Sdept,Sloc,Cno,Grade)2NFSC(Sno,Cno,Grade)2NF S-L(Sno,Sdept,Sloc)2NFAn Introduction to Database System 2NF(续)(续)v采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。v将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System 6.2.5 3NFv3NF的定义定义定义6.7关系模式R中若不存在这样的码X、属性组Y及非主属性Z(Z Y), 使得XY,YZ成立,YX,则称R3NF。n若R3NF,则每一个非主属性既不部分依赖于码也不传递依赖于码。An Introduction to Database System3NF(续)(续)例:2NF关系模式S-L(Sno,Sdept,Sloc)中函数依赖:SnoSdeptSdeptSnoSdeptSloc可得:SnoSloc,即S-L中存在非主属性对码的传递函数依赖,S-L3NF传递An Introduction to Database System 3NF(续)(续)函数依赖图:S-LSnoSdeptSlocAn Introduction to Database System3NF(续)(续)v解决方法采用投影分解法,把S-L分解为两个关系模式,以消除传递函数依赖:S-D(Sno,Sdept)D-L(Sdept,Sloc)S-D的码为Sno,D-L的码为Sdept。n分解后的关系模式S-D与D-L中不再存在传递依赖An Introduction to Database System3NF(续)(续)S-D的码为Sno,D-L的码为SdeptSnoSdeptS-DSdeptSlocD-LvS-L(Sno,Sdept,Sloc)2NFS-L(Sno,Sdept,Sloc)3NFS-D(Sno,Sdept)3NFD-L(Sdept,Sloc)3NFAn Introduction to Database System3NF(续)(续)v采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。v将一个2NF关系分解为多个3NF的关系后,仍然不能完全消除关系模式中的各种异常情况和数据冗余。An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System 6.2.6 BC范式(范式(BCNF)v定义定义6.8关系模式R1NF,若XY且YX时X必含有码,则RBCNF。v等价于:每一个决定属性因素都包含码An Introduction to Database SystemBCNF(续)(续)v若RBCNF所有非主属性对每一个码都是完全函数依赖所有的主属性对每一个不包含它的码,也是完全函数依赖没有任何属性完全函数依赖于非码的任何一组属性vRBCNFR3NF充分不必要An Introduction to Database SystemBCNF(续)(续)例5关系模式C(Cno,Cname,Pcno)nC3NFnCBCNF例6关系模式S(Sno,Sname,Sdept,Sage)n假定S有两个码Sno,SnamenS3NF。nSBCNFAn Introduction to Database SystemBCNF(续)(续)例7关系模式SJP(S,J,P)n函数依赖:(S,J)P;(J,P)Sn(S,J)与(J,P)都可以作为候选码,属性相交nSJP3NF,nSJPBCNFAn Introduction to Database System BCNF(续)(续)例8在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。函数依赖:(S,J)T,(S,T)J,TJ(S,J)和(S,T)都是候选码An Introduction to Database System BCNF(续)(续)JSJTSTSTJ中的函数依赖中的函数依赖An Introduction to Database SystemBCNF(续)(续)vSTJ3NF没有任何非主属性对码传递依赖或部分依赖vSTJBCNFT是决定因素,T不包含码An Introduction to Database SystemBCNF(续)(续)v解决方法:将STJ分解为二个关系模式:ST(S,T)BCNF,TJ(T,J)BCNF没有任何属性对码的部分函数依赖和传递函数依赖SJSTTJTJAn Introduction to Database System3NF与与BCNF的关系的关系vRBCNFR3NFv如果R3NF,且R只有一个候选码RBCNFR3NF充分不必要充分必要An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System6.2.7 多值依赖多值依赖例9学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。An Introduction to Database System课课程程C教教员员T参参考考书书B物理物理数学数学计算数学计算数学李李勇勇王王军军李李勇勇张张平平张张平平周周峰峰普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析.多值依赖(续)多值依赖(续)v非规范化关系An Introduction to Database System普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军王王 军军王王 军军李李 勇勇李李 勇勇李李 勇勇张张 平平张张 平平张张 平平 物物 理理物物 理理物物 理理物物 理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程C多值依赖(续)多值依赖(续)v用二维表表示TeachingAn Introduction to Database System多值依赖(续)多值依赖(续)vTeachingBCNFvTeaching具有唯一候选码(C,T,B),即全码An Introduction to Database System多值依赖(续)多值依赖(续)Teaching模式中存在的问题(1)数据冗余度大(2)插入操作复杂(3)删除操作复杂(4)修改操作复杂存在多值依赖An Introduction to Database System多值依赖(续)多值依赖(续)v定义定义6.9设R(U)是一个属性集U上的一个关系模式,X、Y和Z是U的子集,并且ZUXY。关系模式R(U)中多值依赖XY成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值,有一组Y的值,这组值仅仅决定于x值而与z值无关v例Teaching(C,T,B)An Introduction to Database System多值依赖(续)多值依赖(续)v多值依赖的另一个等价的形式化的定义:在R(U)的任一关系r中,如果存在元组t,s 使得tX=sX,那么就必然存在元组w,vr,(w,v可以与s,t相同),使得wX=vX=tX,而wY=tY,wZ=sZ,vY=sY,vZ=tZ(即交换s,t元组的Y值所得的两个新元组必在r中),则Y多值依赖于X,记为XY。这里,X,Y是U的子集,Z=U-X-Y。An Introduction to Database System多值依赖(续)多值依赖(续)v平凡多值依赖和非平凡的多值依赖若XY,而Z,则称XY为平凡的多值依赖否则称XY为非平凡的多值依赖An Introduction to Database System多值依赖(续)多值依赖(续)例10关系模式WSC(W,S,C)nW表示仓库,S表示保管员,C表示商品n假设每个仓库有若干个保管员,有若干种商品n每个保管员保管所在的仓库的所有商品n每种商品被所有保管员保管An Introduction to Database System多值依赖(续)多值依赖(续)WSCW1S1C1W1S1C2W1S1C3W1S2C1W1S2C2W1S2C3W2S3C4W2S3C5W2S4C4W2S4C5An Introduction to Database System多值依赖(续)多值依赖(续)WS且WC用下图表示这种对应An Introduction to Database System多值依赖的性质多值依赖的性质(1)多值依赖具有对称性若XY,则XZ,其中ZUXY(2)多值依赖具有传递性若XY,YZ,则XZY(3)函数依赖是多值依赖的特殊情况。若XY,则XY。(4)若XY,XZ,则XYZ。(5)若XY,XZ,则XYZ。(6)若XY,XZ,则XY-Z,XZ-Y。An Introduction to Database System多值依赖与函数依赖的区别多值依赖与函数依赖的区别(1)多值依赖的有效性与属性集的范围有关(2)若函数依赖XY在R(U)上成立,则对于任何YY均有XY成立多值依赖XY若在R(U)上成立,不能断言对于任何YY有XY成立An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System6.2.8 4NFv定义定义6.10关系模式R1NF,如果对于R的每个非平凡多值依赖XY(YX),X都含有码,则R4NF。v如果R4NF,则RBCNFn不允许有非平凡且非函数依赖的多值依赖n允许的非平凡多值依赖是函数依赖An Introduction to Database System4NF(续)(续)例:Teaching(C,T,B)4NF存在非平凡的多值依赖CT,且C不是码n用投影分解法把Teaching分解为如下两个关系模式:CT(C,T)4NFCB(C,B)4NFCT,CB是平凡多值依赖An Introduction to Database System6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结An Introduction to Database System6.2.9 规范化小结规范化小结v关系数据库的规范化理论是数据库逻辑设计的工具v目的:尽量消除插入、删除一场,修改复杂,数据冗余v基本思想:逐步消除数据依赖中不合适的部分实质:概念的单一化An Introduction to Database System规范化小结(续)规范化小结(续)v关系模式规范化的基本步骤1NF消除非主属性对码的部分函数依赖消除决定属性2NF集非码的非平消除非主属性对码的传递函数依赖凡函数依赖3NF消除主属性对码的部分和传递函数依赖BCNF消除非平凡且非函数依赖的多值依赖4NFAn Introduction to Database System规范化小结(续)规范化小结(续)v不能说规范化程度越高的关系模式就越好v在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式v上面的规范化步骤可以在其中任何一步终止An Introduction to Database System第六章第六章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*6.4 模式的分解模式的分解6.5 小结小结An Introduction to Database System6.3 数据依赖的公理系统数据依赖的公理系统v逻辑蕴含定义定义6.11对于满足一组函数依赖F 的关系模式R,其任何一个关系r,若函数依赖XY都成立,(即r中任意两元组t,s,若tX=sX,则tY=sY),则称F逻辑蕴含X YAn Introduction to Database System1. Armstrong公理系统公理系统关系模式R 来说有以下的推理规则:A1.自反律(Reflexivity):若Y XU,则X Y为F所蕴含。A2.增广律(Augmentation):若XY为F所蕴含,且ZU,则XZYZ为F所蕴含。A3.传递律(Transitivity):若XY及YZ为F所蕴含,则XZ为F所蕴含。An Introduction to Database System定理定理 6.1 Armstrong推理规则是正确的推理规则是正确的(l)自反律:若Y XU,则X Y为F所蕴含证:设YXU对R 的任一关系r中的任意两个元组t,s:若tX=sX,由于YX,有ty=sy,所以XY成立,自反律得证An Introduction to Database System定理定理 6.l Armstrong推理规则是正确的(续)推理规则是正确的(续)(2)增广律:若XY为F所蕴含,且ZU,则XZYZ 为F所蕴含。证:设XY为F所蕴含,且ZU。设R的任一关系r中任意的两个元组t,s:若tXZ=sXZ,则有tX=sX和tZ=sZ;由XY,于是有tY=sY,所以tYZ=sYZ,所以XZYZ为F所蕴含,增广律得证。An Introduction to Database System定理定理 6.l Armstrong推理规则是正确的(续)推理规则是正确的(续)(3)传递律:若XY及YZ为F所蕴含,则XZ为F所蕴含。证:设XY及YZ为F所蕴含。对R的任一关系r中的任意两个元组t,s:若tX=sX,由于XY,有tY=sY;再由YZ,有tZ=sZ,所以XZ为F所蕴含,传递律得证。An Introduction to Database System2. 导出规则导出规则1.根据A1,A2,A3这三条推理规则可以得到下面三条推理规则:合并规则:由XY,XZ,有XYZ。(A2,A3)伪传递规则:由XY,WYZ,有XWZ。(A2,A3)分解规则:由XY及ZY,有XZ。(A1,A3)An Introduction to Database System导出规则导出规则2.根据合并规则和分解规则,可得引理6.1引理6.lXA1 A2Ak成立的充分必要条件是XAi成立(i=l,2,k)An Introduction to Database SystemArmstrong公理系统公理系统vArmstrong公理系统是有效的、完备的n有效性:由F出发根据Armstrong公理推导出来的每一个函数依赖一定在F+中;n完备性:F+中的每一个函数依赖,必定可以由F出发根据Armstrong公理推导出来An Introduction to Database System3. 函数依赖闭包函数依赖闭包定义定义6.l2在关系模式R中为F所逻辑蕴含的函数依赖的全体叫作F的闭包,记为F+。定义定义6.13设F为属性集U上的一组函数依赖,XU,XF+=A|XA能由F 根据Armstrong公理导出,XF+称为属性集X关于函数依赖集F 的闭包An Introduction to Database SystemF的闭包的闭包F=XY,YZF+=X,Y,Z,XY, XZ, YZ, XYZ,XX, YY,ZZ,XYX, XZX, YZY, XYZX,XY,YZ,XYY, XZY, YZZ, XYZY,XZ,YYZ,XYZ, XZZ, YZYZ,XYZZ,XXY,XYXY,XZXY,XYZXY,XXZ,XYYZ,XZXZ,XYZYZ,XYZ,XYXZ,XZXY,XYZXZ,XZYZ,XYXYZ,XZXYZ,XYZXYZF=XA1,XAn的闭包F+计算是一个NP完全问题An Introduction to Database System关于闭包的引理关于闭包的引理v引理引理6.2 设F为属性集U上的一组函数依赖,X,YU,XY能由F 根据Armstrong公理导出的充分必要条件是YXF+v用途将判定XY是否能由F根据Armstrong公理导出的问题,转化为求出XF+、判定Y是否为XF+的子集的问题An Introduction to Database System求闭包的算法求闭包的算法算法算法6.1求属性集X(XU)关于U上的函数依赖集F 的闭包XF+输入:X,F输出:XF+步骤:(1)令X(0)=X,i=0(2)求B,这里B=A|(V)(W)(VWFV X(i)AW);(3)X(i+1)=BX(i)(4)判断X(i+1)=X(i)吗?(5)若相等或X(i)=U , 则X(i)就是XF+,算法终止。(6)若否,则i=i+l,返回第(2)步。An Introduction to Database System算法算法6.1对于算法6.1,令ai=|X(i)|,ai 形成一个步长大于1的严格递增的序列,序列的上界是|U|,因此该算法最多|U|-|X|次循环就会终止。An Introduction to Database System函数依赖闭包函数依赖闭包例1已知关系模式R,其中U=A,B,C,D,E;F=ABC,BD,CE,ECB,ACB。求(AB)F+。解设X(0)=AB;(1) X(1)=ABCD=ABCD。(2)X(0)X(1) X(2)=X(1)BE=ABCDE。(3)X(2)=U,算法终止(AB)F+=ABCDE。An Introduction to Database System4. Armstrong公理系统的有效性与完备性公理系统的有效性与完备性v定理6.2Armstrong公理系统是有效的、完备的v证明:1.有效性可由定理6.1得证2.完备性只需证明逆否命题:若函数依赖XY不能由F从Armstrong公理导出,那么它必然不为F所蕴含An Introduction to Database SystemArmstrong公理系统完备性证明公理系统完备性证明(1)引理:若VW成立,且VXF+,则WXF+(2)构造一张二维表r,它由下列两个元组构成,可以证明r必是R(U,F)的一个关系,即F+中的全部函数依赖在r上成立。 XF+U-XF+11.100.011.111.1(3)若XY 不能由F从Armstrong公理导出,则Y 不是XF+的子集。An Introduction to Database System5. 函数依赖集等价函数依赖集等价定义定义6.14如果G+=F+,就说函数依赖集F覆盖G(F是G的覆盖,或G是F的覆盖),或F与G等价。引理引理6.3F+=G+的充分必要条件是FG+,和GF+证:必要性显然,只证充分性。(1)若FG+,则XF+XG+。(2)任取XYF+则有YXF+XG+。所以XY (G+)+=G+。即F+G+。(3)同理可证G+F+,所以F+=G+。An Introduction to Database System6. 最小依赖集最小依赖集定定义义6.15如果函数依赖集F满足下列条件,则称F为一个极小函数依赖集。亦称为最小依赖集或最小覆盖。(1)F中任一函数依赖的右部仅含有一个属性。(2)F中不存在这样的函数依赖XA,使得F与F-XA等价。(3)F中不存在这样的函数依赖XA,X有真子集Z使得F-XAZA与F等价。An Introduction to Database System最小依赖集最小依赖集例2关系模式S,其中:U=Sno,Sdept,Mname,Cno,Grade,F=SnoSdept,SdeptMname,(Sno,Cno)Grade设F=SnoSdept,SnoMname,SdeptMname,(Sno,Cno)Grade,(Sno,Sdept)SdeptF是最小覆盖,而F不是。因为:F -SnoMname与F 等价 F -(Sno,Sdept)Sdept也与F 等价 An Introduction to Database System7. 极小化过程极小化过程定理定理6.3每一个函数依赖集F均等价于一个极小函数依赖集Fm。此Fm称为F的最小依赖集。证明:构造性证明,找出F的一个最小依赖集。An Introduction to Database System极小化过程(续)极小化过程(续)(1)逐一检查F中各函数依赖FDi:XY,若Y=A1A2Ak,k 2,则用XAj|j=1,2,k来取代XY。(2)逐一检查F中各函数依赖FDi:XA,令G=F-XA,若AXG+,则从F中去掉此函数依赖。(3)逐一取出F中各函数依赖FDi:XA,设X=B1B2Bm,逐一考查Bi(i=l,2,m),若A (X-Bi)F+,则以X-Bi取代X。An Introduction to Database System极小化过程(续)极小化过程(续)例3F=AB,BA,BC,AC,CAFm1、Fm2都是F的最小依赖集:Fm1=AB,BC,CAFm2=AB,BA,AC,CAvF的最小依赖集Fm不唯一v极小化过程(定理6.3的证明)也是检验F是否为极小依赖集的一个算法An Introduction to Database System第六章第六章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*6.4 模式的分解模式的分解6.5 小结小结An Introduction to Database System6.4 模式的分解模式的分解v把低一级的关系模式分解为若干个高一级的关系模式的方法不是唯一的v只有能够保证分解后的关系模式与原关系模式等价,分解方法才有意义An Introduction to Database System关系模式分解的标准关系模式分解的标准三种模式分解等价的定义:分解具有无损连接性分解要保持函数依赖分解既要保持函数依赖,又要具有无损连接性An Introduction to Database System模式的分解(续)模式的分解(续)定义定义6.16关系模式R的一个分解:=R1,R2,RnU=Ui,且不存在UiUj,Fi为F在Ui上的投影定义定义6.17函数依赖集合XY |XY F+XYUi的一个覆盖Fi 叫作F 在属性Ui 上的投影i=1nAn Introduction to Database System模式的分解(续)模式的分解(续)例:S-L(Sno,Sdept,Sloc)F=SnoSdept,SdeptSloc,SnoSlocS-L2NF分解方法可以有多种:1.S-L分解为三个关系模式:SN(Sno)SD(Sdept)SO(Sloc)2.SL分解为下面二个关系模式:NL(Sno,Sloc)DL(Sdept,Sloc)3.将SL分解为下面二个关系模式:ND(Sno,Sdept)NL(Sno,Sloc)An Introduction to Database System具有无损连接性的模式分解具有无损连接性的模式分解v关系模式R的一个分解=R1,R2,Rn若R与R1、R2、Rn自然连接的结果相等,则称关系模式R的这个分解具有无损连接性(Losslessjoin)v具有无损连接性的分解保证不丢失信息v无损连接性不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题An Introduction to Database System模式的分解(续)模式的分解(续)第3种分解方法具有无损连接性问题:这种分解方法没有保持原关系中的函数依赖SL中的函数依赖SdeptSloc没有投影到关系模式ND、NL上An Introduction to Database System保持函数依赖的模式分解保持函数依赖的模式分解设关系模式R被分解为若干个关系模式R1,R2,Rn(其中U=U1U2Un,且不存在UiUj,Fi为F在Ui上的投影),若F所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式R的这个分解是保持函数依赖的(Preservedependency)An Introduction to Database System模式的分解(续)模式的分解(续)4.将SL分解为下面二个关系模式:ND(Sno,Sdept)DL(Sdept,Sloc)这种分解方法就保持了函数依赖An Introduction to Database System模式的分解(续)模式的分解(续)v如果一个分解具有无损连接性,则它能够保证不丢失信息v如果一个分解保持了函数依赖,则它可以减轻或解决各种异常情况v分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。具有无损连接性的分解不一定能够保持函数依赖;同样,保持函数依赖的分解也不一定具有无损连接性。An Introduction to Database System模式的分解(续)模式的分解(续)第1种分解方法既不具有无损连接性,也未保持函数依赖,它不是原关系模式的一个等价分解第2种分解方法保持了函数依赖,但不具有无损连接性第3种分解方法具有无损连接性,但未持函数依赖第4种分解方法既具有无损连接性,又保持了函数依赖An Introduction to Database System分解算法分解算法v算法6.2判别一个分解的无损连接性v算法6.3(合成法)转换为3NF的保持函数依赖的分解。v算法6.4转换为3NF既有无损连接性又保持函数依赖的分解v算法6.5(分解法)转换为BCNF的无损连接分解v算法6.6达到4NF的具有无损连接性的分解An Introduction to Database System第六章第六章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*6.4 模式的分解模式的分解6.5 小结小结An Introduction to Database System6.5 小结小结关系模式的规范化,其基本思想:An Introduction to Database System小结小结(续续)v若要求分解具有无损连接性,那么模式分解一定能够达到4NFv若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNFv若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNFAn Introduction to Database System小结小结(续续)v规范化理论为数据库设计提供了理论的指南和工具也仅仅是指南和工具v并不是规范化程度越高,模式就越好必须结合应用环境和现实世界的具体情况合理地选择数据库模式An Introduction to Database System下课了。下课了。休息一会儿。休息一会儿。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号