资源预览内容
第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
第5页 / 共37页
第6页 / 共37页
第7页 / 共37页
第8页 / 共37页
第9页 / 共37页
第10页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第1章 数据库技术基础,当今社会是一个信息化的社会,数据库技术的发展,已经 成为先进信息技术的重要组成部分。数据是信息的载体,数据 库是互相关联的数据的集合。数据库技术的发展,归根结底是 由实际应用需求推动的。 目前,绝大多数的计算机应用系统都离不开数据库的支撑。 大到一个国家,小到一个集团的内部,数据库的建设规模、数 据库信息量的大小和使用频度已经成为衡量其信息化程度的重 要标志。 数据库领域有其自身显著的特点,涉及相当多的理论及概 念。本章将逐步引出这些概念,使读者从知晓概念到加深概念 的理解。,1.1 关于数据库的基本术语,1.1.1 信息与数据 数据库是计算机信息管理的基础,它的研究对象是数据,一提到数据, 人们往往就会想到信息。但是数据并不是信息的本身。 一般认为,信息是对现实世界中不同事物的存在特征、运动形态以及不 同事物间的相互联系等多种属性的描述,通过抽象形成概念。信息是可以被 认识、理解、表达、加工、推理和传播的诸如数字、文字、图像和声音等符 号所表示的某一事物的消息和知识。 信息的表达必须借助于符号,数据是对事实和概念的描述,是表达信息 的符号记录。在现实生活中,数据无处不在,文字、图像、声音、员工的档 案记录等。例如,在员工的档案中,对于员工的基本信息,人们最感兴趣的 是员工的工号、姓名、性别、出生日期、入职时间、所属部门,可以这样描 述: (1001,张洪,男,1983-1-5,2008-3-1,销售部),上面的这条员工记录就是数据。数据本身并不能完全表达内容,一定要通 过语义解释。了解语义的人会从上面的记录中得到:张洪是该公司销售部 门的一名男职员,工号是1001,1983年1月5日出生,2008年3月1日入职。 可见,数据与信息是两个既有联系又有区别的概念,数据是信息的符号 表示,信息则是数据的内涵,是对数据的语义解释。但是,在计算机领域, 并不严格区分两者,一般统称“数据”。,1.1.2 数据库与数据库系统 数据库(Database,简称DB),顾名思义,就是存放数据的仓库,是 一个长期存储在计算机内,相互联系的数据集合,数据库中的数据按照一 定的数据模型组织、描述和存储,具有较少冗余和较高的数据独立性,允 许多个用户共享使用,并且提供数据的安全性维护和完整性检查措施。 这里需要注意的是,数据库与数据仓库的概念不同;数据库是具有逻 辑关系的数据集合,逻辑上无关的数据集合不能称作数据库;数据库是对 现实世界的描述,可以是一个单位或组织,其内 部的某些改变应及时反映到数据库中。 数据库系统(DataBase System,简称DBS) 是指在计算机系统中引入数据库后的系统,一般 由数据库、数据库管理系统(及其开发工具)、 应用系统、数据库管理员(DataBase Administrator,简称DBA)和用户构成。 数据库系统可以用右图来表示。,1.1.3 数据库管理系统 数据库管理系统(DataBase Management System,简称DBMS),是位于用户与 操作系统之间的一层数据管理软件,是为了建立、使用和维护数据库而配置的系统 软件。例如:Access,Microsoft SQL Server,Oracle等。它建立在操作系统的基 础上,对数据库进行统一的管理和控制。主要功能如下: 数据定义功能 DBMS提供数据定义语言(Data Definition Language,简称DDL)对数据库中 的数据对象进行定义,如对表、视图、索引、存储过程等进行的定义。 2. 数据操纵功能 DBMS提供数据操纵语言(Data Manipulation Language,简称DML),用户可 以使用DML操纵数据,实现对数据库的基本操作,如查询、插入、删除和修改等。 3. 数据库的运行管理 数据库在建立、运用和维护时由DBMS统一管理,统一控制,以保证数据的安全 性、完整性和多用户对数据库使用的并发控制及发生故障后的系统恢复等。数据 库的运行管理是DBMS的核心部分。 4. 数据库的建立和维护功能 数据库的建立和维护包括初始数据的输入、转换,数据库的转储、恢复功能, 数据库的重组织功能和性能检测分析等功能。,1.2 数据管理技术的发展,数据是一个单位或组织的重要资源,为了组织的长远发展考虑,必 须对组织的各种数据施行有效的管理。所谓数据管理,是指对数据进行 收集、整理、存储、检索、加工和传递等一系列活动的总和。数据管理 的最终目的是从数据中获取有用的信息,以服务于组织的管理工作。数 据处理是数据管理的中心工作,将原始数据转换成信息的过程称作数据 处理。 数据管理技术的发展是随着计算机硬件技术和软件技术的发展而 不断发展起来的。计算机数据管理技术经历了人工管理阶段、文件系统 阶段和数据库系统三个阶段。,1.2.1 人工管理阶段 20世纪50年代中期以前,计算机数据管理的能力很差,这一阶段称为 人工管理阶段。此时计算机发展的年代特征是:硬件存储设备主要有磁带、 卡片、纸带等;没有操作系统和专门管理数据的软件;数据处理方式是批 处理;计算机主要用于科学计算。 在人工管理阶段,数据与程序之间 是一对一的关系,如右图所示。 人工管理阶段的缺点如下: 1. 数据不保存 只是在计算某一具体题目时将数据输入,运行结束后得到输出结果, 输入、输出和中间结果均不保存。 2. 数据不共享,冗余度大 一组数据只对应一个应用程序,即使多个应用程序使用相同的数据, 也要各自定义,不能共享,导致冗余度大。 3. 数据缺乏独立性 数据与程序是紧密结合在一起的,数据的逻辑结构、物理结构和 存 取方式都有程序规定。没有文件的概念,数据的组织方式完全由 程序员 决定。,人工管理阶段的缺点如下。 1. 数据不保存 只是在计算某一具体题目时将数据输入,运行结束后得到输出结 果,输入、输出和中间结果均不保存。 2. 数据不共享,冗余度大 一组数据只对应一个应用程序,即使多个应用程序使用相同的数 据,也要各自定义,不能共享,导致冗余度大。 3. 数据缺乏独立性 数据与程序是紧密结合在一起的,数据的逻辑结构、物理结构和 存取方式都有程序规定。没有文件的概念,数据的组织方式完全由程 序员决定。,1.2.2 文件系统阶段 20世纪50年代后期到60年代中期,计算机数据管理技术进入到文件系 统阶段。此时计算机发展的年代特征是:已经有了磁盘、磁鼓等直接存储 的设备;出现了操作系统和专门的数据管理软件,称为文件系统;处理方 式上不仅有批处理,还能够实现联机实时处理;计算机不仅用于科学计算 ,还广泛用于数据处理。 在文件系统阶段,文件系统把数据组织成文件形式存储在磁盘上,这 些数据文件相互独立,长期保存在存储设备上。文件可以命名,应用程序 利用“按文件名访问,按记录进行存取”的方式,对文件中的数据进行修改 、插入和删除操作。 这一阶段的数据还是面向应用程序的,数据文件基本上与各自的应用 程序相对应,如右图所示。,文件系统阶段对数据的管理有了长足的进步,但它还是从应用程序的 角度来组织、看待和处理数据的。这一阶段的缺点是: 1. 数据共享性差,数据的冗余度较大 文件系统提供了数据的物理独立性,实现了一定程度的数据共享,但 只能实现文件级共享。文件的设计很难满足多种应用程序的不同要求,数 据冗余不可避免。 2. 数据存在不一致性 在文件系统中,没有维护数据一致性的监控机制,数据的一致性由用 户自己维护。同一数据在多个地方同时存放,尤其在大型信息系统中,很 容易造成不一致现象的发生。 3. 数据的独立性差 文件系统只实现了数据的物理独立,而没有实现数据的逻辑独立。文 件结构的每一处修改都将导致应用程序的修改。因此,文件系统的数据与 程序之间缺乏逻辑独立性。,1.2.3 数据库系统阶段 20世纪60年代中后期开始,计算机数据管理技术进入到数据库系统阶段。 此时计算机发展的年代特征是:硬件方面有了大容量的磁盘,软件方面出现 了大量的系统软件;硬件的价格在下降,软件的价格在上升;在处理方式 上,联机实时处理要求增多,并开始考虑和提出分布式处理。 为了解决多用户共享数据,使数据为尽可能多的应用服务,一种新的数 据管理技术数据库技术应运而生。数据库技术从20世纪60年代中期开始 萌芽,至60年代末70年代初,数据库技术已经发展到成熟阶段。 与文件系统不同的是,数据库系统是面向数据的而不是面向程序的,各 个处理功能通过数据管理软件从数据库中获取所需要的数据和存储处理结果。 它克服了文件系统的弱点,为用户提供了一种方便、功能强大的数据管理手 段。数据库系统阶段的数据处理过程如下图所示。,数据库系统是在文件系统的基础上发展起来的新技术,与文件系统相 比具有如下主要特点。 1. 数据库系统以数据模型为基础 数据库设计的基础是数据模型。在进行数据库设计时,要站在全局需 要的角度抽象和组织数据;要完整地、准确地描述数据自身和数据之间联 系的情况;要建立适合整体需要的数据模型。 2. 数据库系统的数据冗余度小,数据共享性高 由于数据库系统是从整体角度上看待和描述数据的,数据不再是面向 某个应用,而是面向整个系统,所以数据库中同样的数据不会多次重复出 现。这就使得数据库中的数据冗余度小,从而避免了由于数据冗余度大带 来的数据冲突问题,也避免了由此产生的数据维护和数据统计错误等问题。 数据库系统通过数据模型和数据控制机制提高数据的共享性。数据共享度 高会提高数据的利用率,它使得数据更有价值和更容易、方便地被使用。 3. 数据库系统的数据和程序之间具有较高的独立性 由于数据库中的数据定义功能和数据管理功能是由DBMS提供的,所以 数据对应用程序的依赖度大大降低,数据和程序之间具有较高的独立性。,4. 数据库系统通过DBMS进行数据安全性和完整性的控制 数据的安全性控制是指保护数据库,以防止不合法的使用造成的数据 泄露、破坏和更改。数据的完整性控制是指为了保证数据的正确性、有 效性和相容性,防止不符合语义的数据输入或输出所采用的控制机制。 5. 数据库中数据的最小存取单位是数据项 在文件系统中,由于数据的最小存取单元是记录,结果给使用及数据 操作带来许多不便。数据库系统改善了其不足之处,它的最小数据存取单 位是数据项,即使用时可以按数据项或数据项组存取数据,也可以按记录 或记录组存取数据。,1.3 数据模型,数据模型是数据库系统的核心,要为一个数据库建立数据模型,首先 要深入到信息的现实世界中进行系统需求分析,用概念模型真实地、全面 地描述现实世界中的管理对象及联系,然后再将概念模型转换成数据模 型。,1.3.1 数据模型的概念及要素,模型是对现实世界特征的模拟和抽象,而数据模型是对现实世界数 据特征的抽象,是一组描述数据、数据之间的联系、数据的语义和完整 性约束的概念工具的集合。 现实世界的物质要在计算机中得以表示和处理,一般要经过两个阶 段的抽象,从现实世界到信息世界的抽象,再从信息世界到计算机世界 的抽象。下面先介绍这三个世界(领域)。 1. 现实世界 现实世界泛指存在于人脑之外的客观世界。信息的现实世界是指我们要 管理的客观存在的各种事物、事物之间的相互联系及事物的发生、变化过 程。通过对现实世界的了解和认识,使得我们对要管理的对象、管理的过 程和方法有个概念模型。认识信息的现实世界并用概念模型加以描述的过 程称为系统分析。 2. 信息世界 现实世界中的事物反映到人们的头脑里,经过认识、选择、命名、分类 等综合分析而形成了印象和概念,从而得到了信息。当事物用信息来描述 时,即进入了信息世界。信息世界最主要的特征是可以反映数据之间的联 系。,3. 计算机世界 信息世界中的信息,经过数字化处理形成计算机能够处理的数据,就 进入了计算机世界。计算机世界也叫做机器世界或者数据世界。计算机 世界是数据在计算机上的存储和处理,这些数据必须具有自己特定的数 据结构,能够反映信息世界中数据之间的联系。 现实世界、信息世界和计算机世界这三个领域是由客观到认识、由认 识到使用管理的三个不
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号