数据结构ppt课件-－金锄头文库

上课前需要说明的几个问题：上课前需要说明的几个问题：1.任课教师：焦贤沛任课教师：焦贤沛联系电话：联系电话：838166562. 交流信箱：交流信箱：3.关于数据结构课程：关于数据结构课程：教材、重要性、时间安排（教材、重要性、时间安排（64+32）、）、考试考试1;.第一章第一章绪绪论论2;.1.1 数据结构讨论的范畴数据结构讨论的范畴1.2 基本概念基本概念1.3 算法和算法的量度算法和算法的量度3;.1.11.1 数据结构讨论的范畴数据结构讨论的范畴Niklaus Wirth： Algorithm + Data Structures = Programs程序设计程序设计: :算法算法: 数据结构数据结构: 为计算机处理问题编制一组指令集处理问题的策略处理问题的策略问题的数学模型问题的数学模型4;. 结构静力分析计算例如例如: 数值计算的程序设计问题线性代数方程组环流模式方程 (球面坐标系)全球天气预报 5;. 【例例例例1-11-11-11-1】图书图书图书图书目目目目录录录录表表表表由由由由于于于于表表表表中中中中每每每每条条条条记记记记录录录录（表表表表示示示示每每每每一一一一本本本本书书书书）的的的的登登登登录录录录号号号号各各各各不不不不相相相相同同同同，所所所所以以以以可可可可用用用用登登登登录录录录号号号号来来来来唯唯唯唯一一一一地地地地标标标标识识识识每每每每条条条条记记记记录录录录（一一一一本本本本图图图图书书书书）。在在在在计计计计算算算算机机机机的的的的数数数数据据据据管管管管理理理理中中中中，能能能能唯唯唯唯一一一一地地地地标标标标识识识识一一一一条条条条记记记记录录录录的的的的数数数数据据据据项项项项被被被被称称称称为为为为关关关关键键键键字字字字。因因因因为为为为每每每每本本本本图图图图书书书书的的的的登登登登录录录录排排排排列列列列位位位位置置置置有有有有先先先先后后后后次次次次序序序序，所所所所以以以以在在在在表表表表中中中中会会会会按按按按登登登登录录录录号号号号形形形形成成成成一一一一种种种种次次次次序序序序关关关关系系系系，即整个二维表就是图书数据的一个线性序列。这种关系被称为线性结构。即整个二维表就是图书数据的一个线性序列。这种关系被称为线性结构。即整个二维表就是图书数据的一个线性序列。这种关系被称为线性结构。即整个二维表就是图书数据的一个线性序列。这种关系被称为线性结构。非数值计算的程序设计问题6;.返回返回返回返回7;. 描述磁盘目录和文件结构时，假设每个描述磁盘目录和文件结构时，假设每个描述磁盘目录和文件结构时，假设每个描述磁盘目录和文件结构时，假设每个磁盘包括一个根目录（磁盘包括一个根目录（磁盘包括一个根目录（磁盘包括一个根目录（rootrootrootroot）和若干个一级）和若干个一级）和若干个一级）和若干个一级子目录，每个一级子目录中又包含若干个二子目录，每个一级子目录中又包含若干个二子目录，每个一级子目录中又包含若干个二子目录，每个一级子目录中又包含若干个二级子目录级子目录级子目录级子目录. . . . 这种关系很像自然界中的树，所以称为这种关系很像自然界中的树，所以称为这种关系很像自然界中的树，所以称为这种关系很像自然界中的树，所以称为目录树。如左图所示。目录树。如左图所示。目录树。如左图所示。目录树。如左图所示。【例例例例1-21-21-21-2】磁磁磁磁盘盘盘盘目目目目录结录结录结录结构和文件管理系构和文件管理系构和文件管理系构和文件管理系统统统统在这种结构中，目录和目录以及目录和文件之间呈现出一对多的非线性关系。即根在这种结构中，目录和目录以及目录和文件之间呈现出一对多的非线性关系。即根在这种结构中，目录和目录以及目录和文件之间呈现出一对多的非线性关系。即根在这种结构中，目录和目录以及目录和文件之间呈现出一对多的非线性关系。即根rootroot有有有有多个下属（也称为后代），每一后代又有属于自己的后代；而任一个子目录或文件都只有一个多个下属（也称为后代），每一后代又有属于自己的后代；而任一个子目录或文件都只有一个多个下属（也称为后代），每一后代又有属于自己的后代；而任一个子目录或文件都只有一个多个下属（也称为后代），每一后代又有属于自己的后代；而任一个子目录或文件都只有一个唯一的上级（也称为双亲）。称这种数学模型为树型数据结构。唯一的上级（也称为双亲）。称这种数学模型为树型数据结构。唯一的上级（也称为双亲）。称这种数学模型为树型数据结构。唯一的上级（也称为双亲）。称这种数学模型为树型数据结构。8;.【例例例例1-31-31-31-3】教学计划编排问题教学计划编排问题教学计划编排问题教学计划编排问题假如假如假如假如一个教学计划中包含许多课程。在课程之间，有些必须按规定的先后次序排课，一个教学计划中包含许多课程。在课程之间，有些必须按规定的先后次序排课，一个教学计划中包含许多课程。在课程之间，有些必须按规定的先后次序排课，一个教学计划中包含许多课程。在课程之间，有些必须按规定的先后次序排课，如：学如：学如：学如：学C6C6C6C6课程必须先学课程必须先学课程必须先学课程必须先学C3C3C3C3课，学课，学课，学课，学C3C3C3C3课程必须先学课程必须先学课程必须先学课程必须先学C1C1C1C1课。这些课程之间存在先修和后续的关课。这些课程之间存在先修和后续的关课。这些课程之间存在先修和后续的关课。这些课程之间存在先修和后续的关系。系。系。系。在这种结构中，表示课程的数据之间呈现多对多的非线性关系，称这类数学模型为图在这种结构中，表示课程的数据之间呈现多对多的非线性关系，称这类数学模型为图在这种结构中，表示课程的数据之间呈现多对多的非线性关系，称这类数学模型为图在这种结构中，表示课程的数据之间呈现多对多的非线性关系，称这类数学模型为图形结构。形结构。形结构。形结构。9;. 图结构还有：多岔路口交通灯的控制和管理、煤气管道的铺设造价等。图结构还有：多岔路口交通灯的控制和管理、煤气管道的铺设造价等。图结构还有：多岔路口交通灯的控制和管理、煤气管道的铺设造价等。图结构还有：多岔路口交通灯的控制和管理、煤气管道的铺设造价等。数据结构是一门讨论数据结构是一门讨论“描述现实世界实体的数学模型描述现实世界实体的数学模型( (非数值计算非数值计算) )及其上的操作及其上的操作在计算机中如何表示和实现在计算机中如何表示和实现”的学科。的学科。概括地说：概括地说：10;.1.2 基本概念基本概念一、数据与数据结构一、数据与数据结构二、数据类型二、数据类型三、抽象数据类型三、抽象数据类型11;.一、数据与数据结构一、数据与数据结构所有能被输入被输入到计算机中，且能被计算机处理的符号处理的符号的集合。数据数据: :是计算机操作的对象计算机操作的对象的总称。是计算机处理的信息的信息的某种特定的符号表示形式表示形式。12;.是数据（集合）中的一个“个体个体”数据元素数据元素: :是数据结构中讨论的基本基本单位13;. 数据项：数据项：是数据结构中讨论的最小最小单位数据元素可以是数据项的集合数据元素可以是数据项的集合例如：描述一个学生的数据元素可以是称之为组合项称之为组合项14;.数据结构：数据结构：带结构结构的数据元素的集合假设用三个三个 4 位的十进制数位的十进制数表示一个含 12 位数的十进制数。位数的十进制数。3214,6587,9345 a1(3214),a2(6587),a3(9345)则在数据元素 a1、a2 和 a3 之间存在着“次序次序”关系关系 a1,a2 、 a2,a3 3214，6587，9345 a1 a2 a3 6587，3214，9345 a2 a1 a3例如例如: :15;.又例，在2行3列的二维数组a1, a2, a3, a4, a5, a6中六个元素之间存在两个关系:行的次序关系行的次序关系:列的次序关系列的次序关系: :row = ,col = , a1 a3 a5 a2 a4 a6 a1 a2 a3a4 a5 a6数据结构：数据结构：带结构结构的数据元素的集合16;.再例，在一维数组 a1, a2, a3, a4, a5, a6 的数据元素之间存在如下的次序关系次序关系:| i=1, 2, 3, 4, 5 或者说，数据结构数据结构是相互之间存在着某种逻辑关系的数据元素的集合相互之间存在着某种逻辑关系的数据元素的集合。数据结构：数据结构：带结构结构的数据元素的集合可见，不同的“关系关系”构成不同的“结构结构”17;.数据的逻辑结构逻辑结构可归结为以下四类四类: :线性线性结构树形树形结构图状图状结构集合集合结构18;.数据结构的形式定义数据结构的形式定义为:数据结构数据结构是一个二元组 Data_Structures = (D, S)其中:D 是数据元素的有限集数据元素的有限集， S 是 D上关系的有限集关系的有限集。19;.数据的存储结构存储结构逻辑结构在存储器中的映象映象“数据元素”的映象？“关系”的映象？20;.数据元素的映象方法：数据元素的映象方法：用二进制位(bit)的位串表示数据元素(321)10 = (501)8 = (101000001)2 A = (101)8 = (001000001)221;.关系的映象方法：关系的映象方法：（表示x, y的方法）顺序映象顺序映象以相对的存储位置表示后继关系以相对的存储位置表示后继关系例如例如: :令 y 的存储位置和 x 的存储位置之间差一个常量 C而 C 是一个隐含值，整个存储结构中只含数据元素本身的信息整个存储结构中只含数据元素本身的信息 x y22;.链式映象链式映象以附加信息以附加信息( (指针指针) )表示后继关系表示后继关系需要用一个和 x 在一起的附加信息附加信息指示 y 的存储位置y x23;.在不同的编程环境中，存储结构可有不同的描述方法。当用高级程序设计语言进行编程时，通常可用高级编程语言中提供的数据类型描述之。24;.例如例如: : 以三个带有次序关系的整数表示一个长整数时，可利用 C 语言中提供的整数数组类型。typedef int Long_int 3；定义长整数定义长整数为:25;.二、数据类型二、数据类型在用高级程序语言编写的程序中，必须对程序中出现的每个变量、常量或表达式，明确说明明确说明它们所属的数据类型数据类型。26;.例如，C 语言中提供的基本数据类型基本数据类型有:整型整型 int浮点型浮点型 float字符型字符型 char逻辑型逻辑型 bool （ C+语言）语言）双精度型双精度型 double实型（实型（ C+语言）语言）27;. 数据类型数据类型是一个值的集合值的集合和定义在此集合上的一组操作一组操作的总称。不同类型的变量，其所能取的值的范围值的范围不同，所能进行的操作进行的操作不同。28;.三、抽象数据类型三、抽象数据类型 (Abstract Data Type 简称简称ADT) 是指一个数学模型以及定义在此数学模型上的一组操作。是指一个数学模型以及定义在此数学模型上的一组操作。29;.例如，例如，抽象数据类型复数复数的定义：数据对象：数据对象： De1,e2e1,e2RealSet 数据关系：数据关系： R1 | e1是复数的实数部分 | e2 是复数的虚数部分 ADT Complex 30;.基本操作：基本操作： AssignComplex( &Z, v1, v2 )操作结果：构造复数 Z,其实部和虚部分别被赋以参数 v1 和 v2 的值。 DestroyComplex( &Z)操作结果：复数Z被销毁。 GetReal( Z, &realPart )初始条件：复数已存在。操作结果：用realPart返回复数Z的实部值。31;. GetImag( Z, &ImagPart )初始条件：复数已存在。操作结果：用ImagPart返回复数Z的虚部值。 Add( z1,z2, &sum )初始条件：z1, z2是复数。操作结果：用sum返回两个复数z1, z2 的和值。 ADT Complex32;.假设:z1和z2是上述定义的复数则 Add(z1, z2, z3) 操作的结果z3 = z1 + z2即为用户企求的结果33;.ADT 有两个重要特征:数据抽象数据抽象用ADT描述程序处理的实体时，强调的是其本质的特征本质的特征、其所能完成的功能其所能完成的功能以及它和外部用户的接口外部用户的接口（即外界使用它的方法外界使用它的方法）。数据封装数据封装将实体的外部特性和其内部实现细节分离外部特性和其内部实现细节分离，并且对外部用户隐藏对外部用户隐藏其内部实现其内部实现细节。细节。34;.抽象数据类型的描述方法抽象数据类型的描述方法抽象数据类型可用（D，S，P）三元组表示。其中：D 是数据对象； S 是 D 上的关系集； P 是对 D 的基本操作集。 35;.ADT 抽象数据类型名抽象数据类型名数据对象：数据对象：数据对象的定义数据关系：数据关系：数据关系的定义基本操作：基本操作：基本操作的定义 ADT 抽象数据类型名其中基本操作的定义格式为:基本操作名基本操作名（参数表）初始条件：初始条件：初始条件描述操作结果操作结果：操作结果描述 36;.赋值参数赋值参数只为操作提供输入值。引用参数引用参数以&打头，除可提供输入值外，还将返回操作结果。初始条件初始条件描述了操作执行之前数据结构和参数应满足的条件，若不满足，则操作失败，并返回相应出错信息。操作结果操作结果说明了操作正常完成之后，数据结构的变化状况和应返回的结果。若初始条件为空，则省略之。37;.抽象数据类型的表示和实现抽象数据类型的表示和实现抽象数据类型需要通过固有数据类型固有数据类型(高级编程语言中已实现的数据类型)来实现。例如，对以上定义的复数。38;.typedef struct float realpart； float imagpart；complex；/ -存储结构的定义存储结构的定义/ -基本操作的函数原型说明基本操作的函数原型说明void Assign( complex &Z, float realval, float imagval )；/ 构造复数 Z,其实部和虚部分别被赋以参数 / realval 和 imagval 的值39;.float GetReal( cpmplex Z )； / 返回复数 Z 的实部值float Getimag( cpmplex Z )； / 返回复数 Z 的虚部值void add( complex z1, complex z2, complex &sum )； / 以 sum 返回两个复数 z1, z2 的和 40;./ -基本操作的实现基本操作的实现void add( complex z1, complex z2, complex &sum ) / 以 sum 返回两个复数 z1, z2 的和 sum.realpart = z1.realpart + z2.realpart; sum.imagpart = z1.imagpart + z2.imagpart; 其它省略 41;.1.3 1.3 算法和算法的衡量算法和算法的衡量一、算法一、算法二、算法设计的原则二、算法设计的原则三、算法效率的衡量方法和准则三、算法效率的衡量方法和准则四、算法的存储空间需求四、算法的存储空间需求42;. 算法算法是为了解决某类问题而规定的一个有限长的操作序列操作序列。一个算法必须满足以下五五个重要特性特性：1 1有穷性有穷性 2 2确定性确定性 3 3可行性可行性4 4有输入有输入 5 5有输出有输出一、算法一、算法43;.1 1有穷性有穷性对于任意一组合法输入值，在执行有穷步骤有穷步骤之后一定能结束，即：算法中的每个步骤都能在有限时间有限时间内完成。 2 2确定性确定性对于每种情况每种情况下所应执行的操作，在算法中都有确切确切的规定，使算法的执行者或阅读者都能明确其含义及如何执行。并且在任何条件下，算法都只有一条执行路径。并且在任何条件下，算法都只有一条执行路径。44;.3 3可行性可行性算法中的所有操作都必须足够基本，都可以通过已经实现的基本操作运算有限次实现之。4 4有输入有输入作为算法加工对象的量值，通常体现为算法中的一组变量。有些输入量需要在算法执行过程中输入，而有的算法表面上可以没有输入，实际上已被嵌入算法之中。45;. 5 5有输出有输出它是一组与“输入”有确定关系的量值，是算法进行信息加工后得到的结果，这种确定关系即为算法的功能。46;.二、算法设计的原则二、算法设计的原则设计算法时，通常应考虑达到以下目标：1正确性正确性2. . 可读性可读性3健壮性健壮性4高效率与低存储量需求高效率与低存储量需求47;.1 1正确性正确性首先，首先，算法应当满足满足以特定的“规格说明规格说明”方式给出的需求需求。其次，其次，对算法是否“正确正确”的的理解可以有以下四个层次四个层次：a a程序中不含语法错误；b b程序对于几组输入数据能够得出满足要求的结果；48;. c c程序对于精心选择的、典型、苛刻且带有刁难性的几组输入数据能够得出满足要求的结果；程序对于精心选择的、典型、苛刻且带有刁难性的几组输入数据能够得出满足要求的结果；通常以第 c c 层意义的正确性作为衡量一个算法是否合格的标准。 d d程序对于一切合法的输入数据都能得出满足要求的结果；49;.2. . 可读性可读性算法主要是为了人的阅读与交流阅读与交流，其次才是为计算机执行，因此算法应该易于易于人的理解理解；另一方面，晦涩难读的程序易于隐藏较多错误而难以调试。50;.3健壮性健壮性当输入的数据非法非法时，算法应当恰当地作出反映或进行相应处理进行相应处理，而不是产生莫名奇妙的输出结果。并且，处理出错的方法处理出错的方法不应是中断程序的执行，而应是返回返回一个表示错误或错表示错误或错误性质的值误性质的值，以便在更高的抽象层次上进行处理。51;.4高效率与低存储量需求高效率与低存储量需求通常，效率指的是算法执行时间；存储量指的是算法执行过程中所需的最大存储空间，两者都与问题的规模有关。52;.三、算法效率的衡量方法和准则三、算法效率的衡量方法和准则通常有两种两种衡量算法效率的方法: 事后统计法事后统计法事前分析估算法事前分析估算法缺点：缺点：1必须执行程序 2其它因素掩盖算法本质53;.和算法执行时间时间相关的因素因素：1 1算法算法选用的策略的策略2 2问题的规模问题的规模3 3编写程序的语言语言4 4编译编译程序产生的机器代码的质量的质量5 5计算机计算机执行指令的速度的速度54;. 一个特定算法的算法的“运行工作量运行工作量”的大小，只依赖于问题的规模（通常用整数量n表示），或者说，它是问题规模的函是问题规模的函数数。55;. 假如，随着问题规模 n 的增长，算法执行时间的增长率和算法执行时间的增长率和 f(n) 的增长率相同的增长率相同，则可记作：T (n) = O(f(n)称称T (n) 为算法的为算法的(渐近)时间复杂度。时间复杂度。56;.如何估算如何估算算法的时间复杂度？算法的时间复杂度？57;.算法算法 = = 控制结构控制结构 + + 原操作原操作（固有数据类型的操作）算法的执行时间算法的执行时间 =原操作原操作(i)(i)的执行次数的执行次数原操作原操作(i)(i)的执行时间的执行时间算法的执行时间算法的执行时间与与原操作执行次数之和原操作执行次数之和成正比成正比 58;. 从算法中选取一种对于所研究的问题来说是基本操作基本操作的原操作，以该基本操作在算法在算法中重复执行的次数中重复执行的次数作为算法运行时间的衡量准则。59;.例例一一两两个个矩矩阵阵相相乘乘void mult(int a, int b, int& c ) / 以二维数组存储矩阵元素，c 为 a 和 b 的乘积 for (i=1; i=n; +i) for (j=1; j=n; +j) ci,j = 0; for (k=1; k=n; +k) ci,j += ai,k*bk,j; /for /mult基本操作: 乘法乘法操作时间复杂度: O(n3)60;.例例二二选选择择排排序序 void select_sort(int& a, int n) / 将将 a 中整数序列重新排列成自小至大有序的整数序列中整数序列重新排列成自小至大有序的整数序列。 / select_sort基本操作: 比较比较(数据元素)操作操作时间复杂度: O(n2)j = i; / 选择第选择第 i i 个最小元素个最小元素for ( k = i+1; k n; +k ) if (ak aj ) j = k;for ( i = 0; i1 & change; -i) / bubble_sort基本操作: 赋值赋值操作时间复杂度: O(n2) change = FALSE; / change 为元素进行交换标志 for (j=0; j aj+1) aj aj+1; change = TRUE ; / 一趟起泡62;.四、算法的存储空间需求四、算法的存储空间需求算法的空间复杂度定义为空间复杂度定义为: : 表示随着问题规模表示随着问题规模 n 的增大，的增大，算法运行所需存储量的增长率算法运行所需存储量的增长率与与 g(n) 的增长率相同。的增长率相同。S(n) = O(g(n)63;.算法的存储量算法的存储量包括:1输入数据输入数据所占空间2程序本身程序本身所占空间3辅助变量辅助变量所占空间64;. 若输入数据输入数据所占空间只取决于问题本身，和算法无关和算法无关，则只需要分析除输入和程序之外的辅助变量辅助变量所占额外额外空间空间。若所需额外空间相对于输入数据量来说是常数，则称此算法为原地工作原地工作。若所需存储量依赖于特定的输入，则通常按最坏情况考虑。65;.关于C与VC使用的一些注意问题1、主函数前一般需用无类型返回，即： void main()2、即使只用到了printf()函数或scanf()函数，也需要包含相应的头文件，即： #include 当然，你也可以使用C+的输入输出方式。66;.C+中的参数传递1、值参的传递2、通过指针方式进行参数传递3、通过引用参数进行参数传递具体方式详见例题。 67;.教材中的类C在转换成程序时需注意的方面：1、关于ElemType，是一个数据类型，但并不是C中所固有的数据类型，在实际运行时需对它重新加以定义，以适应具体问题的需要。2、教材中的算法都忽略了局部变量的定义，实际运行时应该予以补充。3、凡是函数中调用的库函数，都要先包含相应的头文件，若调用了用户自定义函数，则需对其进行定义。即不能调用尚不存在的函数。68;.关于3个常用的函数：头文件#include 1、malloc(字节数) ，返回值为指针2、free(指针变量）3、realloc(指针变量，字节数），返回值为指针，可复制参数中指针变量原有内存中的数据。请见例题中关于这三个函数的使用方式说明69;.1. 熟悉各名词、术语的含义，掌握基本概念。2. 理解算法五个要素的确切含义。本章学习要点本章学习要点3. 掌握计算语句频度和估算算法时间复杂度的方法。70;.