资源预览内容
第1页 / 共12页
第2页 / 共12页
第3页 / 共12页
第4页 / 共12页
第5页 / 共12页
第6页 / 共12页
第7页 / 共12页
第8页 / 共12页
第9页 / 共12页
第10页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数据仓库技术数据仓库技术信管信管0701 HT数据仓库技术什么是数据仓库什么是数据仓库数据仓库的产生数据仓库的产生新一代数据仓库的发展趋势新一代数据仓库的发展趋势总结总结什么是数据仓库u概念概念 数据仓库概念创始人数据仓库概念创始人W.H.Inmon在在建立数据建立数据仓库仓库一书中对数据仓库的定义是:数据仓库就是一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、不可更新的面向主题的、集成的、不可更新的(稳定性稳定性)、随时、随时间不断变化(不同时间)的数据集合,用以支持经间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用相对应。主题,与传统数据库面向应用相对应。 数据仓库作为数据仓库作为DSS的有效解决方案,涉及的有效解决方案,涉及3方方面的技术内容:数据仓库技术、联机分析处理技术面的技术内容:数据仓库技术、联机分析处理技术和数据挖掘技术。和数据挖掘技术。 u特征特征 一、面向主题一、面向主题(Subject Oriented)的数据集合的数据集合 二、集成二、集成(Integrated)的数据集合的数据集合 三、时变三、时变(Time Variant)的数据集合的数据集合 四、非易失四、非易失(Nonvolatile)的数据集合的数据集合 数据仓库最根本的特点是数据仓库最根本的特点是物理地存放数据物理地存放数据,而且这些数据并不是最新的、专有的,而是而且这些数据并不是最新的、专有的,而是来源于来源于其它数据库的其它数据库的。数据仓库的建立并不是要取代数据。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基库,它要建立在一个较全面和完善的信息应用的基础上,础上,用于支持高层决策分析用于支持高层决策分析,而事务处理数据库,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。在企业的信息环境中承担的是日常操作性的任务。u类型类型 一、企业数据仓库(一、企业数据仓库(EDW) 企业数据仓库为通用数据仓库,它既含有大量详细的数据,企业数据仓库为通用数据仓库,它既含有大量详细的数据,也含有大量累赘的或聚集的数据,这些数据具有不易改变也含有大量累赘的或聚集的数据,这些数据具有不易改变性和面向历史性。性和面向历史性。 二、操作型数据库(二、操作型数据库(ODS) 操作型数据库既可以被用来针对工作数据做决策支持,又操作型数据库既可以被用来针对工作数据做决策支持,又可用做将数据加载到数据仓库时的过渡区域。可用做将数据加载到数据仓库时的过渡区域。 三、数据市集(三、数据市集(DataMart) 数据市集是数据仓库的一种具体化,它可以包含轻度累计、数据市集是数据仓库的一种具体化,它可以包含轻度累计、历史的部门数据,适合特定企业中某个部门的需要。历史的部门数据,适合特定企业中某个部门的需要。 数据仓库的产生最初的数据管理形式主要是文件系统,少量的以最初的数据管理形式主要是文件系统,少量的以数据片段之间增加一些关联和语义而构成层次或数据片段之间增加一些关联和语义而构成层次或网状数据库,但数据的访问必须依赖于特定的程网状数据库,但数据的访问必须依赖于特定的程序,数据的存取方式是固定的、死板的。到了序,数据的存取方式是固定的、死板的。到了1969年,年,E.F.Codd博士发表了他著名的关系数据博士发表了他著名的关系数据模型的论文。此后,关系数据库的出现开创了数模型的论文。此后,关系数据库的出现开创了数据管理的一个新时代。据管理的一个新时代。近几十年来,大量新技术、新思路的涌现出来并近几十年来,大量新技术、新思路的涌现出来并被用于关系型数据库系统的开发和实现:客户被用于关系型数据库系统的开发和实现:客户/服服务器系统结构、存储过程、多线索并发内核、异务器系统结构、存储过程、多线索并发内核、异步步I/O、代价优化,等等,这一切足以使得关系数、代价优化,等等,这一切足以使得关系数据库系统的处理能力毫不逊色于传统封闭的数据据库系统的处理能力毫不逊色于传统封闭的数据库系统。而关系数据库在访问逻辑和应用上所带库系统。而关系数据库在访问逻辑和应用上所带来的好处则远远不止这些,来的好处则远远不止这些,SQL的使用已成为一的使用已成为一个不可阻挡的潮流,加上近些年来计算机硬件的个不可阻挡的潮流,加上近些年来计算机硬件的处理能力呈数量级的递增,关系数据库最终成为处理能力呈数量级的递增,关系数据库最终成为联机事务处理系统的主宰。联机事务处理系统的主宰。整个整个80年代直到年代直到90年代初,联机事务处理一直是年代初,联机事务处理一直是数据库应用的主流。当联机事务处理系统应用到数据库应用的主流。当联机事务处理系统应用到一定阶段后,用户便发现单靠拥有联机事务处理一定阶段后,用户便发现单靠拥有联机事务处理已经不足以获得市场竞争的优势,他们需要对其已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的情况进自身业务的运作以及整个市场相关行业的情况进行分析,而做出有利的决策,于是出现了基于业行分析,而做出有利的决策,于是出现了基于业务数据的决策分析,我们把它称为联机分析处理。务数据的决策分析,我们把它称为联机分析处理。事实上,将大量的业务数据应用于分析和统计原事实上,将大量的业务数据应用于分析和统计原本是一个非常简单和自然的想法。但在实际的操本是一个非常简单和自然的想法。但在实际的操作中,人们却发现要获得有用的信息并非如想象作中,人们却发现要获得有用的信息并非如想象的那么容易。针对这一问题,人们设想专门为业的那么容易。针对这一问题,人们设想专门为业务的统计分析建立一个务的统计分析建立一个数据中心数据中心。这个数据中心。这个数据中心是一个联机的系统,它是专门为分析统计和决策是一个联机的系统,它是专门为分析统计和决策支持应用服务的,通过它可以满足决策支持和联支持应用服务的,通过它可以满足决策支持和联机分析应用所要求的一切。这个数据中心就叫做机分析应用所要求的一切。这个数据中心就叫做数据仓库数据仓库。 新一代数据仓库的发展趋势严格的投资回报率评估严格的投资回报率评估 整合数据集市整合数据集市 增加更多的分析增加更多的分析 CRM与数据仓库之间的整合与数据仓库之间的整合 动态数据仓库动态数据仓库 总结随着随着90年代后期年代后期Internet 的兴起与飞速发展,我的兴起与飞速发展,我们进入了一个新的时代,大量的信息和数据,迎们进入了一个新的时代,大量的信息和数据,迎面而来,用科学的方法去整理数据,从而从不同面而来,用科学的方法去整理数据,从而从不同视角对企业经营各方面信息的精确分析、准确判视角对企业经营各方面信息的精确分析、准确判断,比以往更为迫切断,比以往更为迫切,实施商业行为的有效性也比实施商业行为的有效性也比以往更受关注。以往更受关注。相信数据仓库技术在未来会得到更好的发展!相信数据仓库技术在未来会得到更好的发展!谢谢!谢谢!
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号