资源预览内容
第1页 / 共24页
第2页 / 共24页
第3页 / 共24页
第4页 / 共24页
第5页 / 共24页
第6页 / 共24页
第7页 / 共24页
第8页 / 共24页
第9页 / 共24页
第10页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
*数据仓库维度建模培训宜昌艾福斯软件公司主讲:陈曦*议程 09:0010:00 维度建模的基本步骤 10:0010:10 休息 10:1011:30 建模步骤的实例解析*数据仓库维度建模*学习目的 在课程结束后应该知道: 数据仓库维度建模分哪几个步骤? 每个步骤都有哪些原则,和哪些误区? 掌握维度建模方法 ? 维度表属性在维度模型中起到什么样的作用? Kimball极力反对哪些建模方法?*一个比喻比喻: 如果将数据仓库建设看作是一个高楼大厦建造过程的话 数据仓库维度建模就是大厦的框架建设工作 数据仓库ETL过程,就是为大厦添砖加瓦的过程 优秀数据访问工具则是大厦整体装修的最佳工具 框架的重要性 地基打多深决定大厦能做多高。 钢筋混凝土结构还是刚结构决定了大厦的稳定性 维度建模是数据仓库框架建设的重要技术*维度建模四步曲 四步维度建模步骤: 1.选取要建模的业务流程 2.定义业务流程中的数据粒度 3.选定用于每个事实表行的维度 4.确定用于形成每个事实表行的数字型事实*四步曲1.选取业务流程 误区: 不针对业务流程而针对业务部门进行维度建模 将注意力放在业务部门身上,而不关注业务流程 为某个部门建立单独的维度模型 原则: 针对业务流程进行维度建模 确保某个业务流程中的核心数据只被抽取一次 保证数据仓库中业务数据一致性*四步曲2.定义粒度(1)粒度的解释: 粒度传递了同事实表度量值相联系的细节所达到的程度方 面的信息。 简单的说,反映了事实表的明细程度 粒度举例: 超市小票上的购物清单 医生的处方药品清单 仓库每种产品库存值的月快照 误区: 数据仓库团队经常绕过这个看似不必要的步骤 一个不合适的粒度定义将会使维度建模感觉无从下手*四步曲2.定义粒度(2) 原则: 优先考虑具有原子粒度的业务信息,这些数据不 能再做进一步的细分 数据仓库中存储汇总的、概要性的数据主要是基 于数据库性能上的考虑 汇总数据不能成为最底层细节数据的替代品*四步曲3.选定维度 误区: 没有定义粒度就开始选定维度 原则: 在粒度确认后,选取能从各个角度,充分描述问 题的维度 为每个维度添加丰富的维度属性 示例: 常见维度包括日期、产品、顾客、事务类型和状 态*四步曲4.确定事实 误区: 没有第2步的粒度确认,就开始确定事实 将含有不同粒度的事实放在了同一个事实表中 原则: 确定用于形成每个事实表行的数字可加型事实 在需求调研时我们可以通过提出“您需要对哪些 指标进行统计?”这样的问题来确定事实。 具有不同粒度的事实必须放在不同的事实表中 事实一般在各维度上都有良好的可加性*四步曲总结 维度建模总原则: 数据驱动和需求驱动相结合维度模型维度模型 1.1.业务处理业务处理 2.2.粒度粒度 3.3.维度维度 4.4.事实事实业务需求业务需求实际数据实际数据*零售业案例背景 背景: 设想一下在一家大型杂货连锁店,其业务覆盖分 布在美国5个州范围内的100多家杂货店。 每个商店都有完整的配套部门,包括各类人员, 并有大致60000多个品种的产品放在货架上。 各杂货店的POS系统记录了每位顾客交易详的细 信息 定价与促销是管理层重要决策之一 如何使各种形式的促销活动所产生的效能清晰可 见?*实例1.选取业务流程 选取业务流程: 你能列出该连锁店急待解决的问题吗? 是否有系统能提供解决问题所需要的数据? 该系统对应的业务流程你清楚吗? 注意: 建立的第一个维度模型应该是一个最有影响的模 型,即它应该能对最紧迫的业务问题做出正面回 答,并且要保证有足够的操作型数据源的支持。*实例2.定义粒度 定义粒度: 你还记得刚才的粒度定义原则吗? 在这个连锁店我们应该使用什么样的粒度?即事 实表要详细到什么程度?*实例3.选定维度选定维度: 如何得出基本维度? 什么是附加维度? 通过粒度的判断我们可以得出事实表的基本维度为:日期、 产品、商店与促销日期维度日期关键字(PK) 待定日期属性商场维度商场关键字(PK) 待定商场属性产品维度产品关键字(PK) 待定产品属性促销维度促销关键字(PK) 待定促销属性POS零售营销事务事实日期关键字(FK) 产品关键字(FK) 商场关键字(FK) 促销关键字(FK) POS事务编号 待定事实*实例4.确定事实确定事实: 是否还记得确定事实的基本原则? 按照基本原则你认为事实表中应该包含哪些事实? 是否应该在事实表中存放计算列? 实例中事实应包括销售量、销售额与成本价,当然也可 以包括毛利润日期维度日期关键字(PK) 待定日期属性商场维度商场关键字(PK) 待定商场属性产品维度产品关键字(PK) 待定产品属性促销维度促销关键字(PK) 待定促销属性POS零售营销事务事实日期关键字(FK) 产品关键字(FK) 商场关键字(FK) 促销关键字(FK) POS事务编号 销售量 销售额 成本额 毛利润金额*维度表属性 添加维度表属性 这是维度建模的最后修补工作 增加的维度属性会为用户带来更多的查询条件 丰富的维度属性将使查询变得更加灵活*维度表属性日期维度 日期维度属性 是否还可以列出其它属性日期维度日期关键字(PK) 日期 星期 日历周结束日期 日历月 日历年月 日历季度 日历年季度 日历半年度 节假日指示符 。及其它*维度表属性产品维度 产品维度属性 是否还可以列出其它属性产品维度产品关键字(PK) 产品描述 SKU编号 商标描述 子类描述 分类描述 部门描述 包装类型 包装尺寸 含脂量 。及其它*维度表属性商场维度 商场维度属性 是否还可以列出其它属性商场维度商场关键字(PK) 商场名称 商场编号 商场所在行政区 商场所在地区 首次开业日 最后重修日 。及其它*维度表属性促销维度 促销维度属性 是否还可以列出其它属性促销维度促销关键字(PK) 促销名称 促销媒体类型 促销开始日期 促销结束日期 。及其它*Kimbal极力反对的做法 极力反对的做法 维度模型的规范化处理(雪花模型) 事实表拥有太多的维度*谢谢大家!
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号