资源预览内容
第1页 / 共28页
第2页 / 共28页
第3页 / 共28页
第4页 / 共28页
第5页 / 共28页
第6页 / 共28页
第7页 / 共28页
第8页 / 共28页
第9页 / 共28页
第10页 / 共28页
亲,该文档总共28页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数据仓库与数据挖掘课程设计题目(数据挖掘分析报告)(如果题目过长,用两行显示)学生姓名李四一/张三二/李四二班级16级物联网1班成绩/ /指导教师(签字)工学院2017 年 6 月 9 日数据仓库与数据挖掘课程设计课程设计分工及成绩评定表分工情况说明学号姓名承担主要任务贡献等级第一行为该组组长,承担主要任务填写要详细,细化到二级目录。贡献由大到小依次为1、2、3、4 (贡献最大的为1,贡献最小的为4),要j求每一等级为1人/成绩评定表学号姓名考勤 (10%)报告 (60%)答辩成绩 (30%)分数 成绩总评 成绩/该表学号; 学生填写,和姓名列由其余不要填。打印时删除此标志丿目录一、建立数据仓库数据库结构和设置数据源 31. 任务描述 32. 建立数据仓库数据库 33. 设置数据源 3二、销售数据OLAP分析31. 任务描述 32. 设计星型架构多维数据集(Sales)33. 设计存储和数据集处理 54. OLAP 分析6三、人力资源数据OLAP分析61. 任务描述62. 设计父子维度的多维数据集(HR)73. 修改多维数据集(HR)的结构74. 设计存储和数据集处理 85. OLAP 分析8四、数据仓库及多维数据集其它操作81. 任务描述82. 设置数据仓库及多维数据集角色及权限 83. 查看元数据94. 创建对策105. 钻取116. 建立远程 Internet 连接12五、数据仓库高级操作121. 任务描述 122. 创建分区 133. 创建虚拟多维数据集 134. DTS 调度多维数据集处理145. 备份/还原数据仓库 15六、数据挖掘151. 任务描述 152. 创建揭示客户模式的决策树挖掘模型 153. 决策树挖掘结果分析 164. 创建聚类挖掘模型 175. 聚类挖掘结果分析 186. 创建基于关系数据表的决策树挖掘模型187. 浏览“相关性网络”视图 19一、建立数据仓库数据库结构和设置数据源1任务描述数据仓库数据库是将要在其中存放多维数据集、角色、数据源、共享维度和 挖掘模型的一种结构。然后跟预先设置好的ODBC数据源建立连接。2建立数据仓库数据库1)右击计算机f属性f计算机名f复制“ dzswl29,开始f Microsoft SQLServerAnalysis Servers f Analysis Manager;2)右击Analysis Servers, “注册服务器,粘贴服务器名“dzsw129”;3)展开树视图的 Analysis Servers 下的 dzsw129;4)单击服务器名或右击选择连接,与Analysis Servers建立连接;5)右击服务器名,然后单击“新建数据库”命令;6)在“数据库”对话框中输入数据库名“Winnie”,单击确定;7)展开刚创建的“Winnie”数据库,可看到如下项目:数据源、多维数据集、 共享维度、挖掘模型、数据库角色.-Jj Winnie*寒錐数据集井享维度+挖掘複型+薛数据库角色3. 设置数据源1)右击“Winnie”数据库下的“数据源”文件夹,然后单击“新数据源”命令;2)在“数据链接属性”对话框中,单击“提供程序”选项卡,选择“Microsoft OLEDB Provider for ODBC Drivers”;3)单击“连接”选项卡,选择建好的ODBC数据源“FoodMart 2000”;4)单击确定按钮关闭“数据链接属性”对话框。 OK!二、销售数据OLAP分析1任务描述以多维方式建立数据模型可简化联机业务分析,提高查询性能。通过创建多 维数据集, Analysis Manager 可将存储在关系数据库中的数据转换为具有实际含 义并且易于查询的业务信息。星型架构的多维数据集由一个事实数据表和链接到 该事实数据表的多个维度表组成。2 设计星型架构多维数据集(Saes)下面针对FoodMart2000超市1998年的销售业务数据,建立一个多维数据集, 以便按产品和顾客2 个主题展开分析。具体操作如下:1) 展开树窗格的“Winnie”,右击“多维数据集”,选择“新建多维数据集”一“向 导”菜单命令,打开如下“多维数据集向导”对话框。2) 向多维数据集添加度量值(事实) :3) 单击下一步, 在“从数据源中选择事实数据表”步骤中, 展开 “FoodMart2000” 数据源,然后单击 “sales_fact_1998”;4) 单击下一步,设置多维数据集的度量值列 : store_sales、store_cost、 unit_sales;5) 单击下一步,建立维度表。单击新建维度,打开“维度向导”对话框; 向多维数据集添加时间维:1) 选择维度类型为“星型架构:单个维度表”;2) 单击下一步,选择维度表“time_by_day”;3) 单击下一步,选择维度类型为“时间维度”;4) 单击下一步,选择时间级别为“年、季度、月”;5) 单击下一步,单击下一步,输入时间维名称:Time,并设为“共享”方式, 单击完成, OK! 向多维数据集添加产品维:1) 再次单击新建维度,打开“维度向导”对话框;2) 选择创建维度的方式为“雪花架构:多个相关维度表”;3) 单击下一步,选择维度表“Product”和“product_class”;4) 单击下一步,查看连接方式,在这里可删除不要的连接,添加需要的连 接;5) 单 击 下 一 步 , 依 次 选 择 product_category 、 product_subcategory 和 brand_name 三个维度级别;6) 单击下一步,指定成员键列步骤中,不需改变主键列;7) 单击下一步,在“高级选项”步骤中,根据需要选择;8) 单击下一步,输入产品维名称:Product,并设为“共享”方式,单击完成, OK! 向多维数据集添加客户维度:1) 再次单击新建维度,打开“维度向导”对话框;2) 选择创建维度的方式为“星型架构:单个维度表”3) 单击下一步,选择维度表“Customer”;4) 单击下一步,选择维度类型为“标准维度”;5) 单击下一步,依次选择 Country、State_Province、City 和 lname 四个维度 级别;6) 单击下一步,指定成员键列步骤中,不需改变主键列;7) 单击下一步,在“高级选项”步骤中,根据需要选择;8)单击下一步,输入客户维名称:Customer,并设为“共享”方式,单击完 成, OK! 向多维数据集添加商店维:1) 再次单击新建维度,打开“维度向导”对话框;2) 选择创建维度的方式为“星型架构:单个维度表”;3) 单击下一步,选择维度表“Store”;4) 单击下一步,选择维度类型为“标准维度”;5) 单击下一步,依次选择 store_country、store_state、store_city 和 store_name 四个维度级别;6) 单击下一步,指定成员键列步骤中,不需改变主键列;7) 单击下一步,在“高级选项”步骤中,根据需要选择;8) 单击下一步,输入商店维名称:Store,并设为“共享”方式,单击完成, OK! 生成多维数据集:1) 回到多维数据集向导对话框,这里已 到了新建的4个维度;蛊錐数据集錐度迄:岀T恥 .rroiluct.Cue ton er2) 单击下一步,在“是否计算事实数据表行数提问时,单击是,开始计算。3) 计算完成后,命名多维数据集为:Sales,单击完成,0K!4) 关闭向导,随之启动多维数据集编辑器,其中可看到刚刚创建的多维数据 集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子二CUE tOTitf爭晦鼠皓毘a: |s=jt件 幅輯足)ffla *a,4)工目 w 冋电 I3 s*i*= 曰堆度Bl貼口皿+ ProductBl応 CiTtcfler BJ-i Stere 三空迪IS即 Sicfw SL 坤 StvrK Coal 峠 Unit SJ.es 计算.Ej谒 丄计fl:单元 j_J松呂乘亠仝丄I城诃寺.听pr dw=L pr oduct pr ndiLct pr DlLCt pr oductcl X_3 xuliciL E kt*T Lp kt tn fanilEfllAE fflCt t99fiproduc t_i d.4. a ri_3 d cn.-i.tonw_a d prcnation_id5 tore_id slor:_s41es5 tore_cosl inti t.sales亡址畐I ort ar _i ii C ED-ailt_71Ul Lam ansddr tssl oddrtsiZ ftddr tst3 &jd.dr E5 5 ci tvtill i_bf_d.ii.ftkB_dxh.B LL_dxy tka_n until tht_re m* Hay_ofEth vctt_o_yie srijuarter tisil_iuL4iiparaiiai:!.pr hiIpu L_cl hs c_l pr hcIpu t_i d hr uii3_nHins pun dnE h. Jisjns SEUSBTpr 05 5_VC L Ct Jiet_ei fht r cycl ftbl j scl lov_f4t 向多维数据集 Sales 中添加维度:1)选择“插入|表”菜单命令,弹出“选择表”对话框;2)选择“promotion”表,单击添加,然后单击“关闭”;3)右击“promotion”表中的“promotion_name”列,然后选择“作为维度插入”命令, 一个名为“promotion Name”的维度就建好了,该维度为非共享的。4)在树窗格中重命名刚插入的维度为“Promotion”。5)关闭编辑器,保存修改。3设计存储和处理多维数据集1)展开树窗格,右击“Sales”多维数据集,选择“设计存储”菜单命令,弹出“存 储设计向导”对话框;也可在多维数据集编辑窗口中选择“工具设计存储” 菜单命令,打开“存储设计向导”对话框;2)单击下一步,然后选择“MOLAP”作为数据存储类型;3)单击下一步,设置聚合选项为“性能提升达到”,并输入“40”作为指定百 分比,以此优化能力平衡查询性能和存储空间大小。4)单击开始,完成后可看到“性能与大小”图,从
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号