资源预览内容
第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
第9页 / 共10页
第10页 / 共10页
亲,该文档总共10页全部预览完了,如果喜欢就下载吧!
资源描述
实验二:生成目标邮件方案Adventure Works 的市场部希望通过向特定客户发送邮件的方式来提高销售量。公司希 望通过调查已知客户的特性来找到可应用于潜在客户的模式。公司希望使用已发现的模式来 预测哪些潜在客户最有可能购买自己的产品。此外,市场部还希望在公司数据库的现有客户当中发现所有逻辑分组,例如具有相似的人数 统计标准和购买模式的客户。公司的数据库 Adventure Works DW 包含一个现有客户列表和一个潜在的新客户列表。 在本课程中,您将创建一个目标邮件方案。完成本课程中的任务之后,您便会具有: 一组挖掘模型,这些模型能够提供潜在客户列表中最有可能购买产品的客户的建议。当前客户的聚类分析。若要完成本课程中的任务,您需要使用Microsoft Naive Bayes算法、Microsoft决策 树算法和Mic rosoft聚类分析算法(An alysis Ser vices -数据挖掘)。本课程包含以下主题: 创建目标邮件挖掘模型结构(数据挖掘教程) 创建目标邮件方案的第一步是使用 Business Intelligence Development Studio 中的 数据挖掘向导创建新的挖掘结构和决策树挖掘模型。在本教程中,您将创建数个基于这种初始挖掘结构的模型。第一个模型将在您完成该向导时 与结构一起创建,且基于 Microsoft 决策树算法。创建用于目标邮件方案的挖掘结构1. 在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向 导。2. 在“欢迎使用数据挖掘向导”页上,单击“下一步”。3. 在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”。4. 在“创建数据挖掘结构”页的“您要使用何种数据挖掘技术? ”下,选择“Microsoft决 策树”。注意:如果收到警告,告知无法找到数据挖掘算法,则项目属性可能配置不正确。当项目尝试从 An alysis Ser vices服务器检索数据挖掘算法列表,但却无法找到服务器时,就会出现此 警告。默认情况下,BI Development Studio会将本地主机用作服务器。如果要使用其 他实例或命名实例,则必须更改项目属性。5. 单击“下一步”。6. 在“选择数据源视图”页上,请注意已默认选中Adventure Works DW 在数据源视图 中,单击“浏览”查看各表,然后单击“关闭”返回该向导。7. 单击“下一步”。8. 在“指定表类型”页上,选中 vTargetMail 表旁边“事例”列中的复选框,再单击“下一 步”。9. 在“指定定型数据”页上,确保已选中 CustomerKey 列旁边 Key 列中的复选框。 如果数据源视图中的源表表示一个键,则数据挖掘向导将自动选择该列作为模型的键。10. 选中 BikeBuyer 列旁边的“输入”和“可预测”。11. 单击“建议”打开“提供相关列建议”对话框。只要选中至少一个可预测属性,即可启用“建议”按钮。“提供相关列建议”对话框将列出 与可预测列关联最密切的列,并按照与可预测属性的相互关系对属性进行排序。值大于0.05 的列将被自动选中,以包括在模型中。12. 阅读建议,然后单击“取消”忽略建议并保留向导设置的原始值。S注意:如果单击“确定”,将使用所有列出的建议,并将选定的列标记为向导中的输入列。如果仅 同意其中的某些建议,则必须手动更改值。13. 选中以下各列旁边的“输入”复选框: Age CommuteDistance EnglishEducation EnglishOccupation FirstName Gender GeographyKey HouseOwnerFlag LastName MaritalStatus NumberCarsOwned NumberChildrenAtHome Region TotalChildren YearlyIncome14. 单击“下一步”。15. 在“指定列的内容和数据类型”页上,单击“检测”以运行对数值数据进行取样并确定数值 列是否包含连续或离散值的算法。例如,某列可包含薪金信息,用以作为连续的实际薪 金值,也可包含整数,用以表示离散的编码薪金范围(例如1 = $25,000;2 =从 $25,000 到 $50,000)。16. 单击“检测”后,请查看“内容类型”和“数据类型”列中的各项;如有必要,请进行更改, 以确保设置与下表所示一致。通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。例如, GeographyKey 应作为文本处理,因为对此标识符进行数学 运算是不对的。列内容类型数据类型AgeContinuousLongBikeBuyerDiscreteLongCommuteDistanceDiscreteTextCustomerKeyKeyLongEnglishEducationDiscreteTextEnglishOccupationDiscreteTextFirstNameDiscreteTextGenderDiscreteTextGeographyKeyDiscreteTextHouseOwnerFlagDiscreteTextLastNameDiscreteTextMaritalStatusDiscreteTextNumberCarsOwnedDiscreteLongNumberChildrenAtHomeDiscreteLongRegionDiscreteTextTotalchildrenDiscreteLongYearlyIncomeContinuousDouble17.单击“下一步”。18.在“将数据拆分为定型集和测试集 ”页上,对于“测试数据百分比”,请保留默认值 30。19.对于“测试数据集中的最大事例数”,请键入 1000。单击“下一步”。20.在“完成向导”页上的“挖掘结构名称”中,键入 Targeted Mailing。21.在“挖掘模型名称”中,键入 TM_Decision_Tree。22.选中“允许钻取”复选框。23.单击“完成”。修改目标邮件模型(数据挖掘教程) 您在上一任务中创建的初始挖掘结构包含一个基于 Microsoft 决策树算法的单一挖掘模型 在本任务中,将使用数据挖掘设计器的“挖掘模型”选项卡定义两个附加模型。您将使用 Naive Bayes 算法和聚类分析算法来创建模型。-创建Microsoft聚类分析模型口创建聚类分析挖掘模型1. 切换到 Business Intelligence Development Studio 中数据挖掘设计器的“挖掘模 型”选项卡。请注意,设计器显示两列,一列是挖掘结构,另一列是在本课程的上一任务中创建的初 始挖掘模型。2. 右键单击“结构”列,选择“新建挖掘模型”。此时,系统将打开“新建挖掘模型”对话框。3. 在“模型名称”中,键入 TM_Clustering。4. 在“算法名称”中,选择“Microsoft聚类分析”。5. 单击“确定”。新模型将显示在数据挖掘设计器的“挖掘模型”选项卡中。使用 Microsoft 聚类分析算法生 成的模型可对连续属性和离散属性进行分类和预测。虽然您可以修改新模型的列用法和属性 但在本教程中不需要对 TM_Clustering 模型进行任何更改。创建 Microsoft Naive Bayes 模型-创建Naive Bayes模型1. 在数据挖掘设计器的“挖掘模型”选项卡中,右键单击“结构”列,并选择“新建挖掘模型”。 此时,系统将打开“新建挖掘模型”对话框。2. 在“模型名称”中,键入 TM_NaiveBayes。3. 在“算法名称中,选择Microsoft Naive Bayes。单击“确定”。此时将显示一条消息,说明 Microsoft Naive Bayes 算法不支持 Age、Geography Key 和 Yearly Income 列,这些都是连续列。若要在 Naive Bayes 模型中使用 这些列,必须对其进行离散化。在本教程中,将忽略这些列。4. 单击“是”,以确认此消息并继续下面的操作。 此时在“挖掘模型”选项卡中将显示新模型。虽然您可以在此选项卡中修改所有模型的列用 法和属性,但在本教程中不需要对 TM_NaiveBayes 模型进行任何更改。处理挖掘模型现在,挖掘模型的结构和参数都已完成设置,可以部署并处理模型了。-部署项目并处理挖掘模型1. 在“调试”菜单上选择“启动调试”。也可按 F5 启动调试。Analysis Services 数据库将部署到服务器上,而挖掘模型也将得到处理。 如果数据库已经部署到服务器上,则可以使用下列步骤仅处理挖掘模型。口在项目已部署完成时处理挖掘模型1. 在 BI Development Studio 的“挖掘模型”菜单上,单击“处理挖掘结构和所有模型”。 “处理挖掘结构 - 目标邮件”对话框打开。2. 单击“运行”。 此时,系统将打开“处理进度”对话框,以显示有关模型处理的信息。模型处理可能需要 一些时间,具体取决于您的计算机。3. 处理完毕后,在“处理进度”和“处理挖掘结构 - 目标邮件”对话框中单击“关闭”。浏览目标邮件模型(数据挖掘教程) 处理了项目中的模型后,可使用数据挖掘设计器中的“挖掘模型查看器”选项卡查看这些模 型。可使用该选项卡顶部的“挖掘模型”列表检查挖掘结构中的各个模型。下列各部分说明了在查看器中浏览挖掘模型的方式。Microsoft决策树模型当您为 Adventure Works DM 教程项目切换到“挖掘模型查看器”选项卡时,默认情况下, 该设计器将打开已添加到结构中的第一个模型。可以通过从“挖掘模型”列表中选择模型名 称来查看不同的模型。用于在 Analysis Services 中生成模型的每种算法将返回不同类型的结果。因此,An alysis Se rvices为每个算法提供了单独的查看器。An alysis Ser vices还提供了一个 适用于所有模型类型的一般查看器。当您从列表中选择某个挖掘模型时,系统会使用该模型的相应查看器,在“挖掘模型查看器” 选项卡上显示该模型。在本例中,对于决策树模型,使用的是Microsoft树查看器。此查 看器包含两个选项卡,即“决策树”和“依赖关系网络”。决策树 在“决策树”选项卡上,可以检查构成挖掘模型的所有树模型。由于本教程项目中的目标邮 件模型仅包含单个可预测属性(Bike Buyer),所以只需查看一个树。如果存在更多树, 则可以使用“树”框来选择其他树。默认情况下, Microsoft 树查看器仅显示树的前三个级别。如果树级别不到三个,则查看器 仅显示现有级别。可以使用“显示级别”滑块或“默认扩展”列表查看更多级别。有关如何配 置查看器的详细信息,请参阅使用Microsoft树查看器查看挖掘模型。修改树1. 将“显示级别”滑块滑动到 5。2. 将“背景”列表更改为 1。通过更改“背景”设置,可以迅速查看每个节点中 Bike Buyer 值为 1 的事例的数量。 请注意,在这种特定的情况下,每个事例均表示一个客户。值 1 指示该客户之前购买了 自行车;值
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号