实验二目标客户邮件方案-

实验二：生成目标邮件方案Adventure Works 的市场部希望通过向特定客户发送邮件的方式来提高销售量。公司希望通过调查已知客户的特性来找到可应用于潜在客户的模式。公司希望使用已发现的模式来预测哪些潜在客户最有可能购买自己的产品。此外，市场部还希望在公司数据库的现有客户当中发现所有逻辑分组，例如具有相似的人数统计标准和购买模式的客户。公司的数据库 Adventure Works DW 包含一个现有客户列表和一个潜在的新客户列表。在本课程中，您将创建一个目标邮件方案。完成本课程中的任务之后，您便会具有：一组挖掘模型，这些模型能够提供潜在客户列表中最有可能购买产品的客户的建议。当前客户的聚类分析。若要完成本课程中的任务，您需要使用Microsoft Naive Bayes算法、Microsoft决策树算法和Mic rosoft聚类分析算法（An alysis Ser vices -数据挖掘）。本课程包含以下主题：创建目标邮件挖掘模型结构（数据挖掘教程）创建目标邮件方案的第一步是使用 Business Intelligence Development Studio 中的数据挖掘向导创建新的挖掘结构和决策树挖掘模型。在本教程中，您将创建数个基于这种初始挖掘结构的模型。第一个模型将在您完成该向导时与结构一起创建，且基于 Microsoft 决策树算法。创建用于目标邮件方案的挖掘结构1. 在解决方案资源管理器中，右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。2. 在“欢迎使用数据挖掘向导”页上，单击“下一步”。3. 在“选择定义方法”页上，确保已选中“从现有关系数据库或数据仓库”，再单击“下一步”。4. 在“创建数据挖掘结构”页的“您要使用何种数据挖掘技术？ ”下，选择“Microsoft决策树”。注意：如果收到警告，告知无法找到数据挖掘算法，则项目属性可能配置不正确。当项目尝试从 An alysis Ser vices服务器检索数据挖掘算法列表，但却无法找到服务器时，就会出现此警告。默认情况下，BI Development Studio会将本地主机用作服务器。如果要使用其他实例或命名实例，则必须更改项目属性。5. 单击“下一步”。6. 在“选择数据源视图”页上，请注意已默认选中Adventure Works DW 在数据源视图中，单击“浏览”查看各表，然后单击“关闭”返回该向导。7. 单击“下一步”。8. 在“指定表类型”页上，选中 vTargetMail 表旁边“事例”列中的复选框，再单击“下一步”。9. 在“指定定型数据”页上，确保已选中 CustomerKey 列旁边 Key 列中的复选框。如果数据源视图中的源表表示一个键，则数据挖掘向导将自动选择该列作为模型的键。10. 选中 BikeBuyer 列旁边的“输入”和“可预测”。11. 单击“建议”打开“提供相关列建议”对话框。只要选中至少一个可预测属性，即可启用“建议”按钮。“提供相关列建议”对话框将列出与可预测列关联最密切的列，并按照与可预测属性的相互关系对属性进行排序。值大于0.05 的列将被自动选中，以包括在模型中。12. 阅读建议，然后单击“取消”忽略建议并保留向导设置的原始值。S注意：如果单击“确定”，将使用所有列出的建议，并将选定的列标记为向导中的输入列。如果仅同意其中的某些建议，则必须手动更改值。13. 选中以下各列旁边的“输入”复选框： Age CommuteDistance EnglishEducation EnglishOccupation FirstName Gender GeographyKey HouseOwnerFlag LastName MaritalStatus NumberCarsOwned NumberChildrenAtHome Region TotalChildren YearlyIncome14. 单击“下一步”。15. 在“指定列的内容和数据类型”页上，单击“检测”以运行对数值数据进行取样并确定数值列是否包含连续或离散值的算法。例如，某列可包含薪金信息，用以作为连续的实际薪金值，也可包含整数，用以表示离散的编码薪金范围（例如1 = $25,000；2 =从 $25,000 到 $50,000）。16. 单击“检测”后，请查看“内容类型”和“数据类型”列中的各项；如有必要，请进行更改，以确保设置与下表所示一致。通常，向导会检测数值，并分配相应的数值数据类型；但有些情况下，您可能想要将数值作为文本处理。例如， GeographyKey 应作为文本处理，因为对此标识符进行数学运算是不对的。列内容类型数据类型AgeContinuousLongBikeBuyerDiscreteLongCommuteDistanceDiscreteTextCustomerKeyKeyLongEnglishEducationDiscreteTextEnglishOccupationDiscreteTextFirstNameDiscreteTextGenderDiscreteTextGeographyKeyDiscreteTextHouseOwnerFlagDiscreteTextLastNameDiscreteTextMaritalStatusDiscreteTextNumberCarsOwnedDiscreteLongNumberChildrenAtHomeDiscreteLongRegionDiscreteTextTotalchildrenDiscreteLongYearlyIncomeContinuousDouble17.单击“下一步”。18.在“将数据拆分为定型集和测试集 ”页上，对于“测试数据百分比”，请保留默认值 30。19.对于“测试数据集中的最大事例数”，请键入 1000。单击“下一步”。20.在“完成向导”页上的“挖掘结构名称”中，键入 Targeted Mailing。21.在“挖掘模型名称”中，键入 TM_Decision_Tree。22.选中“允许钻取”复选框。23.单击“完成”。修改目标邮件模型（数据挖掘教程）您在上一任务中创建的初始挖掘结构包含一个基于 Microsoft 决策树算法的单一挖掘模型在本任务中，将使用数据挖掘设计器的“挖掘模型”选项卡定义两个附加模型。您将使用 Naive Bayes 算法和聚类分析算法来创建模型。-创建Microsoft聚类分析模型口创建聚类分析挖掘模型1. 切换到 Business Intelligence Development Studio 中数据挖掘设计器的“挖掘模型”选项卡。请注意，设计器显示两列，一列是挖掘结构，另一列是在本课程的上一任务中创建的初始挖掘模型。2. 右键单击“结构”列，选择“新建挖掘模型”。此时，系统将打开“新建挖掘模型”对话框。3. 在“模型名称”中，键入 TM_Clustering。4. 在“算法名称”中，选择“Microsoft聚类分析”。5. 单击“确定”。新模型将显示在数据挖掘设计器的“挖掘模型”选项卡中。使用 Microsoft 聚类分析算法生成的模型可对连续属性和离散属性进行分类和预测。虽然您可以修改新模型的列用法和属性但在本教程中不需要对 TM_Clustering 模型进行任何更改。创建 Microsoft Naive Bayes 模型-创建Naive Bayes模型1. 在数据挖掘设计器的“挖掘模型”选项卡中，右键单击“结构”列，并选择“新建挖掘模型”。此时，系统将打开“新建挖掘模型”对话框。2. 在“模型名称”中，键入 TM_NaiveBayes。3. 在“算法名称中，选择Microsoft Naive Bayes。单击“确定”。此时将显示一条消息，说明 Microsoft Naive Bayes 算法不支持 Age、Geography Key 和 Yearly Income 列，这些都是连续列。若要在 Naive Bayes 模型中使用这些列，必须对其进行离散化。在本教程中，将忽略这些列。4. 单击“是”，以确认此消息并继续下面的操作。此时在“挖掘模型”选项卡中将显示新模型。虽然您可以在此选项卡中修改所有模型的列用法和属性，但在本教程中不需要对 TM_NaiveBayes 模型进行任何更改。处理挖掘模型现在，挖掘模型的结构和参数都已完成设置，可以部署并处理模型了。-部署项目并处理挖掘模型1. 在“调试”菜单上选择“启动调试”。也可按 F5 启动调试。Analysis Services 数据库将部署到服务器上，而挖掘模型也将得到处理。如果数据库已经部署到服务器上，则可以使用下列步骤仅处理挖掘模型。口在项目已部署完成时处理挖掘模型1. 在 BI Development Studio 的“挖掘模型”菜单上，单击“处理挖掘结构和所有模型”。 “处理挖掘结构 - 目标邮件”对话框打开。2. 单击“运行”。此时，系统将打开“处理进度”对话框，以显示有关模型处理的信息。模型处理可能需要一些时间，具体取决于您的计算机。3. 处理完毕后，在“处理进度”和“处理挖掘结构 - 目标邮件”对话框中单击“关闭”。浏览目标邮件模型(数据挖掘教程) 处理了项目中的模型后，可使用数据挖掘设计器中的“挖掘模型查看器”选项卡查看这些模型。可使用该选项卡顶部的“挖掘模型”列表检查挖掘结构中的各个模型。下列各部分说明了在查看器中浏览挖掘模型的方式。Microsoft决策树模型当您为 Adventure Works DM 教程项目切换到“挖掘模型查看器”选项卡时，默认情况下，该设计器将打开已添加到结构中的第一个模型。可以通过从“挖掘模型”列表中选择模型名称来查看不同的模型。用于在 Analysis Services 中生成模型的每种算法将返回不同类型的结果。因此，An alysis Se rvices为每个算法提供了单独的查看器。An alysis Ser vices还提供了一个适用于所有模型类型的一般查看器。当您从列表中选择某个挖掘模型时，系统会使用该模型的相应查看器，在“挖掘模型查看器” 选项卡上显示该模型。在本例中，对于决策树模型，使用的是Microsoft树查看器。此查看器包含两个选项卡，即“决策树”和“依赖关系网络”。决策树在“决策树”选项卡上，可以检查构成挖掘模型的所有树模型。由于本教程项目中的目标邮件模型仅包含单个可预测属性(Bike Buyer)，所以只需查看一个树。如果存在更多树，则可以使用“树”框来选择其他树。默认情况下， Microsoft 树查看器仅显示树的前三个级别。如果树级别不到三个，则查看器仅显示现有级别。可以使用“显示级别”滑块或“默认扩展”列表查看更多级别。有关如何配置查看器的详细信息，请参阅使用Microsoft树查看器查看挖掘模型。修改树1. 将“显示级别”滑块滑动到 5。2. 将“背景”列表更改为 1。通过更改“背景”设置，可以迅速查看每个节点中 Bike Buyer 值为 1 的事例的数量。请注意，在这种特定的情况下，每个事例均表示一个客户。值 1 指示该客户之前购买了自行车；值