资源预览内容
第1页 / 共57页
第2页 / 共57页
第3页 / 共57页
第4页 / 共57页
第5页 / 共57页
第6页 / 共57页
第7页 / 共57页
第8页 / 共57页
第9页 / 共57页
第10页 / 共57页
亲,该文档总共57页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数据挖掘在商业管理与决策分析之实例应用,决策分析质量与效率之提升 数据挖掘之原理概念与功能 数据挖掘之建构方法 应用案例介绍 电子商务之应用(Web Mining/WAP Mining) 建议与结论,引言,经营环境,经营环境日益挑战 考虑:成本、利润、质量 . . . . 管理活动 整合:业务运作、管理控制、策略规画 信息密集行业 全方位/多角化经营,资料 -企业宝贵之资产,信息,Mining,资料 仓储,Mining,知识,(Corporate Memory),(Corporate Intelligence),Database/Data Warehouse,Target data,Cleaned data,Transformed data,Pattern/model,评鉴,数据视觉,资料挖掘,数据转换与简化,前置处理与清理,样本选取,Performance system,知识发现流程(Knowledge Discovery),Knowledge,/Adapted from IBM Corp./,数据挖掘之基本概念,背景 管理信息超载及结构化不足 信息混乱与误用 管理问题复杂度高 实时决策分析日益重视 发展目的 有效利用搜集之市场、客户、供货商、竞争对手及未来趋势信息 使企业经由有效之方法与技术从历史数据里撷取有用的知识,数据挖掘原理,主要方法 数据库、数据视觉、统计学、机器学习等 相关技术 类神经网络、模糊逻辑、基因算法、基因规画、 案例库推理法、规则库推理、统计回归等 知识表现 决策树 、法则、定量数学公式、黑箱公式 等,Data mining主要功能与技术,功能 技术 适用领域 关联性 (Association) 案例库推理/集合理论/统计 菜篮分析 时间序列 (Sequence) 类神经网络/统计 利率预测 分类 (Classification) 基因演算/类神经网络/统计/ 客户评鉴分类 模糊逻辑案例推理/决策树 公式 (Modeling) 基因规划/基因演算/回归 销售预测 群组 (Clustering) 类神经网络/模糊逻辑/ 市场区隔 基因演算/统计,数据挖掘应用现况,Safeway 贩卖促销信息(e.g. coupon) 音乐/电影喜好问卷搜集 Fidelity Investment客户服务 (cross-selling/ wallet share) First USA Bank信用卡资料(汽车房贷) Capital One 降低贷款风险损失率 First Union预测潜在流失客户 预测侵蚀性的物质对皮肤的影响降低产品(药品或毒品)的发展成本和时间,以及减少动物实验的需求 分析零售商店历史销售记录与位置概述以决定最佳的位置 分析提款机设置地点最佳位置,Data Mining 过程,了解应用领域 建立目标集、选择目标数据集 去除数据杂质、做先置处理 减少数据和数据转换 选择数据挖掘的模式(功能) 选择数据挖掘的算法(技术) 资料挖掘 评估第七步骤的结果 整理发现的知识,实例应用,客户评鉴与分类 (NeuroFuzzy) 提升邮购回函率 (Fuzzy) 股市交易最佳化规则之发掘 (GA) 零售商品与客源群聚相关性分析 (Neural/Statistic) 民航机重落地分析(Regression Tree) 化妆品偏好分析(Classification Tree) 窑烧最佳化控制(Neural/GA) 大哥大忠诚客户与游离客户之分析及预测(Classification Tree),股市交易最佳化规则之发掘,规则一假如6日RSI小于20且6日BIAS 小于 -4%时 则 买入并持有12日 规则二假如6日RSI 大于 80且6日BIAS 大于 5%时 则 卖出并放空10日,提升Direct Mail回函率,寄出信函数(寄出成本),回函数,节省,目标营销,大众营销,预定目标,Segment 1 (Age 43)(42.8%),Segment 2 (Age 42)(24.8%),Segment 3 (Age 52)(20.4%),Segment 4 (Age 26)(11.9%),Market Segmentation Segment size, average age,Figure 9.3 Segmentation Results: Segment Size and Average Age,population,Segment3,Segmnet1,Segmenet4,Segment2,Target Categories,A v g $ s p e n t,3000,2000,2500,1500,1000,500,0,Market Segment Analysis Segments vs. Population,Figure 9.4 Market Segmentation Analysis,Safeway 案例,面临之挑战 8 million transaction data/week (4 T MB) 500家店面与600万客户 市场竞争激烈,传统手法技术式微 (如更低价位,更多据点,多类产品) 新的竞争关键焦点:掌握客户需要-哪类客户买哪些商品以及购买频率,Market Basket Analysis (菜篮分析),Coke Milk Juice Egg,Coke,Milk,Juice,Egg,Egg,Juice,Milk,Coke,其它相关应用,发掘背部手术成败关键因素 磁砖颜色配比决策辅助 旋窑燃烧最佳化控制 研磨机钢球配比及置放址决策辅助 电子能量、功率、废气流量、氨气流量组合对氮氧化物及硫氧化物去除效率之模式发展 污染排放量预测模式(DECADES MODEL) 燃烧炉中NG、LPG、与正常空气之配比对燃烧效率及其它有害气体之排放程度之影响,其它相关应用(续),发掘共同基金潜在客户 银行活期存款账户流失率估计 相关产品群组设计(cross-selling) 预测油田生产量 海上石油外溢对生态破坏影响之估计 飞机结构负载,医疗案例,DISXPERT - 残障职业转介专家系统 区别分析寻找分类要因 数据学习以萃取分类规则 整合专家规则与萃取分类规则 延伸应用 客户分类,医疗保险FAMS的 功 能,侦测 ( Detection ) 利用fuzzy modeling和统计技术来分析群组的行为,针对每个医疗服务提供者评定分数,以反应其遍离行为标准的程度 调查 ( Investigation ) 分析提供者的分数和详细的赔偿数据 解决 ( Settlement ) 详细分析群组行为和赔偿的报告和图表。报告可以用来协商、解决问题和检举不法之事 预防 ( Prevention ) 支持提供者的监视和提供新的工具来评估和教育他们,改善提供者的行为,以防止医疗诈欺和滥用,减低保险公司的损失,FAMS的特性,利用案例数据的“retrospective analysis”,分析帐目和医疗提供者的医疗工作,以找出有嫌疑的提供者 依据医疗专业和地理位置来定义群组 例如,你可以着重于Los Angeles的经神科、Hartford的皮肤科、大都会地区的紧急救护服务,建置数据剖析应注意事项,在规画Data Warehouse时即应与所需Mining之目标结合 配合数据处理情况 Data Warehouse Data Marts Cube 选择软硬件发展平台 分期或分步骤并以渐进式方法开发 80%心力需投入于Data Preparation步骤 常见之主机平台包括:IBM/390, HP9000, IBM RS-6000, SUN, UNISYS,可能遭遇问题之影响因素,企业教育训练之不足 不适当之支持工具 数据之无效性 资料样型(patterns)太多 多变与时间性数据 复杂之数据型态 没有现成之模式可立即使用 数据质量 资料可取得性 专家意见,Web/WAP Mining,Dynamic product catalog Dynamic banner Dynamic content Tailored mailing list,Data Mining for CRM/Churn Management,Defector identification Campaign promotion Marketing resource allocation Risk assessment & fraud detection Royal customer identification,Business Intelligence in Electronic Commerce,建议与结论,以信息科技为主轴之经营管理 数据之保存、管理与运用为致胜关键 善用商业智慧工具以有效解决问题,案例(一)建物抵押贷款申请评估,说明:评估模式针对五个输入变项值给予综合评定 分数-1).建造的施工质量、 2).建筑物的位置、 3).申贷人的资产、 4).申贷人的收入、 5).利 息支付情况。各个项目的评分范围从0分到 100分。 可使用之技术:基因算法、决策树、类神经 网络、基因规划法,计分模式结构,案例(二) DM寄送对象评分,说明:评估模式针对六个输入变项值给予综合评定 分数 - 1).盈余、2).住家地理位置、 3).房地产 总值、 4).年龄、 5).小孩个数、 6).是否结婚。 可使用之技术:基因算法、决策树、类神经 网络、基因规划法,计分模式结构,窑烧最佳稳定控制结果,x1 x2 x3 x4 x5,资料挖掘技术与发展,类神经网络-监督式学习,类神经网络-非监督式学习,模糊规则库,Neuro-Fuzzy 类神经- 模糊系统,Genetic Algorithm (基因演算),基因演算原理,GP(基因规划),GP-Fuzzy 基因规划- 模糊系统,案例推理流程,If Time_band =2.5 years and Time_employed =1.5 year while reject is only 3.2% likely. A total of 63 cases fit this profile, 61 accepts and 2 rejects.,决策树,过去相关RD经历,民营单位计划 因特网客户购买行为分析暨预测(安瑟在线),2000 网页浏览使用行为分析(发现者国际公司),2000 大哥大门号转换与客户流失分析(自行研究),2000 网际广告暨电视广告采买组合决策辅助系统(润利公司),1999 消费者对化妆品之品牌选择模式建构与分析(资生堂、佳丽宝与香奈儿),1999 ISP客户使用意愿分析因果预测模式建构(自行研究),1999 信用卡持卡人延滞缴款预测模式研究(某国内金融机构),1999 信用卡签帐金额预测(某金融单位),1999 保险产品与客户选择分析辅助系统(某保险经济人公司),1999 医院洗肾中心护理人员排班辅助系统(长庚医院),1998 船席调配作业专家决策系统(基隆港务局),1998,过去相关RD经历(续),公营单位 “基因工程算法则应用于飞机结构负载历程之分析,“ 航发中心,NSC 89-2623-D-155 -005,1999/7/12000/6/31 “动态基因规划,“ 国科会, NSC 89-2416-H-155 -015,1999/8/12000/7/31 “建立区域整体资源规划数据库先期研究,“台湾电力综合研究所,TAE87001, 1999/1/11999/6/31 “非破坏检测专家系统推理机构之
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号