资源预览内容
第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
第9页 / 共9页
亲,该文档总共9页全部预览完了,如果喜欢就下载吧!
资源描述
电信数据挖掘数据挖掘技术从一开始就是面向应用的。在商业应用中最典型的例子就是一家连锁店通过数据挖 掘发现了小孩尿布和啤酒之间有着惊人的联系。数据挖掘是目前国际上数据库和信息决策领域的 最前沿方向之一,引起了学术界和业界的广泛关注。数据挖掘技术在一些领域内已有成功的应用。 但数据挖掘技术在电信领域中成熟的应用尚不多见。下面对数据挖掘技术在电信行业的应用作一 点探讨由于电信业本身相对于其它领域历史数据比较规范,而且海量数据,以客户 为中心,这些对数据挖掘需求来说都是很有必要的。数据挖掘在国外电信行业中 有很多成功的案例,下面这些公司使用数据挖掘技术解决了一些商业问题: British Telecommunications (英国) :*向销售人员和营销活动提供了“最佳客户”清单*直邮活动回应率提高了 100%Telecom Italia Mobile (意大利):*预防了客户的流失*加强了客户交叉销售的机会 *对客户的行为有更深的理解Hutchison Telecom (香港):*建立客户忠诚度评估体系,降低了客户的流失。总的说来,数据挖掘能解决电信行业如下一些商业问题:1. 理解客户的细分和偏好2. 确定可盈利客户以及获取新客户3. 交叉销售4客户保持以及提高客户忠诚度5提高投资回报率(ROI)以及减少促销成本6发现欺诈、浪费、滥用等不良行为7.确定信用风险等等。数据挖掘在国内电信行业的发展是随着电信行业竞争的加剧,国内电信运营 商们都认识到了数据挖掘的重要性,中国移动集团正在规划数据挖掘的行业应用 课题研究。数据挖掘过程中对业务理解是很关键的,领域专家对这个早有讨论, 前段时间看到一篇文章很受启发,作者明确表明了他的观点:数据挖掘项目进行 过程中,要以业务专家为主导,技术专家只是起辅助作用。这句话很有道理,现 在很多所谓的数据挖掘项目确恰恰相反,这确实是关系项目成败或者说项目是否 能达到预期效果的一个关键问题。下面对现在电信行业的业务理解做一点简单的 分析,当然每个运营商会有他的一些具体需求:简单地讲,电信领域数据挖掘项目的业务问题就是,通过对电信公司大量的 通话明细记录的挖掘,发现顾客的行为,提供有针对性的服务,这样不仅提高客 户服务水平以增加顾客忠诚,更重要地是,去寻找那些企业利润贡献度高的业务 的使用者,并挖掘其规律以增加这一类业务的销售,从而提升企业获利能力。回 答这一业务问题,可以有多方面的数据挖掘问题。比如: *通话时段的规律。什么时间是电话通话的高峰期?不同类型的电信业务高峰出 现在什么时候等。*按市场细分的客户(如个人客户、政府部门、企业客户)通话规律。市场细分 后同类型的顾客其通话模式是否相似?如果相似则如何等。*电话使用者何时在家。了解这一点一个明显的直观的作用就是,一些行业进行 电话直销(比如银行业交叉销售保险产品)时效率更高。*国际长途的通话模式。因为国际长途利润率相当高,了解其通话模式从而采取 相应措施提高其使用量会对公司业绩有显著作用。*因特网服务规律。比如顾客最常使用的ISPs (服务提供商)、不同市场细分类 型的顾客是否用不同的ISP等。*发现潜在的租用虚拟专用网络服务的顾客。这些顾客会有站点间大量的通话或 数据传输,有时也会与其他企业间作大量的数据交换,此时如果作有针对的营销, 他们就可能租用虚拟专用网络服务。*发现增加电话线路租用需求的客户。一个典型的例子,某寿险企业的客服热线 电话经常出现等待时间过长的问题,从而导致顾客的不满。之所以发生这种问题, 主要是因为该类企业同时发生的通话过多,占用了其所有租用的线路。如果电信 服务提供者能及时发现这类问题,客户的基本信息:姓名和入网时间, 所在地区,年龄,职业,通信业务的选择客户的消费行为知识:本地通话时长,长途通话时长,IP通话时长,网内或望见通话时长,拨 打客户次数,短信发送次数,欠费次数,等等因为我是第一次做这个方面的东西,所以这些变量有的是我自己想出来的,有的是参考的别 人的。也不知道对不对,全不全。如果有什么不全的地方,望指正。电信业呼吁数据挖掘随着电信市场竞争的日益加剧,构建电信企业经营分析系统,充分利用其业务支撑系统产生 的大量的历史数据,实现对信息的深加工和处理已成为当前电信企业系统建设关注的焦点。 在本文中,笔者将通过分析国内电信业的数据挖掘应用现状,探讨现有电信企业构建数据挖 掘系统中面临的问题,全面聚焦数据挖掘应用系统的实施。挖掘变数据为竞争力数据挖掘就是从海量的、不完全的、有噪声的、模糊的数据中找出潜在的有价值的信息 和知识,是知识发现过粗KDD )的一个重要步骤,它是涉及统计学、数据库和人工智能等相 关领域的一门偏于应用的交叉学科。随着国内外电信市场竞争的日趋激烈,为了真正做到以 客户为中心,提高服务质量,提供个性化的客户服务并且准确、及时地进行经营决策,电信 业也开始尝试将数据挖掘技术应用于业务预测、客户的行为模式分析、网络资源的管理等领 域,并逐渐成为电信企业管理决策的重要手段之数据挖掘过程一般包括如下六步定义商业问题:定义商业问题就是了解你的数据和业务问题,这是实施数据挖掘的基本 前提,个数据挖掘项目必须要有一个清晰明确的目标以及对结果的评价标准.建立数据挖掘库:数据挖掘的原始数据大多来自于数据仓库或数据集市中。虽然数据仓 库/集市对于数据挖掘本身来说不是必须的,但从商用系统建设的角度来看,直接从数据仓 库/集市中获取经过清洗、转换的数据,能够为构建数据挖掘应用提供更加全面的数据支撑。分析数据:分析的目的是进行数据筛选,寻找对数据建模影响最大的指标变量,以及决 定是否需要定义衍生变量。准备数据:为数据挖掘建模准备数据,确定训练以及测试的样本集。为此需要进行具体 的数据抽取。转换等工作。模型建立与评估:一个有效模型的建立是一个迭代循环的过程。具体包括选择何种算法 模型、选择合适的训练数据集、模型的评价。模型实施:模型建立并经验证之后,有两种主要的使用方法。第一种是提供给分析人员 作参考,由他们通过查看和分析这个模型之后提出行动方案的建议。另一种是把改数据挖掘 模型应用到某个商业过程中,与某些应用系统相集成。国内数据挖掘应用现状随着电信市场垄断格局的打破,市场竞争更趋激烈,客户服务的质量要求日益提高,同 时也是国内信息化程度最高的行业之一,这些因素使得国内的电信企业开始着手数据仓库的 建设,并将数据挖掘系统作为数据仓库实施的一部分。目前国内电信企业尝试的数据挖掘应 用主要涉及以下几个方面:业务预测 通过对历史数据的分析,找出影响业务发展的因素,然后对这些因素的未来发展作出预 计,从而大致地确定未来业务量,作为制订发展计划的重要依据。客户的呼叫模式分析对客户的呼叫模式进行细致的分析能够使电信企业更清楚地了解客户的喜好,成为企业 厂商进行市场营销活动的依据。通过对呼叫模式进行分析,可以进一步了解客户的一些基本 特征,比如客户的呼叫时间的分布特征、呼叫对象的分布特征等。大客户特征的识别大客户群体是电信企业利润的主要来源,也是电信企业之间相互争夺的焦点。识别出大 客户,制订针对性的措施,提高大客户的忠诚度,是电信企业保持竞争优势的关键所在。不 仅能够根据现有消费量的多少来判断用户是否为大客户,还应该根据现有大客户的资料提取 出大客户的特征,并发现潜在的大客户。客户群体的细分客户群体的细分是一对一营销的基础,可以采用分类或者聚类的方式对客户进行划分。 其中分类方法是指事先人为根据客户属性确定分类标准,再对用户进行归类。聚类分析方法 是指系统根据客户属性,使群内客户具有最大的相同性、群间客户具有最大的相异性,自动 产生聚类标准,再按此标准对用户进行归类,可以在客户群体细分的基础上进行进一步的细 分,直到所需要的粒度,并由此对客户群进行各种分析。客户流失的预测与控制争取一个新客户的代价比留住一个老客户代价要大得多。由于关系到市场份额以及营业 利润,客户流失预测是电信运营商最为关心的重点之一。客户流失预测的分析对象是已经流 失和未流失的客户,从他们的自然属性和行为属性以及其它属性中找出流失客户的特征,然 后预测客户未来一段时间的流失概率。网络资源的管理 通信网在运行过程中产生了大量的运行数据。对这些数据进行挖掘,有利于尽早发现潜 在的网络故障,提咼网络的利用率。建立全面、统一的数据挖掘系统是一个长期渐进的过程。目前电信行业建设数据挖掘应用主要存在以下问题:数据质量不高在数据建模过程中,存在大量的噪声数据和缺损数据,一些有价值的数据难以收集,比 如电信客户的基本信息。虽然数据挖掘学科应用中,缺损含有噪声数据的处理是其研究方向 之一,但是缺损、错误的数据会降低模型的结论的置信度,甚至会得出错误的分析结论,这 一点是不能避免的。缺乏专业的数据挖掘应用实施经验在电信行业中,数据挖掘应用是作为数据仓库平台的一部分,纳入到数据仓库的建设框 架中。但是数据挖掘应用并不严格依赖于数据仓库本身,数据仓库只是电信企业实施数据挖 掘应用的理想的数据平台。从现有的电信行业的数据仓库应用来看,侧重于OLAP分析以 及多维图形展示,对数据挖掘的本质、发展趋势的认识和把握还不足,数据挖掘应用项目也 缺乏分阶段、渐进的实施策略。在数据挖掘产品选择上,往往以性能为衡量指标,对数据挖 掘技术研究不深入,缺乏自主性数据挖掘应用开发。缺乏专业的数据建模人员应用数据挖掘方法进行建模,需要专业性的学科知识,比如统计学、人工智能、数据库 等,这对系统建模人员提出了很高的要求。比如,建模过程中的指标变量选取,需要筛选指 标变量以便进一步建模,选择所有的指标变量,往往是不可取的。因此缺乏专业性的背景知 识,简单地依赖某些数据挖掘工具,缺乏建模过程中主观辨识,脱离特定的应用背景,会使 数据挖掘应用“庸俗化”。构建电信业数据挖掘系统数据仓库平台建设与数据挖掘应用的协调发展电信业对数据挖掘的需求从具体的应用开始。构建统一的数据仓库平台,能够为这些应 用提供有效的数据服务,但是数据仓库建设本身是一个长期、渐进的项目。在电信行业中, 虽然没有数据仓库的数据挖掘应用在实施时往往会捉襟见肘,但是缺乏具体应用背景的数据 仓库建设也是纸上谈兵,只有将数据挖掘实施经验与数据仓库建设紧密结合,并在实施过程 中不断磨合,才能取得成功。因此构建数据挖掘应用与数据仓库平台不存在严格的先后关系, 应根据实际进行数据挖掘应用的可行性分析。对于数据挖掘应用的数据支持,有时建立一个 特定的数据集市或者普通的关系型数据库,就可以进行数据挖掘了。在电信行业实施数据仓 库项目之前或者实施过程中,有步骤地建立如市场预测、客户流失分析等数据挖掘应用系统, 实施这些应用系统的同时,有助于深入理解电信行业的具体数据需求,从而为构建全局、统 一的数据仓库系统提供支持。重视数据收集从独立的数据挖掘项目的实施情况看,大多数项目的数据准备工作要占据整个项目 50%800%的时间,这其中包括数据收集、指标变量选取、数据抽取以及相关数据预处理。 在电信行业中,海量数据的处理分析需要可观的时间和相关设备资源,但是错误、缺损的数 据更加难以处理,因此建设在灵活、高效的数据服务同时,逐步收集、完善相关业务数据, 提高数据质量,是数据挖掘能否成功实施的关键所在。选择合适的数据挖掘工具数据挖掘技术涉及多个学科,对设计开发人员有很高的要求,采用合适的数据挖掘工具 能够帮助企业迅速启动自己的数据挖掘应用。目前市场提供的数据挖掘产品比较多,这些产 品各有特色,在选择数据挖掘工具时,需要全面考虑多方因素。系统处理性能与系统开放性的权衡这主要体现在数据挖掘工具与数据仓库系统的耦合程度。有些数据挖掘工具其实就是数 据仓库的一个子系统,与其数据仓库联系紧密,可以直接在
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号