资源预览内容
第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
亲,该文档总共3页全部预览完了,如果喜欢就下载吧!
资源描述
9 3 82 0 0 6 中国控制与头策学术年会论文集P r o c e e d i n K so f2 0 0 6C h i n e s e ( o 蜊,da n dD e c i s i o nC o n f e r e n c eW e b 数据挖掘在网络商务领域的应用李翠萍,吕廷杰( 北京邮电大学经薪管理学院,北京1 0 0 8 7 6 )摘要:升绍了现在互联网上主要的商务模式内容和应用及莆要研究的客户问题,分析了W e b 数据挖掘的分类孝过程I ;c 度在各网络商务中能够解央的问题,探索了苯用数据挖掘研兜厨碧经济的方法和方向,关键谕:互联珂;W e b 数器挖掘 厨络商务W e bM i n i n gi nI n t e r n e tC o m m e r c eL IC u i p i n g ,I xT i n g 一3 谵( S c h o o lo fE c o n o m i c sa n dM a n a g e m e n t B e i j i n gU n i v e r s i t yo fP o s t sa n dT e l e c o m m u n i c a t i o n s ,B e i j i n g1 0 0 8 7 6C h i n a C o r r e s p o n d e n t :L IC u i p i n g ,E m a i l :c h a p i n 2 6 3 n e t )A b s t r a c tI ti n t r o d u c e dt h ei m p o r t a n tb u s i n e s sm o d eo fo n l i n es i t e s ,a n dc u s t o m e rb e h a v i o ra n a l y s i so f i n t e r n e tc o m m e r c e ,w e bm i n i n gt a x o n o m ya n dw e bm i n i n gp r o c e s s s o m ep r o b l e m sc a l lb es o l v e db yd a t am i n i n g t h ea p p r o a c ha n dt u t u r ew o r ko fi n t e r n e te c o n o m ya l s od i s c u s s e d K e yw o r d s ;I n t e r n e t ;W e bm i n i n g fI n t e r n erC o m m r c e1 引言随着互联网迅速发展和技术的日趋成熟,它已成为一个巨大的、分布广泛和全球性的信息服务中心从某种意义上可将其看作是一个涉及到各个领域庞大的致据库如何从无数的页面中发现需要的内容,从大量的访问中发现固有的模式和关联,成为人们迫切希望解决的问题w e b 挖掘源于数据挖掘和I n t e r n e t 技术的结合,它研究网上的内容自动分类、智能A g e n t 及用户访问模式发现,成为计算机领域研究的新热点W e b作为网络业务不可缺少的渠道和平台,如何从庞大的信息中获取有用信息,利用互联网上客户留下的信息,提高理解客户和服务客户的能力,提高业务在网络领域的效率,从而获取更大的利润,是新经济时代商家关注的问题o 2 网络业务的重要领域及分析随着互联网用户的急剧增加。如何在互联网上盈利是众多商家关注的问题,互联网盈利模式也成为新经济肘代的研究对象目前,网络业务起巨大作用的3 个主要领域是:电子商务、电子媒体及电子市场“】电子商务是指公司在网络上将货物卖给客户,而客户则直接付钱给公司,这是一种新的销售渠道;电子媒体公司主要通过广告获得收益,同时也有一定的拓展业务,他们向客户提供目录,进而将客户资料卖给广告商;电子市场是一个申介平台,即充当买卖双方的中介入,然后从交易中抽取佣金在这些网络商务中,最重要的资源仍然是客户,如何利用客户在访问时留下的信息,从业务的角度,加强对客户的理解和提取更好的商业模式,是通过w e b 数据挖掘嚣要解决的问题,只有从业务的角度,进行构建模型和实施跟踪,才有重要的商业意义W e b 的应用比以往更能增进对客户行为的监控如见图l 所示,为企业对客户的分析企业不仅分析在线数据。也重新审视线下数据( 如P o S 信息) ,并思考如何使用他们通过监控实际的购买行为( 如客户浏览哪些站点、通常用哪些关键字、在线选购哪些产品等) ,企业领导层的判断正在变得更精确、更完整和更及时基金项目:国家自然科学基金项目( 7 0 7 2 0 7 3 ) 作者简介t 李翠萍( 1 9 7 1 ) 女北京人,博士生,从事管理科学与工程、B I 的研究孝翠萍等:W e b 数据挖掘在网络商务领域的应用9 3 9客户行为 分析( C B A )客户关系管理( C R M )圆l 匝亟双匝习 专匝盈专申囱l 匝盈咆田1 企业客户分析如图2 所示,列举了网络商务领域几个主要参与者:公司、供应商、顾客、管制者之间可能相互作用的关系其中很多角色可以互换,弯箭头表示相似企业的相互作用圃k回十固印 f _ 虿司b 图2 网络商务:跨组织交流途径3W e b 挖掘的分类w e b 数据挖掘根据互联网的特征和数据分为3种不同的行为:W e b 内容挖掘,W e b 结构挖掘和W e b 应用挖掘o 】,如图3 所示W e b 内容挖掘可分为基于代理的方法和数据阵方法基于代理的方法包括;信息查询代理、信息过滤分类及个性化W e b代理;数据库方法包括:多层数据库和w e b 查询系统使用挖掘又可分为服务器日志分析和单个用户使用分析W e b 内容挖掘是用于提取文字,图片或其他组成同页内容成份的信息,是从海量的互联网内容中提取有用信息的过程;W e b 结构挖掘是用于提取网络拓扑信息,即网页之间的链接信息,是为提取信息面对网站的链接进行分析的过程;W e b 应用挖掘是用于提取关于客户如何运用测览器浏览和使用这些链接的信息,是在客户行为之后的这3 者都是对网络的挖掘,是数据挖掘有价值的应用其中,W e b 结构挖掘和W e b 内容挖掘都不需要或提供有W e b 挖掘W e b 内容挖掘f l W e b 结构挖掘f W e b 应用挖掘 必幽型圈幽匿l 文档内超链接II 文档f u q 超链接I圈3W e b 挖掘分类关客户行为的知识,而应用网络挖掘主要集中于客户的行为,从商务的角度考虑更有意义3 1W e b 内容挖掘目前互联网上的内容挖掘主要是文本挖掘,搜索引擎是W e b 内容挖掘应用得最为广泛的例子在应用申基于内容的分类是直接数据挖掘中一种常见情况,可利用遗传算法提出一个模型来大量的描述客户意见的信息,并在某种程度上合并、分类;基于内容的分簇任务是间接的数据挖掘,可利用聚类分簇算法解决。在商业中按客户的行为将它们分簇,产生出客户段,该客户段能够用于设计专门指向一组客户的市场活动通过记录客户和潜在客户的“行为弹性”( 即购买行为的变动) 。企业可判断客户的需求取向同时,对于客户来说,整个购买过程变得容易,他们更愿意重复购买3 2W e b 结构挖掘w e b 结构挖掘可得到一些站点受欢迎的程度和它与其他站点的距离,即挖掘W e b 潜在的链接结构模式文档之间的超级链接反映了文档之问的包含、引用或从属关系,引用文档对被引用文档的说明往往更客观、更概括、更准确它通过识别中枢和权威找到更有趣和权威的文档它可以理解一个阿站的局部结构。识别导航页、目标页,并形成它应有的功能,从而使铡览者更容易接设计者意向做事情+3 3W e b 应用挖掘W e b 使用挖掘聚焦于通过使用者在网页上的相互作用来预测使用者行为的技术在互联网上挖掘的这种数据是作为相互作用结果的二手的数据客户使用模式挖掘包括点击流分析、网络日志和应用1 3 志点击流是一系列由一个站点的网络服务器接受的网页请求,是一个网站浏览者通过点击链接所明确要求的一系列文件,类似于超市的扫描数据;点击流的分析始于网络日志网络日志分为会话日志和应用日志,应用日志的挖掘用于提高网站的可用性4 数据挖掘过程数据挖掘是一个正确理解企业的商业问题,取得正确的数据,将数据转换成潜在有用的信息对结果进行合理解释的过程“】这需要将部分人类的智慧融进数据挖掘数据挖掘有4 种方法:从企业外制造商那里购买与企业商业圊题配套的评分机制;购买数据挖掘软件这类整体解决方案;针对特定的问题,聘请外部专家完成预测模型的建立;在组织内部掌握数据挖掘技能一个成功的数据挖掘流程需要9 4 02 0 0 6 中国控制与决策学术年会论文集数据专家、数据挖掘专家和相应商业领域专家共同完成,如图4 所示圈4 数据挖掘过程W e b 挖掘作为一个完整的技术体系,在进行挖掘前的信息获得I R 和信息抽取I E 相当重要由于W e b 数据量巨大而且是动态的,目前采用自动化、半自动化的方法在W e b 上进行I R 和I E 在w e b 环境下既要处理非结拘化文档,又要处理半结构化的数据。相应的研究成果和具体应用在大型搜索引擎中取得了很好的效果5w e b 数据挖掘应用于商务领域1 ) 网络实物销售。对零售商而言。利用W e b 渠道可提供更多的有用信息,如:当客户到网上书店买书时,除了可以留下注册资料,还可以留下以下在传统渠道上看不到的信息,即客户赔买频率,对在线促销和赠品的反应,哪些商品放上了购物车而去掉了,那种标签条被触发了,交叉铺售链接,哪些推荐商品被浏览并被放上了购物车等同时,可以根据同等群集中其他成员购买的情况做出推荐,即协同过滤由于W e b 比传统的R F M 单元格( 近期、频率、货币价值的分析) 等分析方法利用了更多的变量,因此利用先进的数据挖掘技术更具有预见性2 ) 网络数字产品销售由于各种铃声、音乐、电子书籍等下载和视频点播等数字产品的出现,避免了传统的物流渠道,因此具有了在网络渠道中的优势W e b 数据挖掘在这种销售渠道中能够提供大量建议,可利用合作过滤,通过一组相似一个人偏好的商品技术3 ) 网络广告业务在电子媒体和W e bf - 户中,广告收入都是重要的盈利模式之一,使用数据挖掘,可在广告站点中跟踪客户,并基于与客户的交互建立客户特征广告客户可决定他们的哪些广告收效良好,现况如何,提高网络广告的效应,改进支持广告的业务模型 6 结语对于网络商务领域,通过研究在线交易,利用客户留下的信息,以增加市场上可用信息的数量和质量来促进现代化商业的发展随着电子交易的普及,w e b 数据挖掘技术特别是对用法的挖掘将会受到越来越多的重视参考文献( R e f e r e n c e s ) 1 M a u r i c eM u l v e n n a ,A l e xB u c h n e r ,M a r i a nN o r w o o d ,e ta I M i n i n gI n t e r n e tD a t af o rM a r k e t i n gI n t e l l i g e n c eT h r o u g hW e bL o gM i r d n g M I r e l a n d :O Q B 2 G o r d o nsL i n o f f ,M i c h a e lJAB e r r y M i n i n gt 胁W e b :T r a n s f o r m i n gC “s t o m e rD a t ai n t oC u s t o m e rV a l u e M A m e r i c a n :J
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号