资源预览内容
第1页 / 共68页
第2页 / 共68页
第3页 / 共68页
第4页 / 共68页
第5页 / 共68页
第6页 / 共68页
第7页 / 共68页
第8页 / 共68页
第9页 / 共68页
第10页 / 共68页
亲,该文档总共68页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
分类号:TP311密级:公开U D C :单位代码: 10424学 位 论 文数据挖掘中的关联规则挖掘算法研究成 倩 倩申请学位级别:硕士学位专业名称:计算机应用技术指导教师姓名:杜 学 东职称:教授山 东 科 技 大 学二零零八年五月论文题目:数据挖掘中的关联规则挖掘算法研究作者姓名: 成倩倩入学时间:2005 年 9 月专业名称: 计算机应用技术研究方向:网络工程与管理信息系统指导教师: 杜学东职称:教授论文提交日期:2008 年 5 月论文答辩日期:2008年 6月授予学位日期:RESEARCH ON THE ALGORITHM OF MININGASSOCIATION RULES IN DATA MININGA Dissertation submitted in fulfillment of the requirements of the degree ofMASTER OF ENGINEERING SCIENCEfromShandong University of Science and TechnologybyCheng QianqianSupervisor: Professor Du XuedongCollege of Information Science and EngineeringMay 2008声明本人呈交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所公认的文献外,全部是本人在导师指导下的研究成果。该论文资料尚没有呈交于其它任何学术机关作鉴定。硕士生签名:日期:AFFIRMATIONI declare that this dissertation, submitted in fulfillment of the requirementsfor the award of Master of Engineering Science in Shandong University ofScience and Technology, is wholly my own work unless referenced ofacknowledge. The document has not been submitted for qualification at anyother academic institute.Signature:Date:山东科技大学硕士学位论文摘要摘要关联规则挖掘是数据挖掘领域中的一个非常重要的研究课题。它最初提出的目的是用于发现大量数据中不同项集之间的有趣联系。本文在现有数据挖掘研究成果的基础上,对数据挖掘技术及关联规则挖掘理论和算法进行了研究,基于 Apriori 算法提出了一种改进算法,并对算法的性能进行了分析比较,同时针对相关性规则挖掘算法展开了讨论。首先,介绍了数据挖掘的定义、方法、功能、分类以及研究方向,同时给出了关联规则挖掘的基本概念,介绍了关联规则挖掘的理论基础和算法分类,讨论了一系列改进算法的特点以及基于支持度-置信度框架的关联规则挖掘算法存在的问题。其次,着重对经典的关联规则算法-Apriori 算法进行了分析和讨论,指出它的理论价值以及性能瓶颈问题,针对关联规则挖掘算法的复杂度问题和算法产生的结果问题进行了深入分析和研究,提出一种改进的算法并对改进算法思想进行论证,通过实例进行了验证,同时对算法的性能进行分析。最后,针对基于支持度-置信度框架的关联规则挖掘算法存在的问题,进行了关联规则相关性分析,讨论各种已有的相关性规则挖掘算法,并针对已有算法的局限性提出了优化策略。关联规则挖掘广泛应用于各个领域,有效地发现、理解、运用关联规则是完成数据挖掘任务的重要手段,因此关联规则挖掘具有广阔的应用前景。关键词:数据挖掘;关联规则;挖掘算法;相关性分析1山东科技大学硕士学位论文AbstractAbstractAssociation rules mining is an essential research topic in data mining.Presentingassociation rules mining initially aims at discovering interesting relation between differentitems in great deal of data. This paper study the data mining technique and association rulesmining theory and algorithm based on the current research results; then present an improvedalgorithm based on the Apriori algorithm and analyzeits capability; discuss correlatedassociation rules mining algorithm.Firstly , reviews the definition, method ,function, sort and research direction of Datamining.Then, introduces the basic concepts,theory and sorts of association rules mining,discuss a series of improved algorithms, and point out the existent problem of theassociation rules mining algorithm which based on the support-confidence framework.Secondly, analyze and discuss the classic association rules mining algorithm-Apriorialgorithm,and point out its theoretical value and performance bottlenecks . Based on the in-depth analysis and research for the complexity and the results problem of association rulesmining algorithm, present an improved algorithm and argueits thinking; and the validity ofthis improved method is analyzed and testified by an example.Finally, analyze the correlation of association rules for the existing problems of theassociation rules mining algorithms which based on the support - confidence framework ,thendiscuss several existing correlated association rules mining algorithms,and present theoptimum strategy for their limitations .Associationrulesminingiswidelyappliedinvariousfields.Thediscovery,comprehension and application of association rules are important means ofaccomplishing the task of data mining.Therefore,the research of association rules mining is ofgreat importance in both theoretical field and realistic field.Keywords:Data Mining;Association Rules; Algorithms of Mining;Correlated Analysis2山东科技大学硕士学位论文目录目录1 绪论. 11.1 课题的研究背景与疑义.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号