资源预览内容
第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
第5页 / 共37页
第6页 / 共37页
第7页 / 共37页
第8页 / 共37页
第9页 / 共37页
第10页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计算机应用技术专业毕业论文计算机应用技术专业毕业论文 精品论文精品论文 量化关联规则模型与量化关联规则模型与挖掘算法研究挖掘算法研究关键词:量化关联规则关键词:量化关联规则 数据挖掘数据挖掘 数据库技术数据库技术摘要:关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指 在满足最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事 务数据库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据 库中属性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量 0 或 1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔 关联规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如 下: (1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研 究现状,并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。 (2)针对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度 等操作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值, 并基于强信息关系属性挖掘量化关联规则的挖掘算法 BMIQAR。实验表明,算法 BMIQAR 有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝 大部分置信度较高的规则。 (3)针对现有的量化关联规则挖掘方法仅从项目 的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题, 提出将项目数量与权值进行整合,在 K-获利支持期望的概念基础上设计的基于 获利最大化的量化关联规则挖掘算法 WQAR。实验表明,WAQR 算法得到的是那些 真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关 联知识。正文内容正文内容关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在 满足最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事务 数据库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库 中属性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量 0 或 1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔 关联规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如 下: (1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研 究现状,并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。 (2)针对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度 等操作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值, 并基于强信息关系属性挖掘量化关联规则的挖掘算法 BMIQAR。实验表明,算法 BMIQAR 有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝 大部分置信度较高的规则。 (3)针对现有的量化关联规则挖掘方法仅从项目 的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题, 提出将项目数量与权值进行整合,在 K-获利支持期望的概念基础上设计的基于 获利最大化的量化关联规则挖掘算法 WQAR。实验表明,WAQR 算法得到的是那些 真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关 联知识。 关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足 最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的 客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事务数据 库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库中属 性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量 0 或 1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔关联 规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如下: (1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研究现状, 并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。 (2)针 对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度等操 作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值,并 基于强信息关系属性挖掘量化关联规则的挖掘算法 BMIQAR。实验表明,算法 BMIQAR 有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝 大部分置信度较高的规则。 (3)针对现有的量化关联规则挖掘方法仅从项目 的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题, 提出将项目数量与权值进行整合,在 K-获利支持期望的概念基础上设计的基于 获利最大化的量化关联规则挖掘算法 WQAR。实验表明,WAQR 算法得到的是那些 真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关 联知识。 关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足 最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的 客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事务数据 库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库中属性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量 0 或 1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔关联 规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如下: (1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研究现状, 并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。 (2)针 对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度等操 作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值,并 基于强信息关系属性挖掘量化关联规则的挖掘算法 BMIQAR。实验表明,算法 BMIQAR 有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝 大部分置信度较高的规则。 (3)针对现有的量化关联规则挖掘方法仅从项目 的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题, 提出将项目数量与权值进行整合,在 K-获利支持期望的概念基础上设计的基于 获利最大化的量化关联规则挖掘算法 WQAR。实验表明,WAQR 算法得到的是那些 真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关 联知识。 关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足 最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的 客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事务数据 库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库中属 性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量 0 或 1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔关联 规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如下: (1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研究现状, 并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。 (2)针 对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度等操 作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值,并 基于强信息关系属性挖掘量化关联规则的挖掘算法 BMIQAR。实验表明,算法 BMIQAR 有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝 大部分置信度较高的规则。 (3)针对现有的量化关联规则挖掘方法仅从项目 的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题, 提出将项目数量与权值进行整合,在 K-获利支持期望的概念基础上设计的基于 获利最大化的量化关联规则挖掘算法 WQAR。实验表明,WAQR 算法得到的是那些 真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关 联知识。 关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足 最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的 客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事务数据 库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库中属 性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量 0 或 1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔关联 规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如下: (1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研究现状, 并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。 (2)针 对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度等操作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值,并 基于强信息关系属性挖掘量化关联规则的挖掘算法 BMIQAR。实验表明,算法 BMIQAR 有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝 大部分置信度较高的规则。 (3)针对现有的量化关联规则挖掘方法仅从项目 的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题, 提出将项目数量与权值进行整合,在 K-获利支持期望的概念基础上设计的基于 获利最大化的量化关联规则挖掘算法 WQAR。实验表明,WAQR 算法得到的是那些 真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关 联知识。 关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足 最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的 客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事务数据 库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库中属 性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量 0 或 1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔关联 规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如下: (1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研究现状, 并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。 (2)针 对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度等操 作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值,并 基于强信息关系属性挖掘量化关联规则的挖掘算法 BMIQAR。实验表明,算法 BMIQAR 有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝 大部分置信度较高的规则。 (3)针对现有的量化关联规则挖掘方法仅从项目 的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题, 提出将项目数量与权值进行整合,在 K-获利支持期望的概念基础上设计的基于 获利最大化的量化关联规则挖掘算法 WQAR。实验表明,WAQR 算法得到的是那些 真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关 联知识。 关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足 最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品 A 和 B 的 客户 80同时也购买 C 和 D”这样的规则。早前这方面的研究大都以事务数据 库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库中属 性类型较为丰富,且多为数量属
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号