资源预览内容
第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
亲,该文档总共3页全部预览完了,如果喜欢就下载吧!
资源描述
序列模式挖掘技术在货物流向分析中的应用Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望UGSP 算法利用序列数据库 S 产生长度为 1 的候选序列C1 然后扫描数据库 S 对 C1 中每个项的出现次数计数 确定频繁 1-序列 L1 同时将不满足最小支持度条件的项从 S 中删除并且将项数少于 2 的序列从 S 中删除 产生过度候选 2-序列C2 然后由 C2 产生长度为 2 的候选序列 C2可见 UGSP 算法第一次遍历原始数据库之后就不再扫描原始数据库来计算支持度 而通过过度序列集合 Ck 计算 并且利用频繁序列 Lk-1 对Ck 进行筛选 将不符合最小支持度的元素从 Ck 中删除 最后将项数小于或等于 k-1 的事务删除以缩小 Ck 这样大大减少了候选 2-序列 C2 数目有效的缩减序列数据库 并减少了扫描原始数据库的次数 提高了算法效率设物流企业对货物 A进行操作,考虑时间和公司编号等相关属性收集路径信息,转换后得到路径序列数据库D.如表2所示min_sup=2,采用UGSP算法扫描序列数据库,找出C1去掉天津,杭州.并删除路径数据库中包含天津杭州的项,更新路径数据库Sid=1的路径序列中去掉天津,就成为只有一个元素的序列,不该出现在C2,同样sid=3的路径缩减为包含3个元素的序列,然后生成长度为2的过度候选路径序列C2重复以上步骤没有长度为3的频繁路径产生
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号