资源预览内容
第1页 / 共11页
第2页 / 共11页
第3页 / 共11页
第4页 / 共11页
第5页 / 共11页
第6页 / 共11页
第7页 / 共11页
第8页 / 共11页
第9页 / 共11页
第10页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
相异度矩阵1.相异度矩阵(Dissimilarity Matrix) 定义: 相异度矩阵存储n个对象两两之间的相似性 ,表现形式是一个nn维的矩阵。d(i,j) 是对象i和j之间相异性的量化表示,通常为 非负值,两个对象越相似或“接近”,其值 越接近0,越不同,其值越大,且d(i,j)= d(j,i),d(i,i)=0。2.相异度d(i,j)的具体计算因所使用的数据类 型不同而不同,常用的数据类型包括:区间标度变量二元变量标称型、序数型和比例标度型变量混合类型的变量3. 相异度矩阵是对象对象结构的一种数据表 达方式。多数聚类算法都是建立在相异度矩阵基础上 ,如果数据是以数据矩阵形式给出的,就要 将数据矩阵转化为相异度矩阵。对象间的相似度或相异度是基于两个对象间 的距离来计算的。欧几里得距离和曼哈坦距离计算:具体案例分析小结样本数据属性矩阵相似性矩阵聚类为样本划分所在类分析结果
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号