资源预览内容
第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
第9页 / 共9页
亲,该文档总共9页全部预览完了,如果喜欢就下载吧!
资源描述
信息与计算科学专业实验报告课程名称数据挖掘原理与算法总实验学时:共次实验项目名称聚类分析本次实验学时数:实验类型日期20 16年5月 25 日星期三年级本13信计01班学生姓名黄顺团学号课任教师唐志刚1. 实验目的:用数据挖掘聚类算法(Q型聚类、R型聚类)求分类微博数据2. 实验环境:MATLAB 7.0。Windows 7操作系统。3. 实验内容由于数据集比较大,数据TXT文件不引入报告中。命名为julei.txt。 相关两个源文件代码文件如下:1、Untitled.mclc,clear load julei.txt %把原始数据保存在纯文本文件julei.txt中 r=corrcoef(julei); %计算相关系数矩阵 d=1-r;%进行数据变换,把相关系数转化为距离d=tril(d); %取出矩阵d的下三角元素 d=nonzeros(d);%取出非零元素d=d;%化成行向量z=linkage(d,average);%按类平均法聚类dendrogram(z);%画聚类图T=cluster(z,maxclust,4)%把变量划分成 4 类for i=1:4 tm=find(T=i);%求第i类的对象tm=reshape(tm,1,length(tm);%变成行向量fprintf(第d 类的有s n,i,int2str(tm);%显示分类结果endr%显示相关系数矩阵2、Untitled2.mclc,clear load julei.txt%把原始数据保存在纯文本文件julei.txt中julei(:,5) = 口;%删除数据矩阵的第5列,即使用变量1,2,3,4julei=zscore(julei);%数据标准化y=pdist(julei);%求对象间的欧氏距离,每行是一个对象z=linkage(y,average);%按类平均法聚类dendrogram(z);%画聚类图for k=2:8fprintf(划分成%d类的结果如下:n,k) T=cluster(z,maxclust,k); %把样本点划分成 k 类for i=1:ktm=find(T=i);%求第i类的对象tm=reshape(tm,1,length(tm); %变成行向量fprintf(第d 类的有s n,i,int2str(tm);%显示分类结果end if k=8breakendfprintf(*n);End输出结果为:1、图一(R型聚类) T =42312第1类的有4第2类的有2 5第3类的有3第4类的有1 r =1.0000-0.18240.0439-0.0298-0.0871-0.18241.00000.28440.41580.90030.04390.28441.00000.18830.3327-0.02980.41580.18831.00000.4965-0.08710.90030.33270.49651.00002、图2 (各对象聚类树形图)划分成2类的结果如下:第1类的有128 268第2类的有123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300 个个个个个个个个个个个个划分成3类的结果如下第1类的有125274第2类的有123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267269270271272273275276277278279280281282283284285286287288289290291292293294295296297298299300第3类的有128268 *划分成4类的结果如下第1类的有192541101111121171173260283第2类的有1234567891011121314151617182021222324262728293031323334353637383940424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号