资源预览内容
第1页 / 共16页
第2页 / 共16页
第3页 / 共16页
第4页 / 共16页
第5页 / 共16页
第6页 / 共16页
第7页 / 共16页
第8页 / 共16页
第9页 / 共16页
第10页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
7.5 聚类分析的 SPSS 实现一、系统聚类法的SPSS实现例 7.5.1 利用全国 30 个省市自治区经济发展基本情况的八项指标数 据(见数据集wyzb6_5.),用系统聚类法对这30个省市自治区作一初 步的分类,并说明各类地区经济发展的特点。操作分析(Analyze)=分类(Classify)=系统聚类(Hierarchical Cluster) 打开系统聚类分析(Hierarchical Cluster Analysis)对话框1. 变量(Variable(s)列表框设置分析变量。2. 标志个案(Label Cases by)框 设置分析对象的标志变量。3. 分群(Cluster)单选择框设置聚类分析的类型。4. 输出(Display)复选择框 设置聚类分析的输出结果,统计量和 图都是默认选项。5.统计量(Statistics)按钮 设置输出的统计量。合并进程表(Agglomeration schedule)默认选项,输出聚类分析的 凝聚状态表;相似性矩阵(Proximitymatrix)为复选项,输出各样品的距离矩阵。 聚类成员(Cluster Menbership )选择框:无(None)选项:不显示类的样品构成;单一方案(Single solution)选项:选择此项,并输入一个确 定的分类数n,并输出聚成n个类时各个类的样品构成 情况。方案范围(Range of solutions):选择此项,并输入两个数n1, n2,将显示指定聚成n1类到n2类时各个类的样品构成 情况。6Plots 按钮 设置输出图形:树状图 冰状图S:系统聚类分析:所有聚类(巴聚类的楷定全距开姐聚类:停止聚类(巴:楼序栋准(或:|i |Q|w-右向垂现)7.Method按钮设置聚类分析的具体方法。幣助聚类方法:组间连接:类间平均法 组内连接:类内平均法最近临元素:最短距离法 最远临元素:最长距离法质心聚类法:重心法 中位数聚类法:中位数法Ward法:离差平方和法度量方法选择框:选择计算样品距离的方法转换值选择框:选择原始数据标准化的方法Z 得分,最常用的方法8Save 按钮 设置需要保存的分析结果。 输出结果的统计分析凝聚状态表聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集21414.33800522026.702008328291.0860014427301.5420085452.1481020617182.7990012723243.5180017820274.3802417910155.3220022103166.278001811787.35400131217228.94660231371210.5441102014252812.33603241522114.261002116111316.234001917202318.37787241819202122232425262728293621.70111125.0884730.3191238.329101946.58831755.690202564.9223478.7471999.284110130.814320166.86113232.00010001651319159018121714232021026222524272823212526272528282729290第 1 列:步骤号,一共进行了29 聚类第 2 和 3 列:表示某步聚类时的哪两个样品或类进行了合并,合 并后的类号为第2 列的样品或类号第 4 列:聚类时的两个样品或类间的距离第 5 和 6 列:表示某步聚类时是样品还是类参与合并第 7 列:表示本步所聚成的类,再下面的第几步聚类时用到。 成员表群集成员案例8群集7群集6群集5群集4群集1:北京111112:天津111113:河北222224:山西333225:内蒙333226:辽宁222227:吉林333228:黑龙江333229:上海4443110:江苏5554311:浙江1111112:安徽3332213:福建1111114:江西3332215:山东16:河南17:湖北18:湖南19:广东20:广西21:海南22:四川23:贵州24:云南25:西藏26:陕西27:甘肃28:青海29庁夏30:新疆 水平冰柱图辽冏期四山1|:内古创去广愿廿新虫云西由宁 6:7:e2:4:4-5:7-老2-0|3-7.0:3:4:5:百宜 115* 1 k122-2J22222树状图52665716778778875222561266766776522256126666666642224512555555553222341244444444鬲10Dendrogram using Ward MethodRescaled Distance Cluster Combine啜H+1111111+11111111 +1+11111 +1+1111111Z THZ00THZco9 TH9006ZLOco oq寸 oqO9ZOCOO tHLO6 TH2TV/、/、a2 TV 同”、反hh底HIffllg ruw 療氐S+lt00t z 桂丽 + +1 g 脈&+I+I 寸 itsw+1 寸tsm+ EnN IQqcd骨 ON % 01结果分析:123456784类北京 天津 上海 浙江 福建 海南河北 山西 内蒙 辽宁 吉林 黑龙江 安徽 江西 河南 湖北 湖南 四川江苏 山东 广东广西 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆5类北京 天津 浙江 福建 海南河北 山西 内蒙 辽宁 吉林 黑龙江 安徽 江西 河南 湖北 湖南四川上海江苏 山东 广东广西 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆6类北京 天津 浙江 福建 海南辽宁 河南 湖北 湖南 四川江西 吉林 黑龙江 安徽 山西 内蒙上海江苏山东广东广西 贵州 云南 西藏 陕西 甘肃 青海 宁夏新疆7类北京 天津 浙江 福建海南辽宁 河南 湖北 湖南四川江西 吉林 黑龙江 安徽 山西内蒙上海江苏山东广东广西 贵州 云南 陕西 甘肃 新疆西藏青海宁夏8类北京辽宁江西上海江苏湖北广西西藏天津 浙江 福建海南河南吉林 黑龙江 安徽 山西内蒙山东广东湖南四川贵州 云南 陕西 甘肃 新疆青海宁夏二、动态聚类法的 SPSS 实现在 SPSS 中,凝聚点的指定不是必须的,系统会自动根据分类数目 结合样品情况来选取凝聚点。形成初始分类的方法通常有两种,一是直接将每个样品按与其距离最 近的凝聚点并类,二是先让每个凝聚点自成一类,将样品依此并入与 其距离最近的凝聚点的一类,并计算该类的重心,以这个重心代替原 来的凝聚点,再考虑下一个样品的并类,直至所有样品都归类为止。操作:分析(Analyze)= 分类(Classify) = k-均值聚类(K-Means Cluster)打开k-均值聚类分析(K-Means Cluster Analysis)对话框变量列表框 :聚类数(N umber of Clusters)输入框输入指定的聚类数目。1.迭代(Iterate)按钮设置快速聚类的迭代终止条件。2.保存(Save)按钮 设置需要保存的分析结果。3.选项(Options)按钮 选择快速聚类的输出结果,并指定对缺失 数据的处理方法。输出结果的统计分析凝聚点表InitiaLClusterCentersCluster123456GDP5381.7255.982849.525002.34630.072462.57居民消费水平26991110125815279425343固定资产投资1639.8317.87704.871229.55150.84996.48职工平均工资825073824839514544759279货物周转量656.504.20203
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号