资源预览内容
第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
亲,该文档总共6页全部预览完了,如果喜欢就下载吧!
资源描述
有序样品的聚类为了了解儿童的生长发育规律,今随机抽样统计了男孩 从出生到11岁平均增长的重量数据表如下,试问:男孩发 育可分为几个阶段?n记与年龄对应的儿童增重数的11个数据,表示儿童的增重数,例如 表示8岁儿童的平均年增重为 2 (千克)。如果要把增重数 分成保持次序的3个组这时可以有 种选择。例如 , , 就是一种可选择的分类方法。一个好的分类方法就是应该使处于同一类事物之间的差别尽 可能地小,而使类与类之间的差别尽可能地大。为了表示类 内部事物与事物的差别,我们借用统计中全距(直径)的计 算方法, 以 、 、 这个分类为例来说 明计算类内差别的方法:其中第一类 对应的数据为9.3、1.8、1.9,最大值为 9.3,最小值为1.8,这一类的差异我们用全距9.3-1.8=7.5 第二类 中最大值为2.0,最小值为1.3,则2.0-1.3=0.7 第三类 中的最大值为2.3,最小值为1.9,则2.3-1.9=0.4为衡量上述分类方法的优劣,我们计算此种分类方法中的三 个类内的平均差异,即规定该分类方法的优劣指标K为n对于另一种分类方法 1.、2、3、4 、5、6、7、 8、9、10、11 其第一类的类内差异为7.6,第二类的类内差异为0.2 第三类的类内差异为0.9。该分类方法的优劣指标K 为2.9。相比之下,此分类方法不如前一种分类方法好 。n试问:分三类最好的分类方法应怎么分?n把11个有序数据分成3类共有45种方法,计算每类分 法的优劣指标并加以比较,可以得到最好的(分三类) 方法为 1、2,3,4,5,6,7 、8、9、10、11 此分 类方法的优劣指标K是 0.3 以同样的方法分析,可知把这11个数据分成 两类的最好分类方法是这时的优劣指标K为 0.5那么这11个数据分成几类为宜呢?为此我们分别找到把11个数据分成1类、2类、11类 的最好的分类法,计算出各最好分类方法的优劣指标,列 表如下:由表可看到,如果把1至11岁的数据只分成一类时,K8 ,优劣指标值太大;而对n大于4时的K值相差不多;而当 n3或n4时,K值已降为0.30和0.20.而n=5及其以上时 ,K相差太小,而类分得太多无意义,因此分成3类或4类 为宜。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号