资源预览内容
第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
第9页 / 共9页
亲,该文档总共9页全部预览完了,如果喜欢就下载吧!
资源描述
. 5.5 考察鸢尾属植物中三个不同品种的话的如下四个形状指标: :萼片长度;萼片宽度;:花瓣长度;:花瓣宽度。重这三个品种(记为1,2,3)各选取50株,测得上述指标的取值如表5.10所示。假如三个品种的着、这4个指标均服从4维正态分布,且先验概率相等,按下列要求进行Bayes判别分析: 表5.10 鸢尾属植物三个不同品种的话的形状数据编号品种编号品种115033142762662946132146341437725227391431463610278260344516415133175792502035105155351328025524371061483116281258273912715234142822622943138149361418325930421591443213284260224010101503516685267314715111443013286263234413121473216287256304113131483014388263254915141513816289261284712151483419290264294313精品.1615030162912512530111715032122922572841131814330111932612947141915840122942562936132015138194952693149152114930142962552540132215135142972552340132315034164982663044142414632142992682848142515744154100267305017261503614210136428562227154341541023673156242815242151103363285115291554214210436931512330149311521053653052203115439174106365305518321503415210735827511933144291421083683259233414732132109362345423351463115211037738672236151341521113673357253715035133112376306621精品.3814931151113349254517391543715211436730522340154391341153593051184115135143116363255019421483416211736432532343148301411183793864204414523133119367335721451573817312037728672046151381531213632749184715434172122372326018481513715412336130491849152351521243612656145015337152125364285621512652846151263622848185226222451512737730612353259324818128363345624542613046141293582751195526027511613037230581656256253911131371305921572572845131323643155185826333471613336030481859270324714134363295618精品.60264324515135377266923612612840131363602250156225524381113736932572363254304515138374286119642582640121393562849206525526441214037329631866250233310141367255818672673144141423653058226825630451514336931542169258274110144372366125702602945151453653251207125726351014636427531972257194213147368305521732492433101483572550207425627421314935828512475257304212150363336025(1)只考虑指标和,并假定各总体协方差矩阵不全相等,给出误判率的回代估计和交叉确认估计;(2)只考虑指标和,并假定各总体协方差矩阵相等,写出线性判别函数,给出误判率的回代估计和交叉确认估计并于(1)中结果作比较;(3)假定有新样品,在(1),(2)之下,该样品非别被判归哪个总体?精品.(4)利用全部4个指标重复(1)和(2)的分析,结果如何?是否所用指标越多,分类效果越好?在尝试其他几个指标组合,情况有如何? 解:(1)误判率的回代估计: 误判率的交叉确认估计: 由以上结果可以看出,当只考虑指标和,并假定各总体协方差矩阵不全相等的情况下,无论用回代法还是用交叉分析法,均存在误判,且误判情况相同,共有7个误判:将第52号的样品由品种2误判为品种3;第53号的样品由品种2误判为品种3;第55号的样品由品种2误判为品种3;第100号的样品由品种2误判为品种3;第103号的样品由品种3误判为品种2;第124号的样品由品种3误判为品种2;第130号的样品由品种3误判为品种2。误判的回代估计和交叉确认估计为: (2)当各总体协方差矩阵相等,即,只需把程序中pool=no改为pool=yes,运行结果整理如下:线性判别函数为:精品.误判率的回代估计: 误判率的交叉确认估计:由以上结果可以看出,当只考虑指标和,并假定各总体协方差矩阵相等的情况下,求出线性判别函数,并利用函数对样本进行回代估计和交叉确认估计,均误判现象,其中, 用回代发法,共有5个误判现象:将第53号样品由品种2误判为品种3;第103号样品由品种3误判为品种2;第124号样品由品种3误判为品种2;第130号样品由品种3误判为品种2;第136号样品由品种3误判为品种2;故误判率的回代估计为: 用交叉确认法,共有6个误判现象:将第53号样品由品种2误判为品种3;第100号样品由品种2误判为品种3;第103号样品由品种32误判为品种2;第124号样品由品种3误判为品种2;第130号样品由品种3误判为品种2;第136号样品由品种3误判为品种2;故误判率的交叉确认法为: 精品. 很显然,当各总体协方差矩阵相等时,误判率的回代估计和交叉确认估计都比各总体协方差矩阵不全相等时的低。 (3)在各总体协方差矩阵不全相等情况下,新样品被判归品种2;而在各总体协方差矩阵相等的情况下,新样品被判归品种3。(4)首先是假设各总体协方差矩阵不全相等情况,考虑全部指标,结果如下:误判率的回代估计: 误判率的交叉确认估计:由以上结果可以看出,考虑全部指标,并假定各总体协方差矩阵不全相等的情况下,无论用回代法还是用交叉分析法,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号