资源预览内容
第1页 / 共77页
第2页 / 共77页
第3页 / 共77页
第4页 / 共77页
第5页 / 共77页
第6页 / 共77页
第7页 / 共77页
第8页 / 共77页
第9页 / 共77页
第10页 / 共77页
亲,该文档总共77页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第第12章章非参数检验非参数检验说明:非参数检验这章,请看下面吴喜之教授的讲义,更为具体的可参看统计分析与SPSS的应用薛薇 编著 人大出版社,2002.7第二次印刷非参数检验的概念非参数检验的概念是指在总体不服从正态分布且分布情况不是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。一般不涉及总体参数故得名。这类方法的假定前提比参数性假设检验方这类方法的假定前提比参数性假设检验方法少的多,也容易满足,适用于计量信息法少的多,也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。在实际中有广泛的应用。非参数检验的过程非参数检验的过程1.Chi-Squaretest卡方检验卡方检验2.Binomialtest二项分布检验二项分布检验3.Runstest游程检验游程检验4.1-SampleKolmogorov-Smirnovtest一个样本一个样本柯尔莫哥洛夫柯尔莫哥洛夫-斯米诺夫检验斯米诺夫检验5.2independentSamplesTest两个独立样本检验两个独立样本检验6.KindependentSamplesTestK个独立样本检验个独立样本检验7.2relatedSamplesTest两个相关样本检验两个相关样本检验8.KrelatedSamplesTest两个相关样本检验两个相关样本检验12.1卡方检验卡方检验Chi-Squaretest 这这里里介介绍绍的的卡卡方方检检验验可可以以检检验验列列联联表表中中某某一一个个变变量量的的各各个个水水平平是是否否有有同同样样比比例例或或者者等等于于你你所所想想象象的的比比例例(如如5:4:1)实实例例1:掷掷骰骰子子300次次,变变量量LMT,1、2、3、4、5、6分分别别代代表表六六面面的的六六个个点点,试试问问这这骰骰子子是是否否均均匀匀。数数据据data12-01(300个个cases)。)。nAnalyzeNonparametricTestsChiSquarenTestVariable:lmt想要检验的变量想要检验的变量n由由于于这这是是一一个个均均匀匀分分布布检检测测,使使用用默默认认选选择择(ExpectedValues:Allcategoriesequal作为零假设);作为零假设);n比比较较有有用用的的结结果果:sig=.1110.5,不不能能拒拒绝绝零零假假设设,认认为为均均匀。匀。实实例例1的的数数据据可可以以组组织织成成:两两个个变变量量(side面面和和number次次数数),6个个cases。但但在在卡卡方方检检验验前前要要求求用用number加权。结果同。加权。结果同。补充:补充:卡方检验实例实实例例:心心脏脏病病人人猝猝死死人人数数与与日日期期的的关关系系,收收集集168个个观观测测数数据据。其其中中用用1、2、3、4、5、6、7表表示示是是星星期期几几死死的的。而而人人数数分分别别为为55、23、18、11、26、20、15。推推 断断 心心 脏脏 病病 人人 猝猝 死死 人人 数数 与与 日日 期期 的的 关关 系系 是是 否否 为为2.8:1:1:1:1:1:1。(变变量量2个个:死死亡亡日日期期和和死死亡亡人人数数,Cases7个个)加权:加权:DataWeightCases:死亡人数死亡人数AnalyzeNonparametricTestsChiSquarenTestVariable:死亡日期死亡日期nExpectedValues:2.8:1:1:1:1:1:1n比比较较有有用用的的结结果果:sig=.2560.5,不不能能拒拒绝绝零零假假设设,认认为为心心脏病人猝死人数与日期的关系为脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1。12.2二项分布检验二项分布检验Binomialtest二二项项分分布布:在在现现实实生生活活中中有有很很多多的的取取值值是是两两类类的的,如如人人群群的的男男和和女女、产产品品的的合合格格和和不不合合格格、学学生生的的三三好好学学生生和和非非三三好好学学生生、投投掷掷硬硬币币的的正正面面和和反反面面。这这时时如如果果某某一一类类出出现现的的概概率率是是P,则则另另一一类类出出现现的的概概率率就就是是1-P。这这种种分布称为二项分布。分布称为二项分布。实实例例1:掷掷一一枚枚比比赛赛用用的的挑挑边边器器31次次,变变量量tbh,1为为出出现现A面面、2为为出出现现A面面,试试问问这这挑挑边边器器是是否否均均匀匀。数数据据data12-03(31个个cases)。)。nAnalyzeNonparametricTestsBinomialnTestVariable:tbhn由由 于于 这这 是是 一一 个个 均均 匀匀 分分 布布 检检 测测 , 使使 用用 默默 认认 选选 择择 ( TestProportion:0.5););n比比较较有有用用的的结结果果:两两组组个个数数和和sig=1.000.5,不不能能拒拒绝绝零零假假设,认为挑边器是均匀。设,认为挑边器是均匀。实实例例1的的数数据据可可以以组组织织成成:两两个个变变量量(side面面和和number次次数数),2个个cases。但但在在二二项项分分布布检检验验前前要要求求用用number加权。结果同。加权。结果同。补充:二项分布检验实例补充:二项分布检验实例实实例例:为为验验证证某某批批产产品品的的一一等等品品率率是是否否达达到到90,现现从从该该批批产产品品中中随随机机抽抽取取23个个样样品品进进行行检检测测,结结果果有有19个个一一等等品品(1一一等等品品,0非非一一等等品品)。(变变量量2个个:一一等品和个数,等品和个数,Cases2个:个:119和和04)加权:加权:DataWeightCases:个数个数AnalyzeNonparametricTestsBinomialnTestVariable:一等品一等品nTestProportion:0.9n比比较较有有用用的的结结果果:两两组组个个数数和和sig=.1930.5,不不能能拒拒绝绝零零假假设,认为该批产品的一等品率达到了设,认为该批产品的一等品率达到了90。12.3游程检验Runs test 单单样样本本变变量量随随机机性性检检验验是是对对某某变变量量值值出出现现是是否否随随机机进进行行检验。检验。实实例例1(同同二二项项分分布布检检验验) :掷掷一一枚枚比比赛赛用用的的挑挑边边器器31次次,变变量量tbh,1为为出出现现A面面、2为为出出现现A面面,试试问问这这挑挑边边器器出出现现AB面面是是否否随随机机。数数据据data12-03(31个个cases)。)。nAnalyzeNonparametricTestsRunsnTestVariable:tbhnCutPoint:Custom:2n比较有用的结果:比较有用的结果:总总case数(数(31)、)、游程游程Run数(数(21)、)、sig=.1420.5,不能拒绝零假设,不能拒绝零假设,认为挑边器出现认为挑边器出现AB面是随机的。面是随机的。12.4 一个样本柯尔莫哥洛夫-斯米诺夫检验 1-Sample Kolmogorov-Smirnov test 单单样样本本KS检检验验是是利利用用样样本本数数据据推推断断总总体体是是否否服服从从某某一一理理论论分分布布,适适用用于于探探索索连连续续型型随随机机变变量量的的分分布布形形态态(判判断断定定距距变变量量的的分分布布情情况况):Normal正正态态分分布布、Uniform均均匀匀分分布布、Poisson泊泊松松分分布布、Exponential指数分布。指数分布。实实例例 :卢卢瑟瑟福福和和盖盖革革作作了了一一个个著著名名的的实实验验,他他们们观观察察了了长长为为7.5秒秒的的时时间间间间隔隔里里到到达达某某个个计计数数器器的的由由某某块块放放射射物物资资放放出出的的alfa粒粒子子质质点点数数,共共观观察察了了2608次次。数数据据data12-05(1个个变变量量zd,2608个个cases,按按010排序)。试问这种分布规律是否服从泊松分布排序)。试问这种分布规律是否服从泊松分布nAnalyzeNonparametricTests1-SampleK-SnTestVariable:zdnTestDistribution:Poissonn比较有用的结果:比较有用的结果:均值(均值(3.8673)、)、sig=.8500.5,不能拒绝零假设,不能拒绝零假设,认为服从泊松分布认为服从泊松分布。12.5两个独立样本检验两个独立样本检验2independentSamplesTest通通过过分分析析两两个个样样本本数数据据,推推断断它它们们的的分分布布是是否否存存在在显显著著性性差差异异。方方法有四种:法有四种:nMann-WhitneyU:是通过对平均秩的研究来实现推断的是通过对平均秩的研究来实现推断的nKSZ:是通过对分布的研究来实现推断的是通过对分布的研究来实现推断的nMosesextremereactions:一个作为控制样本,另一个作为实验样本一个作为控制样本,另一个作为实验样本nWaldWolfwitzRuns:是通过对游程的研究来实现推断的是通过对游程的研究来实现推断的实实例例 :甲甲乙乙两两种种安安眠眠药药服服用用后后的的效效果果。数数据据data12-06(2个个变变量量:组组别别zb和和延延长长时时间间ycss,20个个cases)。试试问问这这两两种种药药物物的的疗疗效效是否有显著性差异。是否有显著性差异。nAnalyzeNonparametricTests2independentSamples nTestVariable:ycssnGrouping:zb(1,2)nTesttype:四种均选四种均选n比比较较有有用用的的结结果果:比比较较四四个个sig值值,有有三三个个sig.5,不不能能拒拒绝绝零零假设认为疗效无显著性差异假设认为疗效无显著性差异。12.6多个独立样本检验多个独立样本检验KindependentSamplesTest通通过过分分析析多多个个样样本本数数据据,推推断断它它们们的的分分布布是是否否存存在在显显著著性性差差异异。方方法有三种:法有三种:nMedian:是通过对中位数的研究来实现推断的是通过对中位数的研究来实现推断的nKW:是通过对推广的平均秩的研究来实现推断的是通过对推广的平均秩的研究来实现推断的nJT:与两个独立样本检验的与两个独立样本检验的Mann-WhitneyU类似类似实实例例 :某某车车间间用用四四种种不不同同的的操操作作方方法法检检测测产产品品优优等等品品率率的的实实验验数数据据。数数据据data12-07(2个个变变量量: 方方法法ff和和优优等等品品率率ydpl, 21个个cases)。试试问问这这四四种种不不同同的的操操作作方方法法对对产产品品优优等等品品率率是是否否有有显显著著性差异。性差异。nAnalyzeNonparametricTestsKindependentSamples nTestVariable:ydplnGrouping:ff(1,4)nTesttype:三种均选三种均选n比比较较有有用用的的结结果果:比比较较三三个个sig值值,K-W方方法法的的sig.009.5,但但不不用用,原原因因是是观观测测量量太太少。少。12.7两个相关样本检验两个相关样本检验2relatedSamplesTest同一个被测试者,前后测两次,彼此相关。方法有四种。同一个被测试者,前后测两次,彼此相关。方法有四种。实实例例 :某某校校15名名男男生生的的长长跑跑锻锻炼炼后后晨晨脉脉变变化化数数据据。数数据据data12-08(2个个变变量量:锻锻炼炼前前dlq和和锻锻炼炼后后dlh优优,21个个cases)。试问锻炼前后的晨脉有无显著性差异。)。试问锻炼前后的晨脉有无显著性差异。nAnalyzeNonparametricTests2relatedSamples nTestPairs:dlqdlhnTesttype:选一种或多种选一种或多种n比比较较有有用用的的结结果果:看看sig值值,sigNonparametricTestskrelatedSamples nTestVariables:abcnTesttype:选一种或多种选一种或多种n比比较较有有用用的的结结果果:看看sig值值,sig.05,不能拒绝正态分布不能拒绝正态分布(Normal)零假设。零假设。由于由于sig=.000.05, 不不 能能 拒拒 绝绝 指指 数数 分分 布布(Exponential)零假设零假设比较三种分布检验,认为是该数据服从指数分布比较三种分布检验,认为是该数据服从指数分布SPSSSPSS软件使用说明软件使用说明 使用我们的使用我们的ksdata.sav数据。数据。选选项项为为AnalyzeNonparametricTests1SampleK-S。然然后后把把变变量量(这这里里是是x)选选入入VariableList。再再在在下下面面TestDistribution选选中中零零假假设设的的分分布布(Normal、Poisson、Uniform和和Exponential)作为零假设。作为零假设。在在点点Exact时时打打开开的的对对话话框框中中可可以以选选择择精精确确方方法法 ( Exact) , Monte Carlo抽抽 样样 方方 法法(MonteCarlo)或或用用于于大大样样本本的的渐渐近近方方法法(Asymptoticonly)。)。最后最后OK即可。即可。关于随机性的游程检验(关于随机性的游程检验(run run testtest) 游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由0和1组成的一个这种变量的样本(数据run1.sav):0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。这个数据中有4个0组成的游程和3个1组成的游程。一共是R=7个游程。其中0的个数为m=15,而1的个数为n=10。 关于随机性的游程检验(关于随机性的游程检验(run testrun test) 出现0和1的的这样一个过程可以看成是参数为某未知p的Bernoulli试验。但在给定了m和n之后,在0和1的出现是随机的零假设之下,R的条件分布就和这个参数无关了。根据初等概率论,R的分布可以写成(令N=m+n)关于随机性的游程检验(关于随机性的游程检验(run run testtest) 于是就可以算出在于是就可以算出在零假设下有关零假设下有关R的的概率,以及进行有概率,以及进行有关的检验了。利用关的检验了。利用上面公式可进行精上面公式可进行精确检验;也可以利确检验;也可以利用大样本的渐近分用大样本的渐近分布和利用布和利用MonteCarlo方法进行检方法进行检验。利用上面数据验。利用上面数据的结果是的结果是: :关于随机性的游程检验(关于随机性的游程检验(run testrun test) 当然,游程检验并不仅仅用于只取两个值的变量,它还当然,游程检验并不仅仅用于只取两个值的变量,它还可以用于某个连续变量的取值小于某个值及大于该值的可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于个数(类似于0和和1的个数)是否随机的问题。看下面例的个数)是否随机的问题。看下面例子。子。例例(run2.sav):从某装瓶机出来的从某装瓶机出来的30盒化妆品的重量如盒化妆品的重量如下(单位克)下(单位克)71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9为了看该装瓶机是否工作正常,首先需要验证是否大于为了看该装瓶机是否工作正常,首先需要验证是否大于和小于中位数的个数是否是随机的(零假设为这种个数和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。的出现是随机的)。关于随机性的游程检验(关于随机性的游程检验(run run testtest) 如果把小于中位数的记为0,否则记为1,上面数据变成下面的01序列1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 这就归为上面的问题。当然这里进行这种变换只是为了易于理解。实际计算时,用不着这种变换,计算机会自动处理这个问题的。直接利用这个数据,通过SPSS,得到下面游程检验结果的输出。 SPSSSPSS软件使用说明软件使用说明 用run2.sav数据。选项为AnalyzeNonparametric TestsRuns。然后把变量(这里是length)选入Variable List。再在下面Cut Point选中位数(Median)。当然,也可以选其他值,如均值(Mean),众数(Mode)或任何你愿意的数目(放在Custom)。注意在对前面的由0和1组成的序列(run1.sav进行随机性检验时,要选均值(为什么?)。在点Exact时打开的对话框中可以选择精确方法( Exact) , Monte Carlo抽 样 方 法 ( Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。Wilcoxon(Mann-Whitney)秩和检验秩和检验这这里里介介绍绍常常用用的的Wilcoxon(或或称称Mann-Whitney)秩秩和和检验。它的原理很简单,检验。它的原理很简单,假假定定第第一一个个样样本本有有m个个观观测测值值,第第二二个个有有n个个观观测测值值。把两个样本混合之后把这把两个样本混合之后把这m+n个观测值升幂排序,个观测值升幂排序,记记下下每每个个观观测测值值在在混混合合排排序序下下面面的的秩秩。之之后后分分别别把把两两个个样样本本所所得得到到的的秩秩相相加加。记记第第一一个个样样本本观观测测值值的的秩秩的的和和为为WX而而第第二二个个样样本本秩秩的的和和为为WY。这这两两个个值值可可以以互互相相推推算算,称为称为Wilcoxon统计量。统计量。该该统统计计量量的的分分布布和和两两个个总总体体分分布布无无关关。由由此此分分布布可可以以得得到到p-值。值。直直观观上上看看,如如果果WX与与WY之之中中有有一一个个显显著著地地大大,则则可可以以选择拒绝零假设。选择拒绝零假设。该该检检验验需需要要的的唯唯一一假假定定就就是是两两个个总总体体的的分分布布有有类类似似的的形形状(不一定对称)。状(不一定对称)。Wilcoxon(Mann-Whitney)秩和检验秩和检验下下面面数数据据(GDP.sav)是是地地区区1的的十十个个城城市市和和地地区区2的的15个个城城市市的的人人均均GDP(元元)。现现在在要要想想以以此此作作为为两两个个样样本本来来检检验验两两个个地地区区的的人人均均GDP的的中中位位数数m1和和m2是是否否一一样样,即即双双尾尾检检验验H0:m1=m2对对Ha:m1m2。由由于于地地区区2的的人人均均GDP的的中中位位数数大大于于地地区区1的的中中位位数数,因因此此也也可以做单尾检验可以做单尾检验H0:m1=m2对对Ha:m1m2。地区地区 1: 3223 452638362781598232164710562823034618地区地区 2: 5391 39834076594147484600632545345526569970085403667855375257由由SPSS的输出可以得到下面结果:的输出可以得到下面结果:Wilcoxon(Mann-Whitney)秩和检验秩和检验该结果头两行该结果头两行显示了显示了Mann-Whitney和和Wilcoxon统计量的值。另外和我们需要结果的统计量的值。另外和我们需要结果的相关部分为:对于双尾检验相关部分为:对于双尾检验H0:m1=m2对对Ha:m1m2,p-值为值为0.016(见(见“ExactSig.(2-tailed)”);而对于单尾检验而对于单尾检验H0:m1=m2对对Ha:m1m2(见见“ExactSig.(1-tailed)”),p-值值为为0.008。这两个结果是精确计算的。通常在样。这两个结果是精确计算的。通常在样本量大的时候利用近似方法得到渐近分布的本量大的时候利用近似方法得到渐近分布的p-值值(见(见“Asymp.Sig.(2-tailed)”),),它只给了双它只给了双尾检验的近似尾检验的近似p-值值0.017,和精确值差别不大。,和精确值差别不大。注意单尾检验的注意单尾检验的p-值是双尾检验的值是双尾检验的p-值的一半。值的一半。这个例子的结果表明,可以拒绝原假设,即有理这个例子的结果表明,可以拒绝原假设,即有理由认为地区由认为地区2的人均的人均GDP的中位数要高一些。的中位数要高一些。SPSSSPSS软件使用说明软件使用说明 使用GDP.sav数据。选项为AnalyzeNonparametric Tests2 Independent Samples。把变量(gdp)选入Test Variable List;再把用1和2分类的变量area输入进Grouping Variable,在Define Groups输入1和2。在Test Type选中MannWhitney。在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可两样本分布的两样本分布的Kolmogorov-Smirnov检验检验假定有分别来自两个独立总体的两个样本。要想检验它们背后的总体分布相同的零假设,可以进行两独立样本的Kolmogorov-Smirnov检验。原理完全和单样本情况一样。只不过把检验统计量中零假设的分布换成另一个样本的经验分布即可。假定两个样本的样本量分别为n1和n2,用S1 (X)和S2 (X)分别表示两个样本的累积经验分布函数。再记DjS1 (Xj)-S2 (Xj)。近似正态分布的检验统计量为 计算结果计算结果 twonp.sav:两种破坏性试验的持续时间。根据这个数据,n1=30,n2=25。由SPSS输出,得到 SPSSSPSS软件使用说明软件使用说明 使用twonp.sav数据。选项为AnalyzeNonparametric Tests2 Independent Samples。把变量(duration)选入Test Variable List;再把用1和2分类的变量type输入到Grouping Variable,在Define Groups输入1和2。在Test Type选中Kolmogorov-Smirnov Z。在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可两样本两样本Wald-Wolfowitz游程检验游程检验 Wald-Wolfowitz游程检验(Wald-Wolfowitz runs test)和Kolmogorov-Smirnov检验都是看两个样本所代表的总体是否分布类似。但是所采取的方法不一样。Wald-Wolfowitz游程检验把两个样本混合之后,按照大小次序排列,一个样本的观测值在一起的为一个游程。和单样本的游程问题类似。可以由游程个数R看出两个样本在排序中是否随机出现。由twonp.sav数据,可以得到下面SPSS关于Wald-Wolfowitz游程检验的输出: 软件使用:数据和前面一样,只软件使用:数据和前面一样,只在在Test Type选选Wald-Wolfowitz runs。 Kruskal-Wallis关于多个样本的秩和检验关于多个样本的秩和检验这个检验的目的是看多个总体的位置参数这个检验的目的是看多个总体的位置参数是否一样。是否一样。方法和方法和Wilcoxon-Mann-Whitney检验检验的思想类似。的思想类似。假定有假定有k个总体。先把从这个个总体。先把从这个k个总体来个总体来的样本混合起来排序,记各个总体观测值的样本混合起来排序,记各个总体观测值的秩之和为的秩之和为Ri,i=1,k。显然如果这些显然如果这些Ri很不相同,就可以认为它们位置参数相很不相同,就可以认为它们位置参数相同的零假设不妥(备选假设为各个位置参同的零假设不妥(备选假设为各个位置参数不全相等)。数不全相等)。Kruskal-Wallis关于多个样本的秩和检验关于多个样本的秩和检验注意这里所说的位置参数是在下面意义上的注意这里所说的位置参数是在下面意义上的q qi;由于它在分布函数由于它在分布函数Fi(x)中可以和变元中可以和变元x相加成为相加成为F(x+q qi)的样子,所以称的样子,所以称q qi为位置参数。为位置参数。形式上,假定这些样本有连续分布形式上,假定这些样本有连续分布F1,Fk,零零假设为假设为H0:F1=Fk,备选假设为备选假设为Ha:Fi(x)=F(x+q qi),i=1,k,这里这里F为某连续分布为某连续分布函数,而且这些参数函数,而且这些参数q qi并不相等。并不相等。Kruskal-Wallis检验统计量为检验统计量为Kruskal-Wallis关于多个样本的秩和检验关于多个样本的秩和检验公式中公式中n ni i为第为第i i个样本量,而个样本量,而N N为各个样本量之为各个样本量之和(总样本量)。和(总样本量)。如果观测值中有大小一样的数值,这个公式会如果观测值中有大小一样的数值,这个公式会有稍微的变化。有稍微的变化。这个统计量在位置参数相同的零假设下有渐近这个统计量在位置参数相同的零假设下有渐近的自由度为的自由度为k-1k-1的的c c2 2分布。分布。KruskalKruskal-Wallis-Wallis检验检验仅仅要求各个总体变量有相似形状的连续分布。仅仅要求各个总体变量有相似形状的连续分布。数据数据house.sav:三三个区域房价的数据个区域房价的数据为了调查三个地区的房价是否类似,在每个地为了调查三个地区的房价是否类似,在每个地区抽样,得到三个样本量分别为区抽样,得到三个样本量分别为2020、3030、2525的的房价样本。利用房价样本。利用SPSSSPSS软件,很容易得到下面的软件,很容易得到下面的检验结果:检验结果:SPSSSPSS软件使用说明软件使用说明 使用house.sav数据。选项为AnalyzeNonparametric TestsK Independent Samples。把变量(这里是price)选入Test Variable List;再把数据中用1、2、3来分类的变量group输入Grouping Variable,在Define Groups输入1、2、3。在下面Test Type选中Kruskal-Wallis H。点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可Jonckheere-Terpstra多样本的秩检验多样本的秩检验这个检验处理的问题和这个检验处理的问题和KruskalKruskal-Wallis-Wallis检验类似,零假设检验类似,零假设都是各个总体的位置参数相同,但这里的备选假设为各个都是各个总体的位置参数相同,但这里的备选假设为各个总体的位置参数按升幂排列(如为降幂排列,可把总体编总体的位置参数按升幂排列(如为降幂排列,可把总体编号颠倒顺序即为升幂排列)。号颠倒顺序即为升幂排列)。注意这里所说的位置参数和前面的注意这里所说的位置参数和前面的KruskalKruskal-Wallis-Wallis检验中检验中的位置参数意义一样。的位置参数意义一样。JonckheereJonckheere- -TerpstraTerpstra检验先在每两个样本所有观测值对检验先在每两个样本所有观测值对之间比较,计算第之间比较,计算第i i个样本观测值中小于第个样本观测值中小于第j j个样本观测值个样本观测值的对子数:的对子数: 数据数据house.sav:三三个区域房价的数据个区域房价的数据很容易得到SPSS的Jonckheere -Terpstra检验结果输出: SPSSSPSS软件使用说明软件使用说明 使用house.sav数据。选项为AnalyzeNonparametric TestsK Independent Samples。把变量(这里是price)选入Test Variable List;再把数据中用1、2、3来分类的变量group输入Grouping Variable,在Define Groups输入1、2、3。在下面Test Type选中Jonckheere-Terpstra。在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可 Brown-Mood中位数检验中位数检验在有数个独立样本的情况,希望知道它们的中位数是否相等。零假设是这些样本所代表的总体的中位数相等。备选假设是这些中位数不全相等。假定有k个总体,ni为第i个样本量;把所有样本量之和记为N。先把从这个k个总体来的样本混合起来排序,找出它们的中位数。再计算每个总体中小于该中位数的观测值个数O1i,i=1,k,和每个总体中大于该中位数的观测值个数O2i,i=1,k。这样就形成了一个由元素Oij组成的2k表。其列总和为ni,i=1,k;而两个行总和为各样本小于总中位数的观测值总和:R1O11+O12+ O1k及各样本大于总中位数的观测值总和R2O21+O22+ O2k。这显然是一个列联表,可以用Pearson c2统计量,即 house.sav数据数据这里这里SPSSSPSS软件使用说明软件使用说明 使用house.sav数据。选项为AnalyzeNonparametric TestsK Independent Samples。把变量(这里是price)选入Test Variable List;再把数据中用1、2、3来分类的变量group输入Grouping Variable,在Define Groups输入1、2、3。在下面Test Type选中Median。在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可 Friedman秩和检验秩和检验前面讨论了两因子试验设计数据的方差分析,那里所用的F检验需要假定总体的分布为正态分布。有一种非参数方差分析方法,称为Friedman (两因子)秩和检验,或Friedman方差分析。它适用于两个因子的各种水平的组合都有一个观测值的情况。Friedman秩和检验秩和检验假定第一个因子有k个水平(称为处理,treatment),第二个因子有b个水平(称为区组);因此一共有kbkb个观测值。这里之所以称一个因子为处理,是因为这是我们想要看该因子各水平是否对试验结果有显著的不同(它的各个水平的观测值也就是本小节的多个相关样本)。而另一个因子称为区组,不同的区组也可能对结果有影响。下面是一个例子。数据数据fert.sav这里有三种肥料作为第一个因子(肥料因子)的三个水平;而四种土壤为第二个因子(土壤因子)的四个水平。感兴趣于是否这三种肥料对于某作物的产量有区别。称肥料因子为处理,而土壤因子为区组。数据在下表中(表中数字为相应组合的产量,单位公斤)。肥料种类肥料种类肥料肥料A肥料肥料B肥料肥料C土土壤壤类类型型土壤土壤1224668土壤土壤2253648土壤土壤3182120土壤土壤4111319Friedman秩和检验秩和检验Friedman秩和检验是关于位置的,和Kruskal-Wallis检验类似,形式上,假定这些样本有连续分布F1,Fk,零假设为H0:F1=Fk,备选假设为Ha:Fi(x)=F(x+qi),i=1,k,这里F为某连续分布函数,而且这些参数qi并不相等。虽然这和以前的Kruskal-Wallis检验一样,但是由于区组的影响, 要首先在每一个区组中计算各个处理的秩;再把每一个处理在各区组中的秩相加.如果Rij表示在j个区组中第i个处理的秩。则秩按照处理而求得的和为 Friedman秩和检验秩和检验这样做的目的是在每个区组内比较处理。例如, 同个年龄段中比较药品的疗效比不分年龄来比较疗效要合理;在同一个部位比较不同的材料要比混合起来比较要合理等等。这里要引进的Friedman统计量定义为第一个式子表明,如果各个处理很不一样,和的平方就第一个式子表明,如果各个处理很不一样,和的平方就会很大,结果就显著。第二个公式是为了计算方便而导会很大,结果就显著。第二个公式是为了计算方便而导出的。它有近似的(有出的。它有近似的(有k-1个自由度的)个自由度的)c c2分布。分布。 fert.sav数据数据SPSSSPSS软件使用说明软件使用说明 使用fert.sav数据。选项为AnalyzeNonparametric TestsK Related Samples。然后把变量(这里是a、b、c)选入Test Variable List。在下面Test Type选中Friedman。在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可Kendall协同系数检验协同系数检验在实践中,常需要按照某些特别的性质来多次对一些个体进行评估或排序;比如几个(m个)评估机构对一些(n个)学校进行排序。人们想要知道,这些机构的不同结果是否一致。如果很不一致,则该评估多少有些随机,意义不大。换句话说,这里想要检验的零假设是:这些对于不同学校的排序是不相关的或者是随机的;而备选假设为:这些对不同学校的排序是正相关的或者是多少一致的。Kendall协同系数检验协同系数检验一个机构对诸个体(学校)的秩(次序)的和为1+2+n=n(n+1)/2;所有m个机构对所有个体评估的总秩为mn(n+1)/2;这样对每个个体的平均秩为m(n+1)/2。如果记每一个个体的m个秩(次序)的和为Ri(i=1,n),那么,如果评估是随机的,这些Ri与平均秩的差别不会很大,反之差别会很大,也就是说下面的个体的总秩与平均秩的偏差的平方和S很大。S定义为 Kendall协同系数检验协同系数检验这 个 和 Kendall协 同 系 数 ( Kendalls Coefficient of Concordance)是成比例的,Kendall协同系数W(Kendalls W)定义为 数据数据school.sav下面是4个独立的环境研究单位对15个学校排序的结果每一行为一个评估机构对这些学校的排序。看上去不那么一致(也有完全一致的): 数据数据school.savSPSS的Kendall协同系数检验的输出SPSSSPSS软件使用说明软件使用说明 使用school.sav数据。选项为AnalyzeNonparametric TestsK Related Samples。然后把变量(这里是s1、s2、s15)选入Test Variable List。在下面Test Type选中Kendalls W。在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可关于二元响应的关于二元响应的Cochran检验检验 前面讨论了两因子方差分析问题的Friedman秩和检验。但是当观测值只取诸如0或1两个可能值时,由于有太多同样的数目(只有0和1),排序的意义就很成问题了。这里要引进的Cochran检验就是用来解决这个问题的一个非参数检验。这里的零假设也是各个处理是相同的。先看一个例子 关于瓶装饮用水的调查(数据在water.sav)。20名顾客对4种瓶装饮用水进行了认可(记为1)和不认可(记为0)的表态。我们感兴趣的是这几种瓶装水在顾客眼中是否有区别。这里的零假设是这些瓶装水(作为处理)在(作为区组的)顾客眼中没有区别。 数据数据water.sav下表是数据,每一行为20个顾客对某一饮料的20个观点(0或1)。最后一列1为认可总数Ni而最后一行为每个顾客给出的4个观点中认可数的总和Li。最后一行的最后的元素为总认可数N。显然,如果显然,如果Ni和这些和这些Ni的均值的差距很大,那么这些处理就很的均值的差距很大,那么这些处理就很不一样了。不一样了。Cochran检验就是基于这个思想的。用检验就是基于这个思想的。用Ni表示第表示第i个个处理所得到的处理所得到的“1”的个数,而的个数,而Lj为第为第j个区组(例子中的顾客)个区组(例子中的顾客)所给的所给的“1”的个数,的个数,“1”的总数记为的总数记为N。 关于二元响应的关于二元响应的Cochran检验检验Cochran检验统计量(Cochrans Q)为(假定有k个处理和b个区组)当当k固定时,固定时,Q在在b很大时有近似的自由度很大时有近似的自由度为为k-1的的c c2分布。分布。 数据数据water.savCochran检验的SPSS输出: SPSSSPSS软件使用说明软件使用说明 使用water.sav数据。选项为AnalyzeNonparametric TestsK Related Samples。然后把变量(这里是c1、s2、c3、c4)选入Test Variable List。在下面Test Type选中Cochrans Q。在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号