资源预览内容
第1页 / 共33页
第2页 / 共33页
第3页 / 共33页
第4页 / 共33页
第5页 / 共33页
第6页 / 共33页
第7页 / 共33页
第8页 / 共33页
第9页 / 共33页
第10页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章第二章 非参数统计非参数统计第一节第一节 单样本问题单样本问题第二节第二节 两样本问题两样本问题第三节第三节 多样本问题多样本问题第四节第四节 秩相关分析秩相关分析 第四节第四节 二维列联表二维列联表 假设总体分布类型,不能确定的是有限个分假设总体分布类型,不能确定的是有限个分假设总体分布类型,不能确定的是有限个分假设总体分布类型,不能确定的是有限个分布参数,根据样本提供信息对未知参数进行统计布参数,根据样本提供信息对未知参数进行统计布参数,根据样本提供信息对未知参数进行统计布参数,根据样本提供信息对未知参数进行统计推断的统计方法推断的统计方法推断的统计方法推断的统计方法. . . . 非参数统计非参数统计非参数统计非参数统计nonparametric statisticsnonparametric statisticsnonparametric statisticsnonparametric statistics: : : :对总体分布类型不了解对总体分布类型不了解对总体分布类型不了解对总体分布类型不了解( ( ( (只做连续或对称等简单只做连续或对称等简单只做连续或对称等简单只做连续或对称等简单假设假设假设假设) ) ) )时进行推断的统计方法时进行推断的统计方法时进行推断的统计方法时进行推断的统计方法. . . .依赖于特定分布类型,比较的是参数依赖于特定分布类型,比较的是参数依赖于特定分布类型,比较的是参数依赖于特定分布类型,比较的是参数 . . . .不受总体参数的影响,比较分布或分布位置不受总体参数的影响,比较分布或分布位置不受总体参数的影响,比较分布或分布位置不受总体参数的影响,比较分布或分布位置 . . . .参数统计参数统计参数统计参数统计parametric statisticsparametric statisticsparametric statisticsparametric statistics 对于符合参数统计分析条件者,采用非参数统计分析,其检验效能较低. 非参数检验的适用范围非参数检验的适用范围 适用范围广;可用于任何类型资料适用范围广;可用于任何类型资料, ,具有较具有较好的稳健性好的稳健性. .资料分布类型不明确;个别数据偏离过大或数据某一端的值不确定(如0.002、65等) 必选;各组离散程度相差悬殊;频数表资料;如:偏态分布 ;等级资料( (非常有效非常有效););第一节第一节 单样本问题单样本问题1.符号检验2 趋势检验.3 游程检验4 对称中心的检验主要介绍: 符号检验思想非常简单,通过数据中含有 正、负号的个数来做统计推断.一、符号检验一、符号检验sign testsign test如关于总体中位数 的检验问题 1.1.双边假设检验双边假设检验中符号为正的数目,中符号为负的数目.若假设所有样本值与 不同,如果原假设成立,应大体相等.都服从二项分布过大或过小时, 我们有理由拒绝有 2.2.单边假设检验单边假设检验作为检验统计量若取作为检验统计量取 3.3.单边假设检验单边假设检验作为检验统计量取作为检验统计量若取假设有一个或多个样本值与 相同都服从二项分布其它各种形式的检验与上同原假设相当于检验二项分布的的参数当当样样本本容容量量较较大大,即即N25时时,可可以以用用正正态态分分布布近似处理,检验统计量为:近似处理,检验统计量为:为了提高近似程度为了提高近似程度, ,进行连续性修正进行连续性修正, ,采用更好的采用更好的近似:近似:例例1 假设某地16座预出售的楼盘均价,单位(百元/平方米)如下表所示:36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35 wbinom.test(sum(w37), sum(w37)+sum(w37)+sum(w 37) and sum(w 37) + sum(w data: sum(w 37) and sum(w 37) + sum(w 37) 37)number of successes = 3, number of trials number of successes = 3, number of trials = 16, = 16, p-value = 0.02127p-value = 0.02127alternative hypothesis: true probability alternative hypothesis: true probability of success is not equal to 0.5of success is not equal to 0.595 percent confidence interval:95 percent confidence interval: 0.04047373 0.45645655 0.04047373 0.45645655sample estimates:sample estimates: probability of success probability of success 0.1875 0.1875拒绝原假设,拒绝原假设,认为分布中心认为分布中心不在为不在为3737(百元/平方米)二、趋势检验二、趋势检验Trends testTrends test检验原理检验原理: :令如果原假设成立,应大体相等.都服从二项分布中符号为正的数目,xxif(length(x)%2=0) if(length(x)%2=0) # #当样本个数当样本个数length(x)length(x)为偶数时为偶数时N=length(x)/2N=length(x)/2 # #配对个数配对个数N N if(length(x)%2=1) if(length(x)%2=1) DDfor(i in 1: N) for(i in 1: N) Di=xi- Di=xi-xxi+Ni+N# #当样本个数当样本个数length(x)length(x)为奇数时为奇数时N=(length(x)+1)/2N=(length(x)+1)/2# #配对个数配对个数N-1N-1 for(i in 1: N-1) for(i in 1: N-1) Di=xi- Di=xi-xxi+Ni+NExact binomial testExact binomial testdata: sum(D 0) and sum(D 0) + sum(D 0) and sum(D 0) + sum(D binom.test(sum(D0), sum(D0)+sum(Dbinom.test(sum(D0), sum(D0)+sum(D 20, 可用正态近似计算可用正态近似计算.常数常数, ,当当建立了抽样分布之后,在零假设成立时,可以计算 或者 的值,进行检验。 1. Runs Test: 小样本情况小样本情况有?游程检验表可查临界值?表可查例例3 例例2中某地区中某地区32年来的降雨量是否是随机的?年来的降雨量是否是随机的?输入输入R R命令命令library(tseries)library(tseries) # #调入程序包调入程序包tseriestseries wwxxif(wi-median(w)if(wi-median(w)xi=0xi=0 xxruns.test(x) runs.test(x) # #游程检验函数游程检验函数for(i in 1:length(w)for(i in 1:length(w)if(wi-median(w)0)if(wi-median(w)0)xi=1xi=1输出结果为输出结果为 Runs Test Runs Testdata: xdata: xStandard Normal = -2.1564, Standard Normal = -2.1564, p-value = 0.03105p-value = 0.03105alternative hypothesis: two.sidedalternative hypothesis: two.sided可见可见, , 利用近似标准正态分布计算利用近似标准正态分布计算, , 计算值为计算值为Standard Normal = -2.1564Standard Normal = -2.1564p-value = 0.03105p-value = 0.03105拒绝原假设拒绝原假设, ,认为降雨量的变化不是随机的认为降雨量的变化不是随机的四、对称中心检验设随机变量X有分布函数F(x), 如果对于任意 实数x,都有那么称随机变量X或分布函数F(x)关于原点对称设 为一实数,如果对于任意实数x,都有则称随机变量X或分布函数F(x)关于 对称.关于 对称的分布,需要考虑检验问题符号函数符号函数当 x 0当 x = 0当 x x45.3不妨设数据分布是对称的,对称中心为 #exact=FALSE #exact=FALSE表示不计算精确分布表示不计算精确分布, ,计算近似结果计算近似结果输出结果为输出结果为: : Wilcoxon signed rank test with Wilcoxon signed rank test with continuity correctioncontinuity correction data: x data: x V = 65, V = 65, p-value = 0.002550p-value = 0.002550 alternative hypothesis: true location alternative hypothesis: true location is greater than 45.3is greater than 45.3拒绝原假设拒绝原假设. .认为样本对称中心大于认为样本对称中心大于45.3.45.3.wilcox.test(x, alternative = greater, wilcox.test(x, alternative = greater, mu = 45.3, exact=FALSE,conf.level=0.95)mu = 45.3, exact=FALSE,conf.level=0.95) Wilcoxon Wilcoxon符号秩检验不仅利用了样本符符号秩检验不仅利用了样本符号号, ,也利用了样本绝对值的大小也利用了样本绝对值的大小, ,效果好于符效果好于符号检验号检验. .1.符号检验2.趋势检验.3.游程检验 4.对称中心的检验小结:单样本问题小结:单样本问题中符号为正的数目 作为统计量。配对后用符号检验游程个数R作为检验统计量
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号