资源预览内容
第1页 / 共22页
第2页 / 共22页
第3页 / 共22页
第4页 / 共22页
第5页 / 共22页
第6页 / 共22页
第7页 / 共22页
第8页 / 共22页
第9页 / 共22页
第10页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
卡方检验卡方检验 (Chi-square) 1.1.参数与非参数检验参数与非参数检验2.2.卡方匹配度检验卡方匹配度检验 3.卡方独立卡方独立性性检验检验 4.卡方检验的前提和限制卡方检验的前提和限制5.卡方检验的效应大小和效力卡方检验的效应大小和效力参数与非参数检验参数与非参数检验w参数检验参数检验n用于等比用于等比/ /等距型数据等距型数据n对参数的前提:正态分布和方差同质对参数的前提:正态分布和方差同质w非参数检验非参数检验n不用对参数进行假设不用对参数进行假设n对分布较少有要求,也叫对分布较少有要求,也叫distribution-free testsdistribution-free testsn用于类目用于类目/ /顺序型数据顺序型数据n没有参数检验敏感,效力低没有参数检验敏感,效力低n因此在二者都可用时,总是用参数检验因此在二者都可用时,总是用参数检验卡方匹配度检验卡方匹配度检验( (Chi Square for Goodness of Chi Square for Goodness of fit)fit)w用样本数据检验总体分布的形状或比率,用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度以确定与假设的总体性质的匹配度w是对次数分布的检验是对次数分布的检验w研究情境研究情境1.在医生职业中,男的多还是女的多?在医生职业中,男的多还是女的多?2.在三种咖啡中,哪种被中国人最喜欢?在三种咖啡中,哪种被中国人最喜欢?3.在北京大学中,各国留学生的比例有代表性吗?在北京大学中,各国留学生的比例有代表性吗?卡方匹配度检验的虚无假设卡方匹配度检验的虚无假设- -期望次数期望次数w在医生职业中,男的多还是女的多?在医生职业中,男的多还是女的多?w在外科医生中,男的是否占在外科医生中,男的是否占80%?w最喜欢的咖啡品牌最喜欢的咖啡品牌卡方匹配度检验的公式卡方匹配度检验的公式wf e=pnwdf =C-1 w2= (f0-f e)2/ f enF0:观察次数观察次数nf e :期望次数期望次数nC:类目的个数类目的个数n2:统计量统计量卡方分布卡方分布1.是一系列平方和相加,没有负值是一系列平方和相加,没有负值2.当当H0为真时,为真时,Chi square 的数值会小的数值会小3.典型的典型的卡方分布是正偏态,右侧的尾端构成临卡方分布是正偏态,右侧的尾端构成临界区域界区域4.4.卡方分布的形状并不取决于样本数目,而是取卡方分布的形状并不取决于样本数目,而是取决于类目数目。决于类目数目。 df =C-1 5.当当卡方卡方df 增加时,增加时,卡方的临界值卡方的临界值增加。增加。6.当当卡方卡方df 增加时,增加时,卡方分布的偏态越来越不严卡方分布的偏态越来越不严重。重。卡方匹配度检验的例题卡方匹配度检验的例题影响学生选课的因素有上述影响学生选课的因素有上述4种,哪些因素的影响力更强?种,哪些因素的影响力更强?卡方匹配度检验的例题卡方匹配度检验的例题影响学生选课的因素有上述影响学生选课的因素有上述4种,哪些因素的影响力更强?种,哪些因素的影响力更强?H0: 4种因素的影响力相等种因素的影响力相等Df=3,2(3).05=7.81求边缘和求边缘和N=18+17+7+8=502= (f(f0 0-f -f e e) )2 2/ / f f e e =(18-12.5)2/12.5+ (17-12.5)2/12.5 +(7-12.5)2/12.5+(8-12.5)2/12.5=2.42+1.62+2.42+1.62 =8.08推翻推翻H0: 4种因素的影响力不同种因素的影响力不同单位格2w单位格单位格2具有可加性具有可加性w单位格单位格2大于大于2.5,说明该因素对整个统计,说明该因素对整个统计检验的显著贡献较大检验的显著贡献较大卡方独立卡方独立性性检验检验w检验行和列的两个变量彼此有无关联检验行和列的两个变量彼此有无关联w是命名型变量是命名型变量, 顺序型变量相关的计算方顺序型变量相关的计算方法法卡方独立卡方独立性性检验检验的公式的公式w 2= (f0-f e)2/ f ewf e=(row total)()(column total)/n,wdf =(R-1)(C-1) nF0:观察次数观察次数nf e :期望次数期望次数nR :行行类目的个数类目的个数 C:列列类目的个数类目的个数n 2:统计量统计量对手表显示的偏好程度与被试的年龄段是否有关?卡方独立卡方独立性性检验检验w检验行和列的两个变量彼此有无关联检验行和列的两个变量彼此有无关联w是命名型变量,顺序型变量相关的计算方是命名型变量,顺序型变量相关的计算方法法w有时变量虽为等距型,但若不符合有时变量虽为等距型,但若不符合Pearson相关的统计前提,也可用相关的统计前提,也可用卡方独卡方独立立性性检验检验以下数据是学业成绩和自尊分数,求二者的关系被试被试学业成绩学业成绩自尊分数自尊分数A9431B7826C8127D6523。以下数据是学业成绩和自尊分数,求二者的关系H0:学业成绩和自尊水平彼此独立学业成绩和自尊水平彼此独立Df=(2-1)()(3-1)=2,2(2).05=5.99 2=(17-12)2/12 +(32-30)2/30 +(11-18)2/18 +(13-18)2/18 +(43-45)2/45 +(34-27)2/27 =2.08+ 0.13+2.72+1.39+0.09+1.81=8.22推翻推翻H0,学业成绩和自尊水平彼此相关学业成绩和自尊水平彼此相关卡方检验的前提和限制卡方检验的前提和限制1.观察彼此独立观察彼此独立2.所有所有 fe =52与效应大小(与效应大小(effect size)wPhi系数,范围0至1,是一种多元相关系数w在22列联表时,在多于22列联表时,Phi系数系数:Cohens convensionw当当dfsmall=1时,时,n=0.10表示小的效应,表示小的效应, =0.30表示中等的效应,表示中等的效应,=0.50表示高的效应表示高的效应.w当当dfsmall=2时,时,n=0.07表示小的效应,表示小的效应, =0.21表示中等的效应,表示中等的效应,=0.35表示高的效应表示高的效应.w当当dfsmall=3时,时,n=0.06表示小的效应,表示小的效应, =0.17表示中等的效应,表示中等的效应,=0.29表示高的效应表示高的效应.w计算上题例1, Cramers =sqrt(38.09/200/1)=sqrt(0.095)=0.44n中等的效应w例2,Cramers =sqrt(8.22/150/1)=sqrt(0.027)=0.23n小的效应概念小测查: 判断正误1.在卡方检验中,样本数据称为观测频率.2.卡方检验的一个优点是它可以用于命名量表的数据.3.假定卡方匹配度检验采用三个类目的无偏假设.如果样本有n=60个被试,那么每个类目的期望次数是fe=20.4.一个检验三个类目分布的卡方匹配度检验,研究者取了100名被试,这个卡方匹配度检验的自由度是df=99.5.卡方独立性检验要求每个个体在两列变量上分类.6.卡方检验的自由度不依赖样本量大小.7.在卡方检验中,观测频率可能为分数或小数.8.一般来说,一个大的卡方值会容易拒绝虚无假设.9.卡方的数值永远不会为负数.10.一位研究者用卡方独立性检验,评价出生顺序和自尊的关系.每个个体被分类为出生顺序为1至3,及高自尊,低自尊.这个卡方独立性检验的自由度是df=2.
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号