资源预览内容
第1页 / 共45页
第2页 / 共45页
第3页 / 共45页
第4页 / 共45页
第5页 / 共45页
第6页 / 共45页
第7页 / 共45页
第8页 / 共45页
第9页 / 共45页
第10页 / 共45页
亲,该文档总共45页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第五章第五章 变量的相关变量的相关【教学目标教学目标】识记相关、散点图、相关系数的类别和含义;识记相关、散点图、相关系数的类别和含义;理解各类相关系数的意义和适用条件;熟练掌握常用相关理解各类相关系数的意义和适用条件;熟练掌握常用相关系数的计算方法;恰当应用各类相关系数进行相关分析。系数的计算方法;恰当应用各类相关系数进行相关分析。【学习重点学习重点】相关的基本类型;各种相关系数的适用条件相关的基本类型;各种相关系数的适用条件和计算方法;积差相关、等级相关、质量相关、品质相关和计算方法;积差相关、等级相关、质量相关、品质相关 。【难点难点】肯德尔肯德尔U系数、品质相关系数、品质相关主要内容主要内容一、相关的概念一、相关的概念二、积差相关二、积差相关三、等级相关三、等级相关四、质量相关四、质量相关五、品质相关五、品质相关六、相关系数的选用与解释六、相关系数的选用与解释一、相关的概念一、相关的概念1.1.事物之间的三种关系事物之间的三种关系因果关系因果关系:一种现象是另一现象的:一种现象是另一现象的因因,而另一现象,而另一现象是是果。果。 共变关系共变关系:表面看来有联系的两种事物与:表面看来有联系的两种事物与第三种现第三种现象象现象有关,这是两种事物的关系就是共变关系。现象有关,这是两种事物的关系就是共变关系。 相关关系相关关系:两种现象在发展变化的:两种现象在发展变化的方向方向和和大小大小方面方面存在一定的关系,但存在一定的关系,但不能确定不能确定这两种现象哪是因哪这两种现象哪是因哪是果;也有理由认为这两者并不同时受第三因素的是果;也有理由认为这两者并不同时受第三因素的影响影响 。下列现象属于什么关系?下列现象属于什么关系?数学成绩影响物理成绩数学成绩影响物理成绩种瓜得瓜,种豆得豆种瓜得瓜,种豆得豆智力和创造性智力和创造性小孩和小树的生长小孩和小树的生长河里的漂浮的两块木头河里的漂浮的两块木头学习压力和学习焦虑学习压力和学习焦虑挫折和攻击行为挫折和攻击行为环境对人的成长的影响环境对人的成长的影响教师的教学方法和学生的学习成绩教师的教学方法和学生的学习成绩2.2.相关的实质相关的实质变变量量之之间间没没有有严严格格确确定定的的依依存存关关系系,当当一一个个变变量量(自自变变量量)发发生生变变化化时时,另另一一个个变变量量(因因变变量量)也也许许会会发发生生相相应应的的变变化化,但但它它们们之之间间没没有有严严格格的的确确定定关关系系,因因为为事事物物的的变变化化发发展是受展是受很多因素很多因素影响的。影响的。3.3.三种相关关系:三种相关关系:正相关正相关:变量之间变动的方向相同,同增同减。:变量之间变动的方向相同,同增同减。负相关负相关:变量之间变动方向相反,一个增加而另一个减小。:变量之间变动方向相反,一个增加而另一个减小。零相关零相关:变量之间的变动无规律可循。:变量之间的变动无规律可循。4.4.相关的程度相关的程度完全正相关完全正相关:两个变量变化的速度:两个变量变化的速度完全一致完全一致,相关系数为,相关系数为1完完全全负负相相关关:一一个个变变量量增增加加的的同同时时,另另一一个个变变量量以以相相同同的的速度速度减小,相关系数为减小,相关系数为1不完全正相关不完全正相关:相关系数在:相关系数在01之间之间不完全负相关不完全负相关:相关系数在:相关系数在10间间5.5.相关次数相关次数单相关单相关:两个变量之间的相关;:两个变量之间的相关;复相关复相关:多个变量之间的相关:多个变量之间的相关表现形态表现形态:线性相关包括:线性相关包括直线直线和和曲线曲线相关相关 二、积差相关二、积差相关1.1.积差相关的概念积差相关的概念 积差相关积差相关(product-moment coefficient of product-moment coefficient of corralationcorralation)是英国统计学家皮尔逊是英国统计学家皮尔逊于于2020世纪初提出的计算世纪初提出的计算方法,简称:方法,简称:PearsonPearson 相关系数(软件中常用此名称)。积相关系数(软件中常用此名称)。积差相关又称为差相关又称为积矩相关积矩相关。离均差乘方之和除以离均差乘方之和除以N N称做称做“矩矩”(moment)(moment),把,把X X的离均差和的离均差和Y Y的离均差两者的积总和除以的离均差两者的积总和除以N N,用,用“积矩积矩”表示。表示。2.2.积差相关的适用条件积差相关的适用条件(1)两个变量都是由测量获得的两个变量都是由测量获得的等距等距或或等比等比数据;数据;(2)两个变量都呈)两个变量都呈正态正态或或接近接近正态分布;正态分布;(3)两个变量必须是)两个变量必须是直线直线关系;关系;(4)数数据据必必须须是是成成对对数数据据,数数目目至至少少30对对(简简述述使使用用积积差相关系数的条件,首都师大差相关系数的条件,首都师大2003试题)试题)也可写成:协方差(协方差(covariance)covariance):共变方差,反应两列变量变化的一致性程度3.计算公式(1 1)基本公式)基本公式(2 2)运用标准分数计算相关系数的公式)运用标准分数计算相关系数的公式(3)(3)用原始数据直接计算的简化公式用原始数据直接计算的简化公式:例题P116118(4 4)计算积差相关系数的差法公式)计算积差相关系数的差法公式例题P1204.4.积差相关系数的合并积差相关系数的合并即为求几个样本的相关系数的平均相关系数。由于即为求几个样本的相关系数的平均相关系数。由于相关系数不是等距数据须将其变成等距数据方可合相关系数不是等距数据须将其变成等距数据方可合成。其方法是采用费舍成。其方法是采用费舍Zr转化法(见转化法(见P469附表。附表。8)(例题)(例题P123)(1)将)将r转换成转换成Z(2)求各样本的)求各样本的Z分数之和分数之和(3)利用公式求平均)利用公式求平均Z分数分数(4)将平均)将平均Z分数转换成分数转换成r三、等级相关三、等级相关1.1.等级相关的概念等级相关的概念两两列列变变量量所所对对应应的的数数据据是是等等级级顺顺序序的的测测量量数数据据时时,或或者者两两列列变变量量所所对对应应的的等等距距或或等等比比数数据据的的分分布布非非正正态态时时,求求两两列列变量的相关,即为等级相关。变量的相关,即为等级相关。等级相关也属于线性相关,亦为非参数相关。等级相关也属于线性相关,亦为非参数相关。2.2.斯斯 皮皮 尔尔 曼曼 等等 级级 相相 关关 (SpearmanSpearmans s correlation coeficient for ranked datacorrelation coeficient for ranked data)适用条件适用条件:(1)数据是数据是等级顺序等级顺序的测量数据,不是等距或等比数据;的测量数据,不是等距或等比数据;(2)非正态分布非正态分布的等比或等距数据。的等比或等距数据。优点优点:比积差相关的适用范围广,对数据总体不作要求;:比积差相关的适用范围广,对数据总体不作要求;缺缺点点:如如果果将将能能作作积积差差相相关关的的数数据据改改作作等等级级相相关关,其其精精确确度稍差。度稍差。(1)定义公式(等级差数法)定义公式(等级差数法)D DRxRxRyRy是是对偶等级之差对偶等级之差(2)原始等级计算公式(等级序数法)原始等级计算公式(等级序数法)例题见书P125计算公式计算公式(3)遇到相同等级时的计算公式)遇到相同等级时的计算公式上式中:上式中:N N成对数据数目成对数据数目n n为某一变量的为某一变量的相同等级数相同等级数例题见书P127128为矫正数,即减少的差数3.3.肯德尔等级相关肯德尔等级相关(多列等级变量的相关)(多列等级变量的相关)(1 1)肯德尔和谐系数)肯德尔和谐系数 肯肯德德尔尔和和谐谐系系数数( (KendallKendall coefficient coefficient of of concordance), concordance), 是是表表示示多多列列等等级级变变量量相相关关程程度度的的一一种种方方法法 , , 适适用用于于两两列列以以上的等级变量。肯德尔和谐系数常用符号上的等级变量。肯德尔和谐系数常用符号 W W 表示。表示。适用条件适用条件 K K个评价者对个评价者对 N N 件事物或件事物或 N N 种作品进行等级评种作品进行等级评定定, ,每个评价者都能对每个评价者都能对N N件事物件事物( (或作品或作品) )的好坏、的好坏、优劣、喜好、大小、高低等优劣、喜好、大小、高低等 排出一个等级顺序。排出一个等级顺序。最小的等级序数为最小的等级序数为 1, 1, 最大的为最大的为N, KN, K个评价者便个评价者便可得到可得到K K从从1 1至至N N的等级变量资料。的等级变量资料。 一个评价者先后一个评价者先后K K次评价次评价 N N 件事物或件事物或 N N 件作品件作品, ,也是采用等级评定法也是采用等级评定法, ,这样也可得到这样也可得到 K K 列从列从 1 1 至至 N N 的等级变量资料。这类的等级变量资料。这类 K K 列等级变量资料综合列等级变量资料综合起来求相关起来求相关, ,就用肯德尔就用肯德尔 W W 系数。系数。Ri被评价者的K个等级和,SSRi为Ri的离差平方和,K为评价者数目,N为被评价的事物的数目。肯德尔肯德尔W W系数的变系数的变化范围为化范围为0W10W1基本公式例题P131肯德尔肯德尔W W系数的设计思想系数的设计思想:出现相同等级时的公式出现相同等级时的公式例题P132(2 2)肯德尔)肯德尔U U系数系数适用条件适用条件K个评价者对个评价者对N件事物采用两两配对的方法进行评价,可配件事物采用两两配对的方法进行评价,可配成成N(N1)/2对,然后进行两两比较,较好的记对,然后进行两两比较,较好的记1分,较差分,较差者记者记0分,最后整理所有评价者的评价结果是否一致。分,最后整理所有评价者的评价结果是否一致。计算公式(计算公式(例题例题P133134)如果评价者的态度完全一致,则如果评价者的态度完全一致,则U1;若对角线;若对角线上下格子中出现的上下格子中出现的择优择优分数相同,则一致性为分数相同,则一致性为0;若若K为奇数时每格的择优分数为(为奇数时每格的择优分数为(K1)/2与(与(K1)/2均匀分布在对角线上下,均匀分布在对角线上下,U1/K;若;若K为偶数时,为偶数时,U1/K1,U的取值正负并不表示的取值正负并不表示方向的一致性。方向的一致性。rij对偶记录表中某一格的择优分数四、质量相关四、质量相关在在研研究究中中,当当一一列列变变量量按按事事物物的的属属性性划划分分种种类类,而而另另一一列列变量为变量为等比等比或或等距等距的测量数据时,求得的相关叫的测量数据时,求得的相关叫质量相关质量相关。包括点二列相关、二列相关和多系列相关包括点二列相关、二列相关和多系列相关。1.1.点二列相关点二列相关(point-biserial correlation) (point-biserial correlation) 适用条件适用条件一一列列数数据据来来自自于于正正态态分分布布的的总总体体的的等等比比或或等等距距数数据据,另另一一列列变变量量为为二二分分变变量量(dichotomous variable) ,即即按按事事物物的的某某一性质只能分为两类相互独立的变量。一性质只能分为两类相互独立的变量。P P为二分称名变量取某一值的变量比例为二分称名变量取某一值的变量比例 q q为二分称名变量中取另一值的变量比例为二分称名变量中取另一值的变量比例XpXp等距(比)变量中与等距(比)变量中与P P对应那部分变量的平均值对应那部分变量的平均值XqXq等距(比)变量中与等距(比)变量中与q q对应那部分变量的平均值对应那部分变量的平均值SxSx为全部等距或等比变量的标准差为全部等距或等比变量的标准差例题P1362.2.二列相关二列相关(biserail correlation,中科院,中科院2004试题试题) 适用条件适用条件两列变量都来自于正态分布的两列变量都来自于正态分布的等比或等距等比或等距数据,而其中数据,而其中一列被一列被人为地划分人为地划分为两个类别的数据为两个类别的数据 y y标准正态曲线下标准正态曲线下p p和和q q交界交界点的点的y y轴的高度轴的高度 (例题P138139)二列相关一般不常用二列相关一般不常用一般用于对项目(题目)的区分度的确定一般用于对项目(题目)的区分度的确定当相关系数越接近当相关系数越接近1时,项目的区分度越高;当相关系数越时,项目的区分度越高;当相关系数越接近接近0时,其区分度越低。时,其区分度越低。3.3.多列相关(多列相关(multiserials correlationmultiserials correlation)适用资料适用资料多列相关适合处理两列正态变量资料多列相关适合处理两列正态变量资料, ,其中一列为等距或其中一列为等距或等比的测量数据等比的测量数据, ,另一列被人为划分为另一列被人为划分为多个类别多个类别的名义变的名义变量。量。多列相关用于一列正态连续变量与另一列正态的多列相关用于一列正态连续变量与另一列正态的称名变量称名变量之间的一致性分析之间的一致性分析, ,在测验中时常用于在测验中时常用于效度检验效度检验。计算公式例题P141五、品质相关品质相关品品质质相相关关是是指指R R(行行)C(C(列列) )表表的的两两个个分分类类变变量量之之间的关联程度。间的关联程度。品品质质相相关关处处理理的的数数据据类类型型一一般般都都是是计计数数数数据据而而非非测测量数据。量数据。品质相关是编制心理测验、项目分析时的常用方法。品质相关是编制心理测验、项目分析时的常用方法。主要有四分相关、主要有四分相关、相关、列联表相关相关、列联表相关等。等。1.1.四分相关(四格表)四分相关(四格表)当当两两个个变变量量都都是是连连续续变变量量,且且每每一一个个变变量量的的变变化化都都被被人人为为地地分分为为两两种种类类型型时时, 求求两两个个变变量量之之间间的的相相关关为四分相关。为四分相关。计计算算时时将将资资料料整整理理成成22的的四四格格表表。四四格格表表是是由由两两个因素个因素,各有两项分类计数。各有两项分类计数。计算公式计算公式:例题P143144相关相关适用资料适用资料当两变量是真正(自然)的二分变量时,求两变量之间的当两变量是真正(自然)的二分变量时,求两变量之间的相关为相关为相关。相关。例题例题P144P144当当值小于时,相关较弱;当值小于时,相关较弱;当值大于时,相关值大于时,相关较强。完全正相关,数据落入较强。完全正相关,数据落入adad两格中,完全负两格中,完全负相关,数据落入相关,数据落入bcbc两格中。应用时一般不指出其两格中。应用时一般不指出其相关方向。相关方向。还可以用还可以用关联系数关联系数Q Q和和归结系数归结系数表示其相关程度。表示其相关程度。(5-18a)(5-18b)例题P1453.3.列联表相关(涉及后面的内容故从略)列联表相关(涉及后面的内容故从略)六、相关系数的选用与解释六、相关系数的选用与解释1.1.如何选择合适的相关系数如何选择合适的相关系数总原则:依据不同的数据类型和某一相关系数所要满足的假总原则:依据不同的数据类型和某一相关系数所要满足的假设条件,选择不同的相关系数。设条件,选择不同的相关系数。具体分析(见下一页)具体分析(见下一页)2.2.相关系数值的解释相关系数值的解释相关系数的值表示两个变量之间的关联程度,但相关系数的值表示两个变量之间的关联程度,但只说明其大概的趋势,不存在精确的数值关系。只说明其大概的趋势,不存在精确的数值关系。相关系数的数值大小,表示两个变量关联的强弱。相关系数的数值大小,表示两个变量关联的强弱。相关系数即使是相关系数即使是1,也不能推出因果关系的结论。,也不能推出因果关系的结论。要能区分虚假相关,不能仅依据相关系数的大小要能区分虚假相关,不能仅依据相关系数的大小确定变量的相关。确定变量的相关。了解偏相关和半偏相关的概念了解偏相关和半偏相关的概念在纯理论研究中,即使有很小的相关,如果在统计上有显在纯理论研究中,即使有很小的相关,如果在统计上有显著性,也能说明心理规律。著性,也能说明心理规律。3.3.相关系数的特殊用途相关系数的特殊用途相关系数在心理科学与教育科学研究中相关系数在心理科学与教育科学研究中, ,特别是心理与教育特别是心理与教育测量、评价中测量、评价中, ,有着重要的特殊用途。它可以用于有着重要的特殊用途。它可以用于确定测验确定测验的的信度系数信度系数和效度系数和效度系数, ,用于对测验的用于对测验的项目项目区分度区分度进行分析进行分析。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号