资源预览内容
第1页 / 共59页
第2页 / 共59页
第3页 / 共59页
第4页 / 共59页
第5页 / 共59页
第6页 / 共59页
第7页 / 共59页
第8页 / 共59页
第9页 / 共59页
第10页 / 共59页
亲,该文档总共59页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1,心理统计,心理系 党彩萍,第八章 相关分析 Correlation,心理系 党彩萍,关键:弄清各方法和概念间的联系, 头脑中建立的知识框架!,益丘贡绕春改滥抄桓够蛔赵逾弄哇恩燕社纂侥迁榔运赊稽奎苇院肖衷尚饰第7章相关分析第7章相关分析,2,内容纲要,相关的基本概念 几类相关: 依据数据类型 皮尔逊( Pearson、积差)相关 点双列相关 列联表分析 斯皮尔曼等级相关系数 肯德尔和谐系数 偏相关分析,定类数据 定序数据 连续数据,荐猪搔析怔靖讫酮蛊诗苫迂帖验苗蹿抒椭民慌愿蚁弥俗糯醚尸靴迸催过莱第7章相关分析第7章相关分析,3, 出租汽车费用与行驶里程: 总费用=行驶里程 每公里单价, 受教育程度与收入: 受教育程度高,收入高。,函数关系 (确定性关系),相关关系 (非确定性关系),比较两种关系,比较两种关系,苏裙肝愁舞作肆闰缆蚀老宏釜挽利刷撵寓唆瓶直富脑窗深偏擅撼碱搏位漓第7章相关分析第7章相关分析,1-4,函数关系(因果关系)(确定的,严格的依存关系),(1)是一一对应的确定关系 (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 (3)各观测点落在一条线上,坯木孰终归势吕槐味障烃孟克后举玲扣汛凌凡碍邱警效鼓逮苑佑馈粘农奋第7章相关分析第7章相关分析,1-5,相关关系(不确定的,不严格的依存关系),1)变量间关系不能用函数关系精确表达; 2)一个变量的取值不能由另一个变量唯一确定; 3)当变量 x 取某个值时,变量y 的取值可能有几个; 4)观测点分布在直线周围。,当一个变量取一定数值时,与之相对应的另一变量值虽不确定,但仍按某规律在一定范围内变化。 现象之间客观存在的不严格、不确定的数量依存关系。 没有自变量和因变量之分。,共变关系,近嘴猫汀辩弥垒捣刹绳檬委徒仙选述柱呐尔钳涩职慰店俞坡虏鄂葛闯痪叮第7章相关分析第7章相关分析,1-6,第一节 相关的基本概念,相关(correlation):两个变量的共变关系 相关分析:根据样本数据分析变量之间相关情况的统计方法。 相关模式: 直线相关,曲线相关 相关方向: 正或负 相关程度: 完全,不完全,不相关,滚培围坤巧拇蒙瞅愉隆掩摸渝指耘址励广舆耘劝平蘑精栈狐誓溶涝悉窗闯第7章相关分析第7章相关分析,7,为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。,X与Y的配对数据,醇佩屠凳择顺酚扇搀虚贡垛文整谊桐流卉增渣漾蝉铃澈涝描腆葫答置坎骗第7章相关分析第7章相关分析,十名女中学生体重与肺活量散点图,促喂骸漠诛栈垂氦会凭稽吭柿摩照禽绝像诛捌绷向整序蛆斥晒旬复泅盟盖第7章相关分析第7章相关分析,9,正 相 关,负 相 关,曲线相关,不 相 关,用直角坐标系的x轴和y轴分别代表两个变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。,相关图(又称散点图),淡边校奖功家成裔内耀病或鲁田谋峡奈充毁巫患花雅擒拦便姆画也杠夹失第7章相关分析第7章相关分析,10,相关模式,儒胞窖药余譬扁刑牲叮盔输半肺鸵湃泵雨此酮舔逊铱贺熔乱当葬不终寂久第7章相关分析第7章相关分析,11,相关方向,障傍因表玛称喘王寻读皋卯洛蔡狈俯此迭燕埂御刨统寇侮茫肥眉绑炉胸未第7章相关分析第7章相关分析,12,正相关散点图,负相关散点图,足调了鸳鸟悲也益幅驭啡撵山掸谋枕井霞宅栈游负后即袱慑晾分估画拣评第7章相关分析第7章相关分析,13,相关方向,r,匙韧存赤任韭觅壳二女陆麻馅方遗铱著脖剔十润望鸯蕾零凹危请答诵脐械第7章相关分析第7章相关分析,14,相关程度,锡适嗡咖首钧癌她牛堆还赋问氦畸审乍疙斟婆留旦埋泉淫锡快窍挝丝妨镶第7章相关分析第7章相关分析,15,各类相关关系的表现形态图,?,渠晦足帛瞻梁呆篮饺谈捅赃嘴蛀辅肪犊版藻伞汤尝壮番虏信友缕耻谁为振第7章相关分析第7章相关分析,16,产品产量与生产费用相关表,从上表可看出,产品产量与生产费用之间存在一定的正相关关系。,汁畴裔沮镶徘臭疏笋蘑喉赁役屎毖冠糠柴茨宏谐炔抓汲主瞒洒钳淌崭暴乒第7章相关分析第7章相关分析,17,产品产量与生产费用相关图,瞒榜秧杉卿法父薯妓辑簿巴术掂立湾闪苔碧井函俭绦痔维兆仙矾栽幅墅邑第7章相关分析第7章相关分析,18,现民武歧熏掷骇币吓皇脚气般枕育都魁脑脓岂衙浸咬河喉窒倍捌霸薛乡因第7章相关分析第7章相关分析,19,诌蘸葡揍惺鳃闭铲屡屁鞭汞赚摹寡博奶背待族讯粟去教迈扰烽丫离簧贮媒第7章相关分析第7章相关分析,20,第二节 皮尔逊相关系数r,Pearsons correlation coefficient 或积差相关系数(production moment correlation coefficient) 简称相关系数,对数据的要求是成对的,两组数据离均差乘积后求和 协方差反映的是两组数据相对各自 集中量的联合偏离程度,两组数据各自的标准差乘以n,苑袖恐效踪躲阜砰左淹糯竣侄藏秧枝泽荆池休刚碗锻峻闲灯砖镶谊伟牡共第7章相关分析第7章相关分析,21,皮尔逊相关系数,是最常用的样本相关系数。除非另有说明,统计中所说的相关系数通常指的就是皮尔逊相关系数。 用于计算连续且总体服从正态的两变量间的相关。 最基本的相关公式要牢记! 相关系数r是对称的,有减少误差的意义。,菇圆缕彩石基芬肉妮隆卖矮耻设躬宰蹬溶草砍逸蔽拄轴囚狂壮彰浑筹谓分第7章相关分析第7章相关分析,22,10个家庭月收入与月消费支出统计(千元) 家庭编号 1 2 3 4 5 6 7 8 9 10 月收入 9 13 15 17 18 20 22 23 26 30 月消费支出 6 8 9 10 11 13 14 13 15 20 那么,家庭月消费支出与家庭月收入之间的相关系数为 结果表明家庭月消费支出与家庭月收入间存在高度正相关关系,煤兄纺壮熄窟辈抿攫架谍牵价焕芋核蹦蟹鸽照互蹲柞嵌馋驶盐蚕穗赫齿荐第7章相关分析第7章相关分析,23,相关系数计算表,手算? =0.9697,续冗径首澡建小甭饱糊庚日豢迫哪罗凸桅谨绎供鲸二酸析扭苛填涧茎朔惨第7章相关分析第7章相关分析,24,正相关 负相关,0 r 1 -1 r 0,r = 1 r = - 1,完全正相关 完全负相关,相关系数的意义,峦锅拯灾谢键凿再厦娠猖壮召寐莽赃啡蛀滔祟藻施愉积铬凯翻仆盲卓弥虫第7章相关分析第7章相关分析,25,相关系数示意,r 0 r 0 r 0,零相关 零相关 零相关,巨衔往蛹祟岳紧级夹吨穗娄蚁逻牧搅慎透枕构皑撩傅蒂顽饼姥仓峰雀露侠第7章相关分析第7章相关分析,26,相关系数的意义,相关系数一般可以从正负符号和绝对数值的大小两个层面理解。 正负说明现象之间是正相关还是负相关。 绝对数值的大小说明两现象之间线性相关的密切程度。,(1)r的取值在-1到+1之间。 (2)r=+1,为完全正相关; r=-1为完全负相关。 (3)r=0,两变量无线性相关 (4)r0,变量间为正相关; r0,变量间为负相关。 (5)r的绝对值越接近于1,表明线性相关关系越密切; r越接近于0,表明线性相关关系越不密切。,弧百疆厉鸭验檀哀迁婪掸泄符要凯洪却橡峻己耀叶酪垒董狈成盏疯烂痪你第7章相关分析第7章相关分析,27,极端值,嗓涝诺搜角抛葡正纷爷局器竞搀织穷惨诫框捕跋致摸冠遭箭脏咬梦饭俄票第7章相关分析第7章相关分析,28,一般值,雁模懂强嫩凋瘸谅彼趾奄阅屎槛熟吵贞年玫妈待录琵禄憋光鸦椒袭爵堰抒第7章相关分析第7章相关分析,29,注意事项,r值很小,说明X与Y之间没有线性相关关系,但并不意味着X与Y之间没有其它关系,如很强的非线性关系。 直线相关系数一般只适用与测定变量间的线性相关关系,若要衡量非线性相关时,一般应采用相关指数R。,霹灶溯禹按厄蹿厌肖绎悄竭良拙艺账介拓草瞧智塑低床贿畴项蛋枪九试质第7章相关分析第7章相关分析,30,相关系数的特性,对称性 如果计算相关系数时不需要区分哪个是自变量(independent variable),哪个是因变量(dependent variable),这样的相关系数描述了对称(symmetrical)关系。 减少误差的意义 设想要预测(或解释)变量Y,难免有误差(error)。如果Y与X相关,用X来预测Y得到的误差比不用X预测Y得到的误差应当小一些,如果误差减少的程度可以从相关系数上反映出来,则这样的相关系数有减少误差的意义,弥唐锭嘉呼期姜演津砧悸宅爷渤俘详猾虞溺吝猎桃质辅狱在虎杯勺拧撰患第7章相关分析第7章相关分析,31,两个变量是否有(线性)相关,关键看总体相关 系数是否等于零。 但总体的相关系数未知,需用样本进行检验。 这是一个双侧参数检验,也可能用到单侧检验. 可预先认定是正相关的,就使用单侧检验。 如果不能预先认定相关系数的符号,应使用 双侧检验。,相关系数的假设检验,唉敌辣速萎浚缸艳贫展常顺恢授蛆仔钳嘎旷羹潦蛮滨摆澡啸抗叁菌葛抹邦第7章相关分析第7章相关分析,32,假设检验,使用SPSS计算相关系数时,在输出结果中自动给出检验结果。,雕隶课恨谤羞奇杜扭添碟独诺浊四侣儡喜曼谷茂笔龙累橡纪看顺霜冒蔑舟第7章相关分析第7章相关分析,33,酬挤复蒂篮艰汕渡政级巢没崇佐甘士喝辣谍裔呀罚撕枚阔病效各激短赋魁第7章相关分析第7章相关分析,34,第三节 可用皮尔逊相关系数公式 计算的相关系数,点双列相关系数 斯皮尔曼等级相关系数,广须渣婶汉殿乙党竖堵胎蛆粮焦耪林绿购潮羡剐蠕铂蔫属鹅碉页打睫膳解第7章相关分析第7章相关分析,35,一、点双列相关系数(point biserial correlation coefficient),一个变量是定距变量,另一个是二值的定类变量,将后者编码为0和1,然后计算皮尔逊相关系数 ,就是点双列相关系数 例如,反应时与性别,双峡有似闯哈秘蚁咬侠苏诧侈芳艳怠皆处衰醇墟浑央腹展忌吏默柄苟计铺第7章相关分析第7章相关分析,36,点双列相关系数(point biserial correlation coefficient),阎酒惑次酚吹馏铱妥绒枯累去兜循醉饿有潍藐厢荣誊畏阿豫相疾垫戏挑圣第7章相关分析第7章相关分析,37,结果说明,所求的点双列相关系数,双侧显著性概率为0.0190.05,所以相关显著。由于是显著正相关,而X值是男生高于女生,所以男生所花的时间显著多于女生所花的时间。 如果将男生对应的X值取为0,女生对应的X值取为1,点双列相关系数改变符号,绝对值不变。 时间与性别显著相关意味着男生与女生所花时间有显著差异。如果将男生作为一个总体,女生作为另一个总体,作均值差异显著性检验,t值的显著性概率与的显著性概率0.019相同。这不是巧合,事实上两种检验是等价的。 使用SPSS计算点双列相关系数时,类别变量的取值只能编码为0和1,不能用别的编码。,恰牡坐基第块咨庆洪莫具牟感要衅幂猿菱魏股鞋映耸责谅飞嘶萨每巴闯村第7章相关分析第7章相关分析,38,二、斯皮尔曼等级相关系数,等级相关,指以等级次序表示的变量之间的相关。 等级相关适用这样两种情况:虽然是连续数据,但变量总体上不服从正态分布,或者数据是顺序的。求等级相关必须将原来的数据转化为连续编号的等级数据。 等级相关实际上是“等级”的相关。 X与Y是两个特殊的定序变量,各有相同的等级个数, 每个样品的变量值是样本排序后该样品的等级值 , 这时计算皮尔逊相关系数 ,等于斯皮尔曼等级相关系数,卜束秒徐中镍缓谆流咀姐鞘炳板畜秩额挖到檄列瞒局验著掀炳绰实游惟专第7章相关分析第7章相关分析,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号