资源预览内容
第1页 / 共26页
第2页 / 共26页
第3页 / 共26页
第4页 / 共26页
第5页 / 共26页
第6页 / 共26页
第7页 / 共26页
第8页 / 共26页
第9页 / 共26页
第10页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
两变量关联性分析 pearson相关系数介绍世间万物是普遍联系的n医学上,许多现象之间也都有相互联系,例 如:身高与体重、体温与脉搏、年龄与血压 、产前检查与婴儿体重、乙肝病毒与乙肝等 。在这些有关系的现象中,它们之间联系的 程度和性质也各不相同。相关的含义图5-0(a) 函数关系客观现象之间的数量联系存在着函数关系和 相关关系。当一个或几个变量取定值时,另一个变量有 确定的值与之对应,称为函数关系,可用Y=f(X) 表示。n当一个变量增大,另一个也随之增大(或 减少),我们称这种现象为共变,或相关 (correlation)。两个变量有共变现象,称 为有相关关系。 n相关关系不一定是因果关系。n主要探讨线性相关pearson相关系 数主要内容一、散点图二、相关系数三、相关系数的假设检验一、散点图为了确定相关变量之间的关系,首 先应该收集一些数据,这些数据应该是 成对的。例如,每人的身高和体重。然后在 直角坐标系上描述这些点,这一组点集 称为散点图。1.作法:为了研究父亲与成年儿子身高之间的 关系,卡尔.皮尔逊测量了1078对父子的身高。 把1078对数字表示在坐标上,如图。用水平轴 X上的数代表父亲身高,垂直轴Y上的数代表儿 子的身高,1078个点所形成的图形是一个散点 图。它的形状象一块橄榄状 的云,中间的点密集,边沿 的点稀少,其主要部分是一 个椭圆。 2.相关类型:3.作用:粗略地给出了两个变量的关联类型与程度通过相关散布图的形状,我们大概可以判 断变量之间相关程度的强弱、方向和性质,但 并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进 一步统计分析,求出描述变量间相关程度与变 化方向的量数,即相关系数。总体相关系数用 p表示,样本相关系数用r表示。二、相关系数n变量的取值区间越大,观测值个数越多,相关系数受 抽样误差的影响越小,结果就越可靠,如果数据较少 ,本不相关的两列变量,计算的结果可能相关。n相关系数取值: -10表示正相 关,r0.05,我们就接受假 设,认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著 关系;如果取得r值的概率P0.05或P0.01,我们就在=0.05或=0.01水准 上拒绝检验假设,认为该r值不是来自=0的总体,而是来自0的另一 个总体,因此就判断两变量间有显著关系。3.计算检验统计量,查表得到P值。拒绝H0,则两变量相关。 否则,两变量无关。相关系数的假设检验t检验法 计算检验统计量tr,查t界值表,得到P 值例题1.H0 : =0 无关H1 : 0 相关 =0.052.r=0.9787, n=15, 代入公式3.v=15-2=13,查界值表,P0.001,拒绝H0,认为血铅与尿 铅之间有正相关关系。 三、相关注意事项1.线性相关的前提条件是X、Y都服从正态分布(双变量正态分布)2.当散点图有线性趋势时,才可进行线性相关分析3.必须在假设检验认为相关的前提下才能以r的大小判断相关程度4.相关关系并不一定是因果关系,有可能是伴随 关系*如何判断两个变量的相关性(1)找出两个变量的正确相应数据。(2)画出它们的散布图(散点图)。(3)通过散布图判断它们的相关性。(4)给出相关(r)的解答。(5)对结果进行评价和检验。Thank you
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号