资源预览内容
第1页 / 共35页
第2页 / 共35页
第3页 / 共35页
第4页 / 共35页
第5页 / 共35页
第6页 / 共35页
第7页 / 共35页
第8页 / 共35页
第9页 / 共35页
第10页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
相关与回归分析相关与回归分析correlation and regression第一节第一节 相关分析相关分析correlation 1.1.父母的身高与孩子的身父母的身高与孩子的身高有关系吗?高有关系吗?2.2.你的智力得分较高,那你的智力得分较高,那么你的数学分数也一定高么你的数学分数也一定高吗?吗? 心理学的研究常常需要描述某一变心理学的研究常常需要描述某一变量的测量值和另一变量测量值之间的量的测量值和另一变量测量值之间的关系。而相关反映的就是两个变量的关系。而相关反映的就是两个变量的共变关系。共变关系。 在实验中,常常将研究的某一对象在实验中,常常将研究的某一对象作为因变量,从与之联系的事物中取作为因变量,从与之联系的事物中取一个或多个对象作为自变量。一个或多个对象作为自变量。一一. .相关的分类相关的分类(一)按相关的性质分类(一)按相关的性质分类 1.正相关正相关:两种测量值变动方向相同 2.负相关负相关:两种测量值变动方向相反 3.零相关零相关:两种测量值变动方向无规律一一. .相关的分类相关的分类(二)按相关的形式划分(二)按相关的形式划分 1.直线相关直线相关:直线或线性相关 2.曲线相关曲线相关:曲线或非线性相关二二. .散点图散点图 设研究变量为X和Y,以直角坐标系的横轴表示X变量,以纵轴表示Y变量。根据对每一个个体的测量,把每一个个体在这两种测量上的取值用直角坐标系中的一个点表示,即可以得到散点图。在散点图中可以粗略的看出两个变量相关关系的性质。例例1 随机抽取随机抽取15名学生的语文测验分数和算术测验名学生的语文测验分数和算术测验分数,语文分数为分数,语文分数为10分制,数学分数为分制,数学分数为20分制。分制。画出这两个测验分数的相关散点图。画出这两个测验分数的相关散点图。 学号学号 语文语文 数学数学 学号学号 语文语文 数学数学 1 5 12 9 10 20 2 8 15 10 9 17 3 7 14 11 7 15 4 9 18 12 7 16 5 10 19 13 9 16 6 8 18 14 6 13 7 6 14 15 8 16 8 6 17二二. .散点图散点图二二. .散点图散点图二二. .散点图散点图三三. .相关系数相关系数correlation coefficient1.符号:总体相关系数 样本相关系数 r 2.公式:三三. .相关系数相关系数correlation coefficient3.取值范围 -1,1 r 值为正 正相关 为负 负相关 |r|=1 - 完全相关 |r|=0 - 零相关三三. .相关系数相关系数correlation coefficient4.r的使用条件(1)要求成对的数据,而这成对的数据应该来自于同一总体或同一样本(2)两组变量都是连续型随机变量(3)数据的对数n最好不要小于30(4)两组变量的分布应该近似于正态分布(5)两组变量之间的关系应该是直线性的例2 用例1中的数据计算相关系数 学号学号 语文语文 数学数学 学号学号 语文语文 数学数学 1 5 12 9 10 20 2 8 15 10 9 17 3 7 14 11 7 15 4 9 18 12 7 16 5 10 19 13 9 16 6 8 18 14 6 13 7 6 14 15 8 16 8 6 17例例3 表中是表中是10名中学生身高与体重的测量结名中学生身高与体重的测量结果,问身高与体重的关系如何?果,问身高与体重的关系如何?编号编号 身高身高X(cm) 体重体重Y(kg) 编号编号 X Y 1 170 50 6 188 53 2 173 45 7 178 50 3 160 47 8 183 49 4 155 44 9 180 52 5 173 50 10 165 45四四.相关系数的假设检验相关系数的假设检验1.设立假设 H0: =0 H1: 02.取值范围 =0.05或0.013.自由度 n-24.检验方法 t检验四四.相关系数的假设检验相关系数的假设检验5.查t值表,确定P值6.得出结论例例4 从某校初中三年级学生中随机抽取从某校初中三年级学生中随机抽取25人人进行甲、乙两门课程的考试,其成绩相关进行甲、乙两门课程的考试,其成绩相关系数为系数为0.25,试确定该年纪这两门课程是否,试确定该年纪这两门课程是否存在一定的相关,或此相关系数是抽取误存在一定的相关,或此相关系数是抽取误差所致(差所致( =0.05) 例例5 以例以例1的数据,假定例中的的数据,假定例中的15名学生是从一个很大的学生名学生是从一个很大的学生总体中随机选出的,并且总体总体中随机选出的,并且总体中语文和数学成绩都服从正态中语文和数学成绩都服从正态分布。那么,根据分布。那么,根据r=0.828能不能不能推断总体中语文和数学成绩能推断总体中语文和数学成绩之间存在线性相关关系?之间存在线性相关关系?五五.相关系数的可信区间相关系数的可信区间1.2.95%可信区间可信区间 Z+1.96SZ 99%可信区间可信区间 Z+2.58SZ SZ=1/3.例例6 某研究(某研究(n=100)发现中)发现中学生智商与语文成绩的相关学生智商与语文成绩的相关系数为系数为0.4,问总体相关系数,问总体相关系数95%的可信区间是多少?的可信区间是多少?例例7 某校某校120名学生通过甲乙名学生通过甲乙两测验,计算相关系数为两测验,计算相关系数为0.24,问该两测试总体相关,问该两测试总体相关系数的系数的0.95的可信区间?的可信区间?第二节第二节 直线回归直线回归regressionregression一一. .定义定义1.回归分析回归分析:用一定模型来表达变量相关关系的方法为回归分析。2.线性回归线性回归:变量之间存在的关系是直线关系,称为线性回归。二二.直线回归方程直线回归方程1.一般表达式一般表达式: a:截距,直线与:截距,直线与Y轴交点的纵坐标轴交点的纵坐标 b:斜率,回归系数:斜率,回归系数(regression coefficient)。2.意义:意义:X X每改变一个单位,每改变一个单位,Y Y平均改平均改变变b b个单位。个单位。二二.直线回归方程直线回归方程3.建立回归方程建立回归方程(1 1)做出散点图,判断两变量是否)做出散点图,判断两变量是否成直线关系成直线关系(2 2)计算回归系数)计算回归系数: :最小二乘法(最小二乘法(使使各散点到直线的纵向距离的平方和最小)各散点到直线的纵向距离的平方和最小)4.4.画出回归直线画出回归直线最小二乘法最小二乘法最小二乘法最小二乘法例例8 下表中下表中10对数据是为了某心理量与物理对数据是为了某心理量与物理量之间的关系而做的实验结果。假设两者量之间的关系而做的实验结果。假设两者呈线性关系,试建立回归方程。呈线性关系,试建立回归方程。 被试被试 A B C D E F G H I J心理量心理量X 1 1 3 3 4 5 6 7 8 9物理量物理量Y 0 2 1 5 4 2 6 2 5 7 例例9 根据例根据例1的的15对数据,求回归方程对数据,求回归方程 随机抽取随机抽取15名学生的语文测验分数和算术测验分数,名学生的语文测验分数和算术测验分数,语文分数为语文分数为10分制,数学分数为分制,数学分数为20分制。画出这两个测验分制。画出这两个测验分数的相关散点图。分数的相关散点图。 学号学号 语文语文 数学数学 学号学号 语文语文 数学数学 1 5 12 9 10 20 2 8 15 10 9 17 3 7 14 11 7 15 4 9 18 12 7 16 5 10 19 13 9 16 6 8 18 14 6 13 7 6 14 15 8 16 8 6 17三三.回归系数的假设检验回归系数的假设检验1.假设 H0: 0 H1:0 2.确立可信区间 0.053.计算自由度 n24.t检验 三三.回归系数的假设检验回归系数的假设检验5.查t值表6.确定结果,得出结论例例10 用例用例1的数据求回归方程,并的数据求回归方程,并对回归系数进行显著性检验对回归系数进行显著性检验四四.进行线性回归分析的注意事进行线性回归分析的注意事项项1.一定要画散点图,找出是否存在直线分布规律2.x、y谁是自变量和统计学无关,研究者自己按照专业自己制定哪个是自变量,哪个是因变量3.回归方程可以进行预测,但是估计时一定要在x的范围内才能估计4.一定要先对回归系数做假设检验五五.直线相关与回归的区别与联直线相关与回归的区别与联系系(一)区别1. 资料:资料: 回归:Y正态随机变量,X为选定变量 相关:X、Y服从双变量正态分布 2. 应用应用 : 回归 :由一个变量值推算另一个变量值 相关 :只反映两变量间互依关系3.回归系数有单位,相关系数没有单位回归系数有单位,相关系数没有单位4.取值范围取值范围:b;1r1五五.直线相关与回归的区别与联直线相关与回归的区别与联系系(二)联系1.对同一组数据,r与b的方向一致2.假设检验中等价:tr=tb3.
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号