资源预览内容
第1页 / 共19页
第2页 / 共19页
第3页 / 共19页
第4页 / 共19页
第5页 / 共19页
第6页 / 共19页
第7页 / 共19页
第8页 / 共19页
第9页 / 共19页
第10页 / 共19页
亲,该文档总共19页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
f(x. 一 x)(y. 一 y )1.2 相关系数目 预习导学 全 挑战自我,点点落实 学习目标了解相关系数的计算公式,会由 r 值的大小判断两随机变量线性相关程度的大 小知识链接当r=l或一1时,两个变量的相关性如何?答 当r=1时,两个变量完全正相关;当r= 1时,两个变量完全负相关.预习导引1 相关系数r的计算假设两个随机变量的数据分别为(X, y1),(x2,y2),(xn,yn),则变量间线性 相关系数r的计算公式为xx xxfix.y nx 要点一 利用相关系数检验两变量间的相关性例1现随机抽取了某中学高一 10名在校学生,他们入学时的数学成绩(x)与入 学后第一次考试的数学成绩(y)如下:学生号12345678910x12010811710410311010410599108y84648468696869465771请问:这10名学生的两次数学成绩是否具有线性关系?1解 x =応(120 + 108 + +99 + 108) = 107.8,y = 10(84 + 64 + + 57 + 71) = 68, x2= 1202 + 1082 + + 992 + 1082 = 116 5 84, i=1 i10 y = 842 + 642 + + 572 + 712 = 47 3 84,10 x.y. = 120X84 + 108X64 + + 99X57 + 108X71 = 73 796. ii所以相关系数为 r=73 796- 10X107.8X68(116 584- 10X107.82 )( 47 384- 10 X 682)二 0.750 6.由此可看出这 10 名学生的两次数学成绩具有较强的线性相关关系规律方法 利用相关系数r进行判断相关关系,需要应用公式计算出r的值,由 于数据较大,需要借助计算器跟踪演练1假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有 如下统计资料:x23456y2.23.85.56.57.0已知亡 x2=90,亡 y2=140.78,E x.y=112.3.i=1 1i=1 1i=1 1 1(1) 求x, y;(2) 对 x,y 进行线性相关性检验(1) x =2+3+4+5+65=4.-2.2+ 3.8+ 5.5+ 6.5+ 7.0 y =5= 5.丈i=1xiyi5xy = 112.3-5X4X5 = 12.3,存2mx42 = 10士 y2 - 5y2 = 140.78 - 125 = 15.78, i=1 i所以12.3V110X15.780.979.Irl - 0.979 0.75,所以x与y之间具有很强的线性相关关系.要点二 线性回归分析例2已知某地每单位面积菜地年平均使用氮肥量x(kg)与每单位面积蔬菜年平 均产量y(t)之间的关系有如下数据:年份19851986198719881989199019911992x/kg7074807885929095y/t5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x/kg92108115123130138145y/t11.511.011.812.212.512.813.0求x与y之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y与使用氮肥量x之间的线性回归直线方程,并估计 每单位面积施氮肥150 kg时,每单位面积蔬菜的年平均产量.解 (1)列出下表,并用科学计算器进行相关计算:i12345678x.i7074807885929095yi5.16.06.87.89.010.210.012.0x.y. i i357444544608.4765938.49001 140i9101112131415x.i92108115123130138145yi11.511.011.812.212.512.813.0x.y. i i1 0581 1881 3571 500.61 6251 766.41 885“罟=101,厂罟m x2=161 125, y2=i 628.55, x.y. = 16 076.8. i = i ii = i ii = i i i故蔬菜产量与施用氮肥量的相关系数r=16 076.8 - 15X101X10.11J ( 161 125 - 15X1012)( 1 628.55 - 15X10.112)-0.864 3.所以蔬菜产量与施用氮肥量之间存在着线性相关关系(2) 设所求的线性回归方程为y = a + bx,则品i - 15x yb = i-15 X2 - 15-2i=1 i5.093 7,16 076.8- 15X101X10.11161 125-15X1012 a = y-bx - 10.11-0.093 7X101 = 0.646 3,线性回归方程为y = 0.646 3 + 0.093 7x.当每单位面积施氮肥150 kg时,每单位面积蔬菜年平均产量为0.646 3 + 0.093 7X 15014.701(t).规律方法 在研究两个变量之间的关系时,应先进行相关性检验,若具备线性相 关关系再求线性回归方程如果本身两个变量不具备线性相关关系,即使求出线性回归方程也是毫无意义 的,而且用其估计和预测的量也是不可信的跟踪演练 2 为分析学生初中升学的数学成绩对高一数学学习的影响,在高一年 级随机抽取 10 名学生,了解他们的入学成绩和高一期末考试数学成绩如下表:学生编号12345678910入学成绩(x)63674588817152995876高一期末成绩(y)65785282928973985675(1)画出散点图;(2)对变量x与y进行相关性检验,如果x与y之间具有线性相关关系,求出线性回归方程;(3) 若某学生入学的数学成绩为 80 分,试估计他在高一期末考试中的数学成绩908070605040hA Io 40 50 60 70 80 90 100 x解 (1)散点图如图所示(2) 由题可得x = 70, y = 76,出(xi - x)(yi - y) = 1 894, iii = 1 (x. -)2 = 2 474,i = 1 i(y. - y)2 = 2 056,i=1 ir=(X-X)(y-y)0.839 8 0.75,因此可得相关系数为1 894-,/2 474 X p2 056所以入学数学成绩与高一期末考试数学成绩存在线性相关关系设线性回归方程为y = a + bx,则(xi-x) 2i = 1ib = i(X-X)(y- y)=|40.765 56,a= y-bx=76-0.765 56X70=22.410 8.因此所求的线性回归方程是y=22.410 8+0.765 56x.(3) 若某学生入学的数学成绩为80分,代入(2)中的方程可求得y = 22.410 8 +0.765 56X8084,即这名学生在高一期末考试中的数学成绩的预测值为84分.尹 当堂检测 全 当堂训练,体验成功1对于回归分析,下列说法错误的是()A. 在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯 一确定B. 线性相关系数可以是正的,也可以是负的C. 回归分析中,如果厂2=1,说明x与y之间完全相关D. 样本相关系数r(1, 1)答案 D解析 相关系数 r 的范围是1 , 12. 一唱片公司欲知打歌费用x(十万元)与唱片销售量y(千张)之间的关系,从其 所发行的唱片中随机抽取了 10张,得如下的资料:史x=28,史x2=303.4,iii=1i=1史y=75,弋y2=598.5, f x.y=237,则y与x的相关系数r的绝对值为.iiiii = 1i = 1i = 1答案 0.3x.y. - nx y解析 由公式r =, 几1=得lrl = 0.3.1x2- nx2 合2-与23. 若线性回归方程中的回归系数b = 0,则相关系数r=. 答案 0解析 相关系数x.- x)( y.- y)- 的分子相同.f ( x. - x ) 2.(x. - x)(y.- y )r = =i=1=与 b = Jf(x. - x ) 2 (y. - y ) 2.=1 i.=1 i4. 有5组数据如下:x123410y3410512将这组数据中的哪一组去掉后,另外的4组数据具有较强的线性相关性?解 作出散点图如图所示仪10,*C(3,10)127(4,5)- 5(2,4) .(13)100 2 4 6 810观察散点图,可以发现A, B, D, E四个点大致在某条直线附近,具有较强的线 性相关关系,故应将点 C(3, 10)去掉课堂坐结对相关系数 r 的理解(1)判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差 有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间 是否具有线性相关关系,此时就必须利用线性相关系数来判断(2) lrl越接近1,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数 据的效果就越好(3) 相关系数 r 只能描述两个变量之间的变化方向及密切程度,不能揭示二者之间 的本质联系(4) 相关系数 r 可以定量地反映出变量间的相关程度,明确的给出有无必要建立两 变量间的回归方程.戸分层训练全 解疑纠偏,训练检测一、基础达标1下列说法不正确的是( )A. 回归分析中,变量x和y都是普通变量B. 变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定C. 线性相关系数可能是正的,也可能是负的D. 如果线性相关系数是负的,y随x的增大而减少答案 A解析 在回归分析中的两个变量是具有相关关系的两个变量2通过相关系数来判断两个变量相关关系的强弱时,相关系数的绝对值越大,用线性回归模型拟合样本数据的效果就越好,如果相关系数re 0
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号