资源预览内容
第1页 / 共46页
第2页 / 共46页
第3页 / 共46页
第4页 / 共46页
第5页 / 共46页
第6页 / 共46页
第7页 / 共46页
第8页 / 共46页
第9页 / 共46页
第10页 / 共46页
亲,该文档总共46页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第6讲回归分析与独立性检验考纲要求考点分布考情风向标1. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求 22 列联表)的基本思想、方法及其简单应用.(2)了解假设检验的基本思想、方法及其简单应用.(3)了解回归的基本思想、方法及其简单应用2012 年新课标卷第 3 题考查样本的相关系数;2014 年新课标卷第19 题考查非线性拟合、线性回归方程求法、利用回归方程进行预报预测;2015 年新课标卷第19 题考查非线性拟合、线性回归方程求法、利用回归方程进行预报预测由于该部分内容的特殊性,高考对该部分的考查一直非常慎重.高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用.因此,复习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式.此部分内容也可能结合概率统计的其他内容命制综合解答题.另外,复习时要把独立性检验作为重点1.变量间的关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)将样本中 n 个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.(3)正相关、负相关.在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系称为正相关.在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.2.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性相关关系:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归直线的求法:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法,则回归直线方程的系数为:样本点的中心(4)线性相关强度的检验:当 r0 时,表明两个变量正相关;当 r3.841.7522521090因此有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.【规律方法】解决独立性检验问题的一般步骤:制作列联表;利用公式 K2n(adbc)2(ab)(cd)(ac)(bd)计算,近似计算要精确到小数点后三位;查表得出结论,要选择满足条件 P(K2k0)的k0作为拒绝域的临界值.项目不及格及格总计男61420女102232总计163652【互动探究】2.(2014 年江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是()表 1成绩项目不及格及格总计男41620女122032总计163652项目不及格及格总计男81220女82432总计163652表 2表 3视力智商项目不及格及格总计男14620女23032总计163652表 4A.成绩C.智商阅读量B.视力D.阅读量解 析 : 由公式 K2 n(adbc)2(ab)(cd)(ac)(bd)计算得A.528216362032,B.52112216362032,C.5296216362032,D.52408216362032.显然 D 的值最大,说明阅读量与性别有关联的可能性最大.答案:D考点 3 回归分析的综合运用例 3:(2015 年新课标)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8 年的宣传费 xi 和年销售量 yi(i1,2,8)数据作了初步处理,得到下面的散点图(如图 9-6-2)及一些统计量的值.图 9-6-2(1)根据散点图判断,yabx 与 ycd ,哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程;(3)已知这种产品的年利润 z 与 x,y 的关系为 z0.2yx ,根据(2)的结果回答下列问题:46.65636.8289.81.61469108.8当年宣传费 x49 时,年销售量及年利润的预报值是多少?当年宣传费 x 为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线u 的斜率和截距的最小二乘估计分别为(2)回归分析是处理变量相关关系的一种数学方法.主要解决:确定特定量之间是否有相关关系,如果有,就找出它们之间的数学表达式;根据一组观察值,预测变量的取值及判断变量取值的变化趋势;求出回归直线方程.年份2007200820092010201120122013年份代号 t1234567人均纯收入 y2.93.33.64.44.85.25.9【互动探究】3.(2014 年新课标)某地区 2007 年至 2013 年农村居民家庭纯收入 y(单位:千元)的数据如下表:(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:(2)由(1)知, 0.50,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加 5000 元.将 2015 年的年份代号 t9 带入(1)中的回归方程,得 0.592.36.8.故预测该地区 2015 年农村居民家庭人均纯收入为 6800 元.日期1 月 11 日 1 月 12 日 1 月 13 日 1 月 14 日 1 月 15 日平均气温/91012118销量/杯2325302621易错、易混、易漏对回归分析的理解例题:(2015 年广东广州调研)某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录了 1 月 11 日至 1 月 15 日的白天平均气温(单位:)与该奶茶店的这种饮料销量(单位:杯),所得数据如下表:(1)若从这 5 组数据中随机抽出 2 组,求抽出的 2 组数据恰好是相邻 2 天数据的概率;正解:(1)设“选取的 2 组数据恰好是相邻 2 天数据”为事件 A.所有基本事件(m,n)(其中m,n 为1月份的日期数)有(11,12),(11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14),(13,15),(14,15),共 10 种.事件A 包括的基本事件有(11,12),(12,13),(13,14),(14,15),共 4 种.1.求回归方程,关键在于正确求出系数 a,b,由于 a,b 的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为 b,常数项为 a,这与一次函数的习惯表示不同)2.回归分析是处理变量相关关系的一种数学方法.主要解决:确定特定量之间是否有相关关系,如果有,就找出它们之间的数学表达式;根据一组观察值,预测变量的取值及判断变量取值的变化趋势;求出回归直线方程.3.独立性检验中统计量 K2 的观测值 k 的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号