资源预览内容
第1页 / 共81页
第2页 / 共81页
第3页 / 共81页
第4页 / 共81页
第5页 / 共81页
第6页 / 共81页
第7页 / 共81页
第8页 / 共81页
第9页 / 共81页
第10页 / 共81页
亲,该文档总共81页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第四节变量间的相关关系与统计案例【知【知识梳理】梳理】1.1.必会知必会知识 教材回扣填一填教材回扣填一填(1)(1)回回归分析分析回回归分析是分析是对具有相关关系的两个具有相关关系的两个变量量进行行统计分析的一种常用方分析的一种常用方法法; ;判断相关性的常用判断相关性的常用统计图是是:_;:_;统计量有量有:_(:_(取取值范范围-1,1)-1,1)、相关指数等、相关指数等. .散点散点图相关系数相关系数(2)(2)线性回归方程线性回归方程两个具有线性相关关系的变量的一组数据:两个具有线性相关关系的变量的一组数据:(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),(x),(xn n,y,yn n) ),其回归方程为,其回归方程为 其中其中, , 是回归方程的是回归方程的_, _, 是在是在y y轴上的截距轴上的截距. .斜率斜率(3)(3)独立性独立性检验2222列列联表表: :假假设有两个分有两个分类变量量X X和和Y,Y,它它们的取的取值分分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其其样本本频数列数列联表表( (称称2222列列联表表) )为: :y y1 1y y2 2总计x x1 1a ab b_x x2 2c cd dc+dc+d总计a+ca+c_a+b+c+da+b+c+da+ba+bb+db+dKK2 2统计量:统计量:K K2 2= (= (其中其中n=a+b+c+dn=a+b+c+d为样本容量为样本容量).).2.2.必必备结论 教材提教材提炼记一一记(1)(1)从散点从散点图看相关性看相关性: :正相关正相关: :样本点分布在从本点分布在从_的区域内的区域内; ;负相关相关: :样本点分布在从本点分布在从_的区域内的区域内. .左下角到右上角左下角到右上角左上角到右下角左上角到右下角(2)(2)从相关系数看相关性从相关系数看相关性: :当当r0r0时时, ,表明两个变量正相关表明两个变量正相关; ;当当r0r0.75r0.75时具有较强的相关性时具有较强的相关性. .越弱越弱越强越强(3)(3)从相关指数看相关性从相关指数看相关性: :R R2 2的的值越大越大, ,说明残差平方和越小明残差平方和越小, ,也就是也就是说模型的模型的拟合效果越好合效果越好. .在在线性回性回归模型中模型中,R,R2 2表示解表示解释变量量对于于预报变量量变化的化的贡献率献率,R,R2 2越接越接近于近于1,1,表示回表示回归的效果越好的效果越好. .3.3.必用技法必用技法 核心核心总结看一看看一看统计思想的思想的应用用: :结论都是估都是估计结果果, ,不是精确不是精确结果果. .【小【小题快快练】1.1.思考辨析思考辨析 静心思考判一判静心思考判一判(1)(1)相关关系的两个相关关系的两个变量是非确定关系量是非确定关系.(.() )(2)(2)散点散点图中的点越集中中的点越集中, ,两个两个变量的量的线性相关性越性相关性越强强.(.() )(3)(3)对于分于分类变量量X X与与Y,Y,它它们的随机的随机变量量K K2 2的的观测值越小越小.“X.“X与与Y Y有关有关联”的把握程度越大的把握程度越大.(.() )【解析】【解析】(1)(1)正确正确. .相关关系不是确定关系相关关系不是确定关系. .(2)(2)错误错误. .散点图上的点大致分布在通过散点图中心的那条直线附近散点图上的点大致分布在通过散点图中心的那条直线附近, ,整体上呈线性分布时整体上呈线性分布时, ,两个变量相关关系越强两个变量相关关系越强. .(3)(3)错误错误.K.K2 2越大越大,“X,“X与与Y Y有关联有关联”的把握程度越大的把握程度越大. .答案答案: :(1)(1)(2)(2)(3)(3)2.2.教材改教材改编 链接教材接教材练一一练(1)(1)(选修修2-3P812-3P81例例1 1改改编) )若若8 8名学生的身高和体重数据如下表名学生的身高和体重数据如下表: :编号号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg4848575754546464616143435959第第3 3名学生的体重漏填名学生的体重漏填, ,但但线性回性回归方程是方程是 =0.849x-85.712, =0.849x-85.712,则第第3 3名名学生的体重估学生的体重估计为. .【解析】【解析】设第设第3 3名学生的体重为名学生的体重为a a,根据样本点的中心一定在回归,根据样本点的中心一定在回归直线上,可得直线上,可得解得解得a50.a50.答案:答案:50 kg50 kg(2)(2)(选修修2-3P972-3P97习题3.2T13.2T1改改编) )为了解某班学生喜了解某班学生喜爱打打篮球是否与性球是否与性别有关有关, ,对该班班5050名学生名学生进行了行了问卷卷调查, ,得到了如下的得到了如下的2222列列联表表: :喜喜爱打打篮球球不喜不喜爱打打篮球球总计男生男生20205 52525女生女生101015152525总计303020205050则在犯在犯错误的概率不超的概率不超过的前提下的前提下认为喜喜爱打打篮球与性球与性别有关有关. .附附:K:K2 2= = P(KP(K2 2kk0 0) )0.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 02.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.828【解析】【解析】由公式可得由公式可得K K2 28.3337.879,8.3337.879,故填故填0.005.0.005.答案答案: :0.0050.0053.3.真真题小小试 感悟考感悟考题试一一试(1)(2014(1)(2014湖北高考湖北高考) )根据如下根据如下样本数据本数据x x3 34 45 56 67 78 8y y4.04.02.52.5-0.5-0.50.50.5-2.0-2.0-3.0-3.0得到的回得到的回归方程方程为 =bx+a, =bx+a,则( () )A.a0,b0,b0,b0B.a0,b0C.a0,b0C.a0,b0D.a0D.a0【解析】【解析】选选A.A.画出散点图如图所示画出散点图如图所示,y,y的值大致随的值大致随x x的增加而减小的增加而减小, ,所以所以b0.b0.(2)(2015(2)(2015兰州模州模拟) )如表提供了某厂如表提供了某厂节能降耗技能降耗技术改造后在生改造后在生产A A产品品过程中程中记录的的产量量x(x(吨吨) )与相与相应的生的生产能耗能耗y(y(吨吨) )的几的几组对应数数据据, ,根据表提供的数据根据表提供的数据, ,求出求出y y关于关于x x的的线性回性回归方程方程为 =0.7x+0.35, =0.7x+0.35,则下列下列结论错误的是的是( () )x x3 34 45 56 6y y2.52.5t t4 44.54.5A.A.产品的生品的生产能耗与能耗与产量呈正相关量呈正相关B.tB.t的取的取值必定是必定是3.153.15C.C.回回归直直线一定一定过(4.5,3.5)(4.5,3.5)D.AD.A产品每多生品每多生产1 1吨吨, ,则相相应的生的生产能耗能耗约增加增加0.70.7吨吨【解析】【解析】选选B.B.由题意,由题意,因为因为 =0.7x+0.35, =0.7x+0.35,所以所以 =0.74.5+0.35=3.5, =0.74.5+0.35=3.5,所以所以t=43.5-2.5-4-4.5=3,t=43.5-2.5-4-4.5=3,故选故选B.B.(3)(2015(3)(2015泉州模拟泉州模拟) )已知某产品连续已知某产品连续4 4个月的广告费用个月的广告费用x x1 1( (千元千元) )与销售额与销售额y y1 1( (万元万元) ),经过对这些数据的处理,得到如下数据信息:,经过对这些数据的处理,得到如下数据信息:广告费用广告费用x x和销售额和销售额y y之间具有较强的线性相关关系;之间具有较强的线性相关关系;回归直线方程回归直线方程 中的中的 =0.8( =0.8(用最小二乘法求得用最小二乘法求得).).那么,广告费用为那么,广告费用为6 6千元时,可预测销售额约为千元时,可预测销售额约为( )( )A.3.5A.3.5万元万元 B.4.7 B.4.7万元万元C.4.9C.4.9万元万元 D.6.5 D.6.5万元万元【解析】【解析】选选B.B.因为因为 所以所以因为回归直线方程因为回归直线方程所以所以所以所以x=6x=6时,可预测销售额约为时,可预测销售额约为4.74.7万元万元. .故选故选B.B.考点考点1 1 相关关系的判断相关关系的判断【典例【典例1 1】(1)(1)已知已知变量量x,yx,y呈呈线性相关关系性相关关系, ,回回归方程方程为 =0.5+2x, =0.5+2x,则变量量x,yx,y呈呈( () )A.A.线性正相关关系性正相关关系B.B.由回由回归方程无法判断其正方程无法判断其正负相关相关C.C.线性性负相关关系相关关系D.D.非常非常强强的相关关系的相关关系(2)(2)甲、乙、丙、丁四位同学各自对甲、乙、丙、丁四位同学各自对A,BA,B两变量的线性相关性做试验两变量的线性相关性做试验, ,并用回归分析方法分别求得相关系数并用回归分析方法分别求得相关系数r r与残差平方和与残差平方和m m如下表如下表: :甲甲乙乙丙丙丁丁r r0.820.820.780.780.690.690.850.85m m106106115115124124103103则哪位同学的哪位同学的试验结果体果体现A A、B B两两变量有更量有更强强的的线性相关性性相关性( () )A.A.甲甲 B. B.乙乙C.C.丙丙 D. D.丁丁【解题提示】【解题提示】(1)(1)看随看随x x的变化的变化y y的变化趋势的变化趋势. .(2)(2)利用相关系数和残差平方和的意义判断利用相关系数和残差平方和的意义判断. .【规范解答】【规范解答】(1)(1)选选A.A.因为因为 =20, =20,所以变量所以变量x,yx,y呈线性正相关关系呈线性正相关关系. .(2)(2)选选D.D.在验证两个变量之间的线性相关关系时在验证两个变量之间的线性相关关系时, ,相关系数的绝对值越相关系数的绝对值越接近于接近于1,1,相关性越强相关性越强, ,在四个选项中只有丁的相关系数最大在四个选项中只有丁的相关系数最大; ;残差平方残差平方和越小和越小, ,相关性越强相关性越强, ,只有丁的残差平方和最小只有丁的残差平方和最小, ,综上可知丁的试验结综上可知丁的试验结果体现了果体现了A,BA,B两变量有更强的线性相关性两变量有更强的线性相关性, ,故选故选D.D.【互【互动探究】探究】题(1)(1)中中,x,x增加增加3 3个个单位位,y,y的的变化是化是. .【解析】【解析】因为是正相关关系因为是正相关关系, ,所以所以y y增加增加6 6个单位个单位. .答案答案: :增加增加6 6个单位个单位【规律方法】律方法】线性相关关系与函数关系的区性相关关系与函数关系的区别(1)(1)函数关系中的两个函数关系中的两个变量量间是一种确定性关系是一种确定性关系. .例如例如, ,正方形面正方形面积S S与与边长x x之之间的关系的关系S=xS=x2 2就是函数关系就是函数关系. .(2)(2)相关关系是一种非确定性关系相关关系是一种非确定性关系, ,即相关关系是非随机即相关关系是非随机变量与随机量与随机变量之量之间的关系的关系. .例如例如, ,商品的商品的销售售额与广告与广告费是相关关系是相关关系. .两个两个变量具量具有相关关系是回有相关关系是回归分析的前提分析的前提. .【变式式训练】1.1.两个两个变量量y y与与x x的回的回归模型中模型中, ,分分别选择了了4 4个不同模型个不同模型, ,它它们的相关指数的相关指数R R2 2如下如下, ,其中其中拟合效果最好的模型是合效果最好的模型是( () )A.A.模型模型1 1的相关指数的相关指数R R2 2为0.980.98B.B.模型模型2 2的相关指数的相关指数R R2 2为0.800.80C.C.模型模型3 3的相关指数的相关指数R R2 2为0.500.50D.D.模型模型4 4的相关指数的相关指数R R2 2为0.250.25【解析】【解析】选选A.A.相关指数相关指数R R2 2越大越大, ,拟合效果越好拟合效果越好. .2.2.对于于给定的两个定的两个变量的量的统计数据数据, ,下列下列说法正确的是法正确的是( () )A.A.都可以分析出两个都可以分析出两个变量的关系量的关系B.B.都可以用一条直都可以用一条直线近似表示两者的关系近似表示两者的关系C.C.都可以作出散点都可以作出散点图D.D.都可以用确定的表达式表示两者的关系都可以用确定的表达式表示两者的关系【解析】【解析】选选C.C.给出一组样本数据给出一组样本数据, ,总可以作出相应的散点图总可以作出相应的散点图, ,故故C C正确正确, ,但不一定能分析出两个变量的关系但不一定能分析出两个变量的关系, ,故故A A不正确不正确, ,更不一定符合线性相更不一定符合线性相关关, ,不一定用一条直线近似表示不一定用一条直线近似表示, ,故故B B不正确不正确, ,两个变量的统计数据不一两个变量的统计数据不一定有函数关系定有函数关系, ,故故D D不正确不正确. .故选故选C.C.【加固【加固训练】1.1.下列命下列命题:线性回性回归方法就是由方法就是由样本点去本点去寻找一找一条条贴近近这些些样本点的直本点的直线的数学方法的数学方法;利用利用样本点的散点本点的散点图可以可以直直观判断两个判断两个变量的关系是否可以用量的关系是否可以用线性关系表示性关系表示;通通过回回归直直线 及回及回归系数系数 , ,可以估可以估计和和预测变量的取量的取值和和变化化趋势. .其中正确的命其中正确的命题是是( () )A.A. B. B. C. C. D. D.【解析】【解析】选选D.D.线性回归方法就是由样本点去寻找一条贴近这些样本点线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法的直线的数学方法, ,找拟合效果最好的直线找拟合效果最好的直线, ,故故正确正确, ,利用样本点的利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示散点图可以直观判断两个变量的关系是否可以用线性关系表示,正正确确, ,通过回归直线通过回归直线 及回归系数及回归系数 , ,可以估计和预测变量的取值可以估计和预测变量的取值和变化趋势和变化趋势,正确正确, ,综上可知综上可知正确正确, ,故选故选D.D.2.2.某棉业公司的科研人员在某棉业公司的科研人员在7 7块并排、形状大小相同的试验田上对某块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量棉花新品种进行施化肥量x x对产量对产量y y影响的试验影响的试验, ,得到如表所示的一组得到如表所示的一组数据数据( (单位单位:kg).:kg).施化肥量施化肥量x x1515202025253030353540404545棉花棉花产量量y y330330345345365365405405445445450450455455(1)(1)画出散点图画出散点图. .(2)(2)判断是否具有相关关系判断是否具有相关关系. .【解析】【解析】(1)(1)散点图如图所示散点图如图所示. .(2)(2)由散点图知由散点图知, ,各组数据对应点大致都在一条直线附近各组数据对应点大致都在一条直线附近, ,所以施化肥所以施化肥量量x x与棉花产量与棉花产量y y具有线性相关关系具有线性相关关系. .考点考点2 2 独立性独立性检验【典例【典例2 2】(1)(1)某高校某高校“统计初步初步”课程的教程的教师随机随机调查了了选该课程的程的一些学生的情况一些学生的情况, ,具体数据如表具体数据如表: :专业性性别非非统计专业统计专业男男13131010女女7 72020为了判断主修了判断主修统计专业是否与性是否与性别有关系有关系, ,根据表中的数据根据表中的数据, ,得到得到K K2 2= 4.844.= 4.844.因因为K K2 23.841,3.841,所以判定主修所以判定主修统计专业与性与性别有关系有关系, ,那么那么这种判断出种判断出错的可能性的可能性为. .(2)(2014(2)(2014辽宁高考改宁高考改编) )某大学餐某大学餐饮中心中心为了解新生的了解新生的饮食食习惯, ,在在全校一年全校一年级学生中学生中进行了抽行了抽样调查, ,调查结果如下表所示果如下表所示: :喜喜欢甜品甜品不喜不喜欢甜品甜品总计南方学生南方学生606020208080北方学生北方学生101010102020总计70703030100100根据表中数据根据表中数据, ,问是否在犯是否在犯错误的概率不超的概率不超过5%5%的前提下的前提下认为“南南方学生和北方学生在方学生和北方学生在选用甜品的用甜品的饮食食习惯方面有差异方面有差异”.”.已知在被已知在被调查的北方学生中有的北方学生中有5 5名数学系的学生名数学系的学生, ,其中其中2 2名喜名喜欢甜品甜品, ,现在从在从这5 5名学生中随机抽取名学生中随机抽取3 3人人, ,求至多有求至多有1 1人喜人喜欢甜品的概率甜品的概率. .附附:K:K2 2= = P(KP(K2 2kk0 0) )0.1000.1000.0500.0500.0100.010k k0 02.7062.7063.8413.8416.6356.635【解题提示】【解题提示】(1)(1)对照临界值表判断对照临界值表判断. .(2)(2)代入公式求出代入公式求出K K2 2值再判断值再判断;利用古典概型的概率公式求解利用古典概型的概率公式求解. .【规范解答】【规范解答】(1)(1)因为因为P(KP(K2 23.841)=0.05,4.8443.841,3.841)=0.05,4.8443.841,所以判断出错的可能性不超过所以判断出错的可能性不超过5%.5%.答案答案: :不超过不超过5%5%(2)(2)将将2222列联表中的数据代入计算公式列联表中的数据代入计算公式, ,得得K K2 2= = 由于由于4.7623.841,4.7623.841,所以在犯错误的概率不超过所以在犯错误的概率不超过5%5%的前提下认为的前提下认为“南方南方学生和北方学生在选用甜品的饮食习惯方面有差异学生和北方学生在选用甜品的饮食习惯方面有差异”.”.从从5 5名数学系学生中抽取名数学系学生中抽取3 3人的一切可能结果所组成的基本事件为下人的一切可能结果所组成的基本事件为下列列1010个个: :(a(a1 1,a,a2 2,b,b1 1),(a),(a1 1,a,a2 2,b,b2 2),(a),(a1 1,a,a2 2,b,b3 3),(a),(a1 1,b,b1 1,b,b2 2),),(a(a1 1,b,b1 1,b,b3 3),(a),(a1 1,b,b2 2,b,b3 3),(a),(a2 2,b,b1 1,b,b2 2),(a),(a2 2,b,b1 1,b,b3 3),),(a(a2 2,b,b2 2,b,b3 3),(b),(b1 1,b,b2 2,b,b3 3),),其中其中a ai i(i=1,2)(i=1,2)表示喜欢甜品的学生表示喜欢甜品的学生,b,bj j(j=1,2,3)(j=1,2,3)表示不喜欢甜品的学表示不喜欢甜品的学生生, ,这这1010个基本事件的出现是等可能的个基本事件的出现是等可能的. .抽取抽取3 3人人, ,至多有至多有1 1人喜欢甜品的事件为以下人喜欢甜品的事件为以下7 7个个: :(a(a1 1,b,b1 1,b,b2 2),(a),(a1 1,b,b1 1,b,b3 3),(a),(a1 1,b,b2 2,b,b3 3),(a),(a2 2,b,b1 1,b,b2 2),),(a(a2 2,b,b1 1,b,b3 3),(a),(a2 2,b,b2 2,b,b3 3),(b),(b1 1,b,b2 2,b,b3 3),),从这从这5 5名学生中随机抽取名学生中随机抽取3 3人人, ,至多有至多有1 1人喜欢甜品的概率为人喜欢甜品的概率为 【规律方法】律方法】解独立性解独立性检验的的应用用问题的关注点的关注点(1)(1)两个明确两个明确: :明确两明确两类主体主体. .明确研究的两个明确研究的两个问题. .(2)(2)两个关两个关键: :准确画出准确画出2222列列联表表; ;准确理解准确理解K K2 2. .提醒提醒: :准确准确计算算K K2 2的的值是正确判断的前提是正确判断的前提. .【变式式训练】(2014(2014安徽高考改安徽高考改编) )某高校共有学生某高校共有学生1500015000人人, ,其中男其中男生生1050010500人人, ,女生女生45004500人人, ,为调查该校学生每周平均体育运校学生每周平均体育运动时间的情的情况况, ,采用分采用分层抽抽样的方法的方法, ,收集收集300300位学生每周平均体育运位学生每周平均体育运动时间的的样本数据本数据( (单位位: :小小时).).(1)(1)应收集多少位女生的收集多少位女生的样本数据本数据? ?(2)(2)根据根据这300300个个样本数据本数据, ,得到学生每周平均体育运得到学生每周平均体育运动时间的的频率率分布直方分布直方图( (如如图所示所示),),其中其中样本数据的分本数据的分组区区间为:0,2,(2,4,:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.(4,6,(6,8,(8,10,(10,12.估估计该校学生每周平均体育运校学生每周平均体育运动时间超超过4 4小小时的概率的概率. .(3)(3)在在样本数据中本数据中, ,有有6060位女生的每周平均体育运位女生的每周平均体育运动时间超超过4 4小小时. .请完成每周平均体育运完成每周平均体育运动时间与性与性别的列的列联表表, ,并判断是否在犯并判断是否在犯错误的的概率不超概率不超过5%5%的前提下的前提下认为“该校学生的每周平均体育运校学生的每周平均体育运动时间与性与性别有关有关”.”.附附:K:K2 2= =P(KP(K2 2kk0 0) )0.100.100.050.050.0100.0100.0050.005k k0 02.7062.7063.8413.8416.6356.6357.8797.879【解题提示】【解题提示】分清样本总体、个体的概念分清样本总体、个体的概念, ,识别频率分布直方图识别频率分布直方图, ,正确正确列出列联表求解列出列联表求解, ,本题属于容易题本题属于容易题. .【解析】【解析】(1)300 =90,(1)300 =90,所以应收集所以应收集9090位女生的样本数据位女生的样本数据. .(2)(2)由频率分布直方图得由频率分布直方图得2(0.150+0.125+0.075+0.025)=0.75,2(0.150+0.125+0.075+0.025)=0.75,所以该校学生每周平均体育运动时间超过所以该校学生每周平均体育运动时间超过4 4小时的概率的估计值为小时的概率的估计值为0.75.0.75.(3)(3)由由(2)(2)知知,300,300位学生中有位学生中有3000.75=2253000.75=225人的每周平均体育运动时人的每周平均体育运动时间超过间超过4 4个小时个小时,75,75人的每周平均体育运动时间不超过人的每周平均体育运动时间不超过4 4个小时个小时. .又因为又因为样本数据中有样本数据中有210210份是关于男生的份是关于男生的,90,90份是关于女生的份是关于女生的, ,所以每周平均所以每周平均体育运动时间与性别的列联表如下体育运动时间与性别的列联表如下: :每周平均体育运动时间与性别列联表每周平均体育运动时间与性别列联表男生男生女生女生总计总计每周平均体育运动时间每周平均体育运动时间不超过不超过4 4个小时个小时454530307575每周平均体育运动时间每周平均体育运动时间超过超过4 4个小时个小时1651656060225225总计总计2102109090300300结合列联表可算得结合列联表可算得K K2 2的观测值的观测值所以在犯错误的概率不超过所以在犯错误的概率不超过5%5%的前提下认为的前提下认为“该校学生的每周平均体该校学生的每周平均体育运动时间与性别有关育运动时间与性别有关”.”.【加固【加固训练】(2014(2014长治模治模拟) )为了了调查某大学学生在周日上网的某大学学生在周日上网的时间, ,随机随机对100100名男生和名男生和100100名女生名女生进行了不行了不记名的名的问卷卷调查, ,得到了如得到了如下的下的统计结果果: :表表1 1男生上网男生上网时间与与频数分布表数分布表表表2 2女生上网时间与频数分布表女生上网时间与频数分布表上网上网时间( (分分钟) )30,40)30,40)40,50)40,50)50,60)50,60)60,70)60,70)70,80)70,80)人数人数5 52525303025251515上网上网时间( (分分钟) )30,40)30,40)40,50)40,50)50,60)50,60)60,70)60,70)70,80)70,80)人数人数10102020404020201010(1)(1)若若该大学共有女生大学共有女生750750人人, ,试估估计其中上网其中上网时间不少于不少于6060分分钟的人的人数数. .(2)(2)完成表完成表3 3的的2222列列联表表, ,并回答能否在犯并回答能否在犯错误的概率不超的概率不超过0.10.1的前的前提下提下认为“学生周日上网学生周日上网时间与性与性别有关有关”?”?(3)(3)从表从表3 3的男生中的男生中“上网上网时间少于少于6060分分钟”和和“上网上网时间不少于不少于6060分分钟”的人数中用分的人数中用分层抽抽样的方法抽取一个容量的方法抽取一个容量为5 5的的样本本, ,再从中任取再从中任取两人两人, ,求至少有一人上网求至少有一人上网时间超超过6060分分钟的概率的概率. .表表3 3 上网上网时间少于少于6060分分钟上网上网时间不少于不少于6060分分钟总计男生男生女生女生总计P(KP(K2 2kk0 0) )0.500.500.400.400.250.250.150.150.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 00.4550.4550.7080.7081.3231.3232.0722.0722.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.828【解析】【解析】(1)(1)设上网时间不少于设上网时间不少于6060分钟的人数为分钟的人数为x.x.依据题意有依据题意有 解得解得:x=225,:x=225,所以估计其中上网的时间不少于所以估计其中上网的时间不少于6060分钟的人数是分钟的人数是225225人人. .(2)(2)根据题目所给数据得到如下列联表根据题目所给数据得到如下列联表, ,上网时间少于上网时间少于6060分钟分钟上网时间不少于上网时间不少于6060分钟分钟总计总计男生男生60604040100100女生女生70703030100100总计总计1301307070200200其中其中K K2 2= 2.1982.706,= 2.1980,b0,所以排除所以排除C,D,C,D,因为因为过过( ),( ),所以将所以将 =2.5 =2.5代入代入A,B,A,B,算得算得A A中结果更接近中结果更接近3.5,3.5,所以选所以选A.A.命命题角度角度2:2:线性回性回归方程的方程的应用用【典例【典例4 4】(2014(2014新新课标全国卷全国卷)某地区某地区20072007年至年至20132013年年农村居民村居民家庭人均家庭人均纯收入收入y(y(单位位: :千元千元) )的数据如下表的数据如下表: :年份年份20072007200820082009200920102010201120112012201220132013年份代号年份代号t t1 12 23 34 45 56 67 7人均人均纯收入收入y y2.92.93.33.33.63.64.44.44.84.85.25.25.95.9(1)(1)求求y y关于关于t t的线性回归方程的线性回归方程. .(2)(2)利用利用(1)(1)中的回归方程中的回归方程, ,分析分析20072007年至年至20132013年该地区农村居民家庭人年该地区农村居民家庭人均纯收入的变化情况均纯收入的变化情况, ,并预测该地区并预测该地区20152015年农村居民家庭人均纯收入年农村居民家庭人均纯收入. .【解题提示】【解题提示】(1)(1)利用公式求得回归方程利用公式求得回归方程. .(2)(2)利用回归方程中利用回归方程中 的正负分析变化情况的正负分析变化情况, ,将将20152015年的年份代号代入年的年份代号代入回归方程回归方程, ,估计家庭人均纯收入估计家庭人均纯收入. .【规范解答】【规范解答】(1)(1)因为因为(2)(2)因为因为 = 0, = 0,所以所以20072007年至年至20132013年该地区人均纯收入稳步增年该地区人均纯收入稳步增长,预计到长,预计到20152015年,该地区人均纯收入年,该地区人均纯收入y= 9+2.3=6.8(y= 9+2.3=6.8(千元千元) ),所以预计到所以预计到20152015年,该地区人均纯收入约年,该地区人均纯收入约6 8006 800元左右元左右. .悟悟技法技法线性回性回归分析分析问题的的类型及解型及解题方法方法(1)(1)求求线性回性回归方程方程. .利用公式利用公式, ,求出回求出回归系数系数b,a.b,a.待定系数法待定系数法: :利用回利用回归直直线过样本点中心求系数本点中心求系数. .(2)(2)利用回利用回归方程方程进行行预测: :把回把回归直直线方程看作一次函数方程看作一次函数, ,求函数求函数值. .(3)(3)利用回利用回归直直线判断正、判断正、负相关相关: :决定正相关决定正相关还是是负相关的是系数相关的是系数b.b.通通一一类1.(20131.(2013湖北高考湖北高考) )四名同学根据各自的四名同学根据各自的样本数据研究本数据研究变量量x,yx,y之之间的相关关系的相关关系, ,并求得回并求得回归直直线方程方程, ,分分别得到以下四个得到以下四个结论: :yy与与x x负相关且相关且 =2.347x-6.423; =2.347x-6.423;yy与与x x负相关且相关且 =-3.476x+5.648; =-3.476x+5.648;yy与与x x正相关且正相关且 =5.437x+8.493; =5.437x+8.493;yy与与x x正相关且正相关且 =-4.326x-4.578. =-4.326x-4.578.其中一定不正确的其中一定不正确的结论的序号是的序号是( () )A.A. B. B. C. C.D.D.【解题提示】【解题提示】x x的系数的符号决定变量的系数的符号决定变量x,yx,y之间的正、负相关关系之间的正、负相关关系. .【解析】【解析】选选D.xD.x的系数大于的系数大于0 0为正相关为正相关, ,小于小于0 0为负相关为负相关. .2.(20152.(2015沈阳模拟沈阳模拟) )高三某班学生每周用于物理学习的时间高三某班学生每周用于物理学习的时间x(x(单位单位: :小时小时) )与物理成绩与物理成绩y(y(单位单位: :分分) )之间有如下关系之间有如下关系: :x x2424151523231919161611112020161617171313y y9292797997978989646447478383686871715959根据上表可得回归方程的斜率为根据上表可得回归方程的斜率为3.53,3.53,则回归直线在则回归直线在y y轴上的截距为轴上的截距为.(.(答案保留到答案保留到0.1)0.1)【解析】【解析】由已知可得由已知可得设回归直线方程为设回归直线方程为 =3.53x+ , =3.53x+ ,则则74.9=3.5317.4+ ,74.9=3.5317.4+ ,解得解得 13.5. 13.5.答案:答案:13.513.53.(20153.(2015重庆模拟重庆模拟) )重庆市某知名中学高三年级甲班班主任近期对班重庆市某知名中学高三年级甲班班主任近期对班上每位同学的成绩作相关分析时上每位同学的成绩作相关分析时, ,得到石周卓婷同学的某些成绩数据得到石周卓婷同学的某些成绩数据如下如下: :第一次考第一次考试第二次考第二次考试第三次考第三次考试第四次考第四次考试数学数学总分分118118119119121121122122总分年分年级排名排名133133127127121121119119(1)(1)求求总分年分年级名次关于数学名次关于数学总分的分的线性回性回归方程方程( (必要必要时用分数表示用分数表示).).(2)(2)若石周卓婷同学想在下次的若石周卓婷同学想在下次的测试时考入年考入年级前前100100名名, ,预测该同学同学下次下次测试的数学成的数学成绩至少至少应考多少分考多少分( (取整数取整数, ,可四舍五入可四舍五入).).【解析】【解析】(1)(1)因为因为(2)(2)因为因为y=100,y=100,所以所以100=- x+533,100=- x+533,所以所以x128.x128.所以该同学下次测试的数学成绩至少应考所以该同学下次测试的数学成绩至少应考128128分分. .4.(20154.(2015贵阳模阳模拟) )为了分析某个高三学生的学了分析某个高三学生的学习状状态, ,对其下一其下一阶段的学段的学习提供指提供指导性建性建议. .现对他前他前7 7次考次考试的数学成的数学成绩x x、物理成、物理成绩y y进行分析行分析. .下面是下面是该生生7 7次考次考试的成的成绩. .数学数学888883831171179292108108100100112112物理物理949491911081089696104104101101106106(1)(1)他的数学成他的数学成绩与物理成与物理成绩哪个更哪个更稳定定? ?请给出你的出你的证明明. .(2)(2)已知已知该生的物理成生的物理成绩y y与数学成与数学成绩x x是是线性相关的性相关的, ,若若该生的物生的物理成理成绩达到达到115115分分, ,请你估你估计他的数学成他的数学成绩大大约是多少是多少? ?并并请你根据你根据物理成物理成绩与数学成与数学成绩的相关性的相关性, ,给出出该生在学生在学习数学、物理上的合数学、物理上的合理建理建议.(.(其中其中, ,数据数据(x(xi i,y,yi i)(i=1,2,n)(i=1,2,n)的的线性回性回归方程方程为【解析】【解析】(1)(1)因为因为从而从而 ,所以该生的物理成绩更稳定,所以该生的物理成绩更稳定(2)(2)由于由于x x与与y y之间具有线性相关关系,之间具有线性相关关系,所以所以所以线性回归方程为所以线性回归方程为 0.5x0.5x50.50.当当y y115115时,时,x x130.130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高于物理成绩的进一步提高规范解答范解答1919 独立性独立性检验与概率的与概率的综合合应用用【典例】【典例】(12(12分分)(2015)(2015漳州模漳州模拟) )某旅行社某旅行社为调查市民喜市民喜欢“人文景人文景观”景点是否与年景点是否与年龄有关有关, ,随机抽取了随机抽取了5555名市民名市民, ,得到数据如下表得到数据如下表: :喜喜欢不喜不喜欢总计大于大于4040岁20205 525252020岁至至4040岁101020203030总计303025255555(1)(1)判断是否在犯判断是否在犯错误的概率不超的概率不超过0.5%0.5%的前提下的前提下认为喜喜欢“人文景人文景观”景点与年景点与年龄有关有关? ?(2)(2)用分用分层抽抽样的方法从喜的方法从喜欢“人文景人文景观”景点的市民中随机抽取景点的市民中随机抽取6 6人人作作进一步一步调查, ,将将这6 6位市民作位市民作为一个一个样本本, ,从中任从中任选2 2人人, ,求恰有求恰有1 1位位“大于大于4040岁”的市民和的市民和1 1位位“20“20岁至至4040岁”的市民的概率的市民的概率. .下面的临界值表供参考下面的临界值表供参考: :P(KP(K2 2kk0 0) )0.150.150.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 02.0722.0722.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.828( (参考公式参考公式:K:K2 2= ,= ,其中其中n=a+b+c+d)n=a+b+c+d)解题导思解题导思 研读信息快速破题研读信息快速破题规范解答规范解答 阅卷标准体会规范阅卷标准体会规范(1)(1)所以在犯错误的概率不超过所以在犯错误的概率不超过0.5%0.5%的前提下认为喜欢的前提下认为喜欢“人文景观人文景观”景点与年龄有关景点与年龄有关.5.5分分(2)(2)设所抽样本中有设所抽样本中有m m个个“大于大于4040岁岁”市民市民, ,则则 得得m=4,m=4,所以样本中有所以样本中有4 4个个“大于大于4040岁岁”的市民的市民,2,2个个“20“20岁至岁至4040岁岁”的市的市民民, ,分别记作分别记作B B1 1,B,B2 2,B,B3 3,B,B4 4,C,C1 1,C,C2 2, ,从中任选从中任选2 2人的基本事件有人的基本事件有共共1515个个. . 9 9分分其中恰有其中恰有1 1名名“大于大于4040岁岁”和和1 1名名“20“20岁至岁至4040岁岁”的市民的事件有的市民的事件有(B(B1 1,C,C1 1),(B),(B1 1,C,C2 2),(B),(B2 2,C,C1 1),(B),(B2 2,C,C2 2),(B),(B3 3,C,C1 1),(B),(B3 3,C,C2 2),(B),(B4 4,C,C1 1),(B),(B4 4,C,C2 2),),共共8 8个个. .所以恰有所以恰有1 1名名“大于大于4040岁岁”的市民和的市民和1 1名名“20“20岁至岁至4040岁岁”的市民的概的市民的概率为率为P= . P= . 1212分分高考状元高考状元 满分心得分心得 把握把握规则争取争取满分分1.1.计算准确算准确: :数学往往通数学往往通过数字数字说明明问题, ,计算算结果必果必须准确准确. .如如(1)(1)中中K K2 2的的计算要仔算要仔细, ,参考数据表的参考数据表的应用要用要对应准确准确. .2.2.独立性独立性检验中中,K,K2 2值越大越大, ,两两变量有关的可能性越大量有关的可能性越大, ,在在(1)(1)中下中下结论时易得出相反的易得出相反的错误结论. .3.3.古典概型中列古典概型中列举基本事件基本事件时, ,要按照一定的要按照一定的顺序列序列举, ,做到不重不漏做到不重不漏, ,在在(2)(2)中中这是是导致失分的主要原因致失分的主要原因. .
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号