资源预览内容
第1页 / 共13页
第2页 / 共13页
第3页 / 共13页
第4页 / 共13页
第5页 / 共13页
第6页 / 共13页
第7页 / 共13页
第8页 / 共13页
第9页 / 共13页
第10页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
11.3 相关性、最小二乘估计、回归分析与独立性检验核心考点精准研析考点一相关关系的判断1.已知变量x和y近似满足关系式y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关2.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2r40r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r1r3【解析】1.选C.由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,随y的减小而减小,所以z随x的增大而减小,x与z负相关.2.选A.由相关系数的定义以及散点图所表达的含义可知r2r40r30时,正相关;b0时,负相关.考点二独立性检验【典例】(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图所示:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg, 新养殖法的箱产量不低于50 kg”,估计A的概率.(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)【解题导思】序号联想解题(1)以频率代替概率,相互独立时交事件概率等于两事件概率的积(2)填入数据,代入2公式计算,与临界值比较(3)中位数把频率分布直方图分为面积相等的两部分【解析】(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)5=0.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.66=0.409 2.(2)箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)5=0.340.5,故新养殖法箱产量的中位数的估计值为50+0.5-0.340.06852.35(kg).1.在22列联表中,|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成22列联表.(2)根据公式2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)计算.(3)比较2与临界值的大小关系,作统计推断.(2020合肥模拟)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查. 现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面的22列联表.并判断能否有95%的把握认为科学类的选择与性别有关?选择自然科学类选择社会科学类合计男生女生合计附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解析】(1)从高一年级学生中随机抽取1人,抽到男生的概率约为105180=712.(2)根据统计数据,可得22列联表如表:选择自然科学类选择社会科学类合计男生6045105女生304575合计9090180则2=180(6045-3045)2105759090=3675.142 93.841,所以有95%的把握认为科学类的选择与性别有关.考点三回归分析命题精解读1.考什么:(1)考查线性回归方程的求法及运用回归方程进行预测.(2)考查散点图、相关系数等判断两个变量是否相关的方法.(3)考查数学运算、数据分析的核心素养及数形结合等思想方法.2.怎么考:与频率分布表、频率分布直方图、折线图等结合考查回归分析的方法.3.新趋势:以回归分析为载体,与频率分布、概率等交汇命题.学霸好方法1.回归分析方法:(1)利用公式,求出回归系数.(2)利用回归方程进行预测.(3)确定模型是否合适,及时修正.2.交汇问题: 与频率分布直方图、折线图等交汇时,分析图形提供的数据信息,获得计算相关系数、回归系数等需要的数据,最后计算比较.线性回归方程及其应用【典例】现代社会,“鼠标手”已成为常见病,一次实验中,10名实验对象进行160分钟的连续鼠标点击游戏,每位实验对象完成的游戏关卡一样,鼠标点击频率平均为180次/分钟,实验研究人员测试了实验对象使用鼠标前后的握力变化,前臂表面肌电频率等指标.(1)10 名实验对象实验前、后握力(单位:N)测试结果如下:实验前:346,357,358,360,362,362,364,372,373,376实验后:313,321,322,324,330,332,334,343,350,361完成茎叶图,并计算实验后握力平均值比实验前握力的平均值下降了多少N?(2)实验过程中测得时间t(分)与10名实验对象前臂表面肌电频率的中值频率y(Hz)的九组对应数据(t,y)为(0,87),(20,84),(40,86),(60,79),(80,78),(100,78),(120,76),(140,77),(160,75).建立y关于时间t的线性回归方程;(3)若肌肉肌电水平显著下降,提示肌肉明显进入疲劳状态,根据(2)中9组数据分析,使用鼠标多少分钟就该进行休息了?参考数据:i=19(ti-t)(yi-y)=-1 800;参考公式:回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为:b=i=1n(ti-t)(yi-y)i=1n(ti-t)2,a=y-bt.【解析】(1)根据题意得到茎叶图如图所示:由图中数据可得x1=110(346+357+358+360+362+362+364+372+373+376)=363,x2=110(313+321+322+324+330+332+334+343+350+361)=333,所以x1-x2=363-333=30(N),所以实验后比实验前握力的平均值下降30N.(2)由题意得t=19(0+20+40+60+80+100+120+140+160)=80,y=19(87+84+86+79+78+78+76+77+75)=80,i=19(ti-t)2=(0-80)2+(20-80)2+(40-80)2+(60-80)2+(80-80)2+(100-80)2+(120-80)2+(140-80)2+(160-80)2=24 000,又i=19(ti-t)(yi-y)=-1 800,所以b=i=19(ti-t)(yi-y)i=19(ti-t)2=-1 80024 000=-0.075,所以a=y-bt=80-(-0.075)80=86,所以y关于时间t的线性回归方程为y=-0.075t+86.(3)九组数据中40分钟到60分钟y的下降幅度最大,提示60分钟时肌肉已经进入疲劳状态,故使用鼠标60分钟就该休息了.相关系数及其应用【典例】科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如表:x(年龄/岁)26273941495356586061y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据表中的数据得到如图的散点图.(1)根据表中的样本数据及其散点图.(i)求x;(ii)计算样本相关系数(精确到0.01),并刻画它们的相关程度.(2)若y关于x的线性回归方程为y=1.56+bx,求b的值(精确到0.01),并根据回归方程估计年龄为50岁时人体的脂肪含量.附:参考数据:y-=27,i=110xiyi=13 527.8,i=110xi2=23 638,i=110yi2=7 759.6,436.56,2 93554.18,参考公式:相关系数r=i=1nxi-x-yi-y-i=1nxi-x2i=1nyi-y2=i=1nxiyi-nxyi=1nxi2-nx2i=1nyi2-ny2回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.【解析】(1)根据表中的样本数据及其散点图:()x=26+27+39+41+49+53+56+58+60+6110=47.()r=i=1nxiyi-nxyi=1nxi2-nx2i=1nyi2-ny2=13 527.8-10472723 638-104727 759.6-10272=13 527.8-12 69023 638-22 0907 759.6-7 290=837.81 548469.6=8 37864342 935.因为436.56,2 93554.18,所以r0.98.由样本相关系数r0.98,可以推断人体脂肪含量和年龄的相关程度很强.(2)因为回归方程为y=1.56+bx,即a=1.56.所以b=y-ax=27-1.56470.54.【或利用b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2=837.81 5480.54】所以y关于x的线性回归方程为y=0.54x+1.56.将x=50代入线性回归方程得y=0.5450+1.56=28.56.所以根据回归方程估计年龄为50岁时人
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号