资源预览内容
第1页 / 共28页
第2页 / 共28页
第3页 / 共28页
第4页 / 共28页
第5页 / 共28页
第6页 / 共28页
第7页 / 共28页
第8页 / 共28页
第9页 / 共28页
第10页 / 共28页
亲,该文档总共28页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
专题1.5 概率与统计(回归分析、独立性检验) 1频率分布直方图、茎叶图、平均数、方差,离散型随机变量的分布列与期望仍然是考查的热点,同时应注意和概率、平均数、分布列,期望,二项分布,正态分布等知识的结合,同时应注意独立性检验在实际生活中的应用2求回归直线方程的一般步骤作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系当两变量具有线性相关关系时,求回归系数,写出回归直线方程根据方程进行估计3独立性检验的一般步骤:根据样本数据列出列联表;计算随机变量的观测值k,查下表确定临界值k0:如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”注意:通常认为时,样本数据就没有充分的证据显示“X与Y有关系”独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断1(2023春陕西咸阳高二阶段练习)某药品公司有6名产品推销员,其工作年限与月均销售金额的数据如下表:推销员编号12345工作年限x/年35679月均销售金额y/万元23345(1)以工作年限为自变量x,月均销售金额为因变量y,作出散点图;(2)求月均销售金额y关于工作年限x的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的月均销售金额附:回归直线的斜率和截距的最小二乘法估计公式分别为:b=i=1nxiyinxyi=1nxi2nx2=i=1nxixyiyi=1nxix2,a=ybx【解题思路】(1)根据表格中数据,直接描点即可得到散点图;(2)首先求出x,y的平均数,利用最小二乘法求出b的值,再利用样本中心点满足线性回程和前面做出的横标和纵标的平均值,求出a值,写出线性回归方程;(3)第6名推销员的工作年限为11年,即x=11时,把自变量的值代入线性回归方程,得到y的预报值.【解答过程】(1)依题意,画出散点图如图所示(2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为y=bx+a计算得x=3+5+6+7+95=6,y=2+3+3+4+55=3.4,则b=i=15xiyi5xyi=15xi25x2=112102200180=0.5,a=ybx=3.40.56=0.4,月均销售金额y关于工作年限x的线性回归方程为y=0.5x+0.4(3)由(2)可知,当x=11时,y=0.5x+0.4=0.511+0.4=5.9(万元)可以估计第6名推销员的月均销售金额为5.9万元2(2023春陕西咸阳高二阶段练习)网络购物已经渐渐成为人们购物的新方式为了调查每周网络购物的次数和性别的关系,随机调查了100名市民的网络购物情况,有关数据的22列联表如下:10次及10次以上10次以下男性1040女性4010(1)从这100位市民中随机抽取一位,试求出该市民为每周网络购物不满10次的男性的概率;(2)请说明能否在犯错误的概率不超过0.001的前提下,认为每周网络购物次数与性别有关系?PK2k00.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828参考公式:K2=nadbc2a+bc+da+cb+d(其中n=a+b+c+d)【解题思路】(1)根据古典概型的概率计算公式即可求解;(2)根据表格将数据代入K2的计算公式即可求解.【解答过程】(1)由表中数据可知,每周网络购物不满10次的男性为40人,所以概率P=40100=25;(2)由题意可知,K2=100102402250505050=3610.828,所以在犯错误的概率不超过0.001的前提下,认为每周网络购物次数与性别有关3(2022春陕西榆林高二阶段练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积x与相应的管理时间y的关系如下表:土地使用面积x(单位:亩)12345管理时间y(单位:月)811142423并调查了某村300名村民参与管理的意愿,得到的部分数据如下表:愿意参与管理不愿意参与管理男性村民14060女性村民40(1)根据所给数据知,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;(r值精确到0.01)(2)完成下面的列联表,并判断是否有99.9%的把握认为参与管理的意愿与该村村民的性别有关.愿意参与管理不愿意参与管理合计男性村民14060女性村民40合计参考公式:r=i=1nxixyiyi=1nxix2i=1nyiy2;K2=n(adbc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:i=15xixyiy=43,i=15yiy2=206,51522.70.临界值表:PK2k00.0500.0100.001k03.8416.63510.828【解题思路】(1)先计算土地使用面积x的平均值,再根据公式计算r;(2)先填好列联表,再运用卡方计算.【解答过程】(1)依题意:x=1+2+3+4+55=3,i=15xix2=(2)2+(1)2+02+12+22=10,又i=15xixyiy=43,i=15yiy2=206,r=i=15xixyiyi=15xix2i=15yiy2=4310206=4325154345.40.95,y与x的相关系数r近似为0.95,y与x的线性相关程度相当大,从而可以用线性回归模型拟合y与x的关系;(2)完成的列联表如下:愿意参与管理不愿意参与管理合计男性村民14060200女性村民4060100合计180120300计算K2=300(140604060)2180120200100=2510.828,有99.9%的把握认为参与管理的意愿与该村村民的性别有关.综上,r0.95可以用线性回归模型拟合y与x的关系;有99.9%的把握认为参与管理的意愿与该村村民的性别有关.4(2023云南昆明统考一模)某新能源汽车公司从2018年到2022年汽车年销售量y(单位:万辆)的散点图如下:记年份代码为xx=1,2,3,4,5(1)根据散点图判断,模型y=a+bx与模型y=c+dx2,哪一个更适宜作为年销售量y关于年份代码x的回归方程?(给出判断即可,不必说明理由)(2)根据(1)的判断结果,建立y关于x的回归方程;(3)预测2023年该公司新能源汽车销售量参考数据:yi=15xi2i=15xi4i=15xiyii=15xi2yi34559796572805参考公式:回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为:b=i=1nxixyiyi=1nxix2=i=1nxiyinxyi=1nxi2nx2,a=ybx【解题思路】(1)根据散点图结合一次函数、二次函数的图象特征分析判断;(2)换元令t=x2,结合题中数据与公式运算求解;(3)令x=6,代入回归方程运算求解.【解答过程】(1)由散点图可知:散点图与一次函数偏差较大,与二次函数较接近,故模型y=c+dx2更适合.(2)令t=x2,则i=15ti2=i=15xi4=979,i=15tiyi=i=15xi2yi=2805,t=15i=15ti=15i=15xi2=11,y=34,对于回归方程y=c+dt,可得:d=i=15tiyi5tyi=15ti25t2=2805511349795112=935374=2.5,c=ydt=342.511=6.5,故回归方程为y=6.5+2.5t,即y=6.5+2.5x2.(3)由(2)可得:y=6.5+2.5x2,令x=6,则y=6.5+2.562=96.5,预测2023年该公司新能源汽车销售量96.5万辆.5(2022春山西大同高二期中)随着节能减排意识深入人心,共享单车在各大城市大范围推广,越来越多的市民在出行时喜欢选择骑行共享单车.为了研究广大市民在共享单车上的使用情况,某公司在我市随机抽取了100名用户进行调查,得到如下数据:每周使用次数1次2次3次4次5次6次及以上男4337830女6544620合计1087111450(1)如果用户每周使用共享单车超过3次,那么认为其“喜欢骑行共享单车”.请完成下面的22列联表,并判断依据=0.05的独立性检验,能否认为“喜欢骑行共享单车”与性别有关;不喜欢骑行共享单车喜欢骑行共享单车合计男女合计(2)每周骑行共享单车6次及6次以上的用户称为“骑行达人”,将频率视为概率,在我市所有的“骑行达人”中随机抽取4名,求抽取的这4名“骑车达人”中,既有男性又有女性的概率.【解题思路】(1)由题意,写出列联表,利用独立性检验,可得答案;(2)根据概率的乘法公式以及概率的减法公式,可得答案.【解答过程】(1)由题目表格中的数据可得如下22列联表:不喜欢骑行共享单车喜欢骑行共享单车合计男104555女153045合计2575100将22列联表中的数据代入公式,得2=100(45153010)2257555453.033.841,所以依据=0.05的独立性检验,不能认为“喜欢骑行共享单车”与性别有关.(2)将频率视为概率,在我市的“骑行达人”中随机抽取1名,则该“骑行达人”是男性的概率为35,是女性的概率为25.故抽取的这4名“骑行达人”中,既有男性又有女性的概率P=1354254=528625.6(2023福建漳州统考三模)2022年11月17日,由工业和信息化部、安徽省人民政府共同主办的第十七届“中国芯”集成电路产业大会在合肥成功举办此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.2022年,全国芯片研发单位相比2006年增加194家,提交芯片数量增加299个,均增长超过6倍.某芯片研发单位用在“A芯片”上研发费用占本单位总研发费用的百分比y(%)如表所示.年份2016201720182019202020212022年份代码1234567y20%30%32%39
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号