资源预览内容
第1页 / 共16页
第2页 / 共16页
第3页 / 共16页
第4页 / 共16页
第5页 / 共16页
第6页 / 共16页
第7页 / 共16页
第8页 / 共16页
第9页 / 共16页
第10页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1上节学习了回归分析的基本方法线性回归模型上节学习了回归分析的基本方法线性回归模型ybxae不同于一次函数不同于一次函数ybxa,含有,含有_,其中,其中x为为_,y为为_.温故夯基温故夯基温故夯基温故夯基随机误差随机误差e解释变量解释变量预报变量预报变量样本点的中心样本点的中心残差平方和残差平方和数学选修数学选修1-21-2(第一课时)(第一课时)学习目标学习目标 1.会列会列22列联表,会画等高条形图列联表,会画等高条形图2.会从会从22列联表,等高条形图中直观列联表,等高条形图中直观的判断出两个分类变量之间是否有关?的判断出两个分类变量之间是否有关?3.了解独立性检验的基本思想和步骤了解独立性检验的基本思想和步骤独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量的之间是否有关系分类变量的之间是否有关系独立性检验独立性检验独立性检验独立性检验 某医疗机构为了了解呼吸道疾病与吸某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调烟是否有关,进行了一次抽样调查,共调查了查了515515个成年人,其中吸烟者个成年人,其中吸烟者220220人,不人,不吸烟者吸烟者295295人,调查结果是:吸烟的人,调查结果是:吸烟的220220人人中中3737人患人患病病, 183183人不患人不患病病;不吸烟的;不吸烟的295295人中人中2121人患人患病病, 274274人不患人不患病病。 根据这些数据能否断定:患根据这些数据能否断定:患病病与与吸烟有关吗?吸烟有关吗?患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515为了研究这个问题,我们将上述问题用下表表示:为了研究这个问题,我们将上述问题用下表表示:在不吸烟者中患病的比重是在不吸烟者中患病的比重是 在吸烟者中患病的比重是在吸烟者中患病的比重是 7.12%7.12%16.82%16.82% 上述结论能说明吸烟与患病有关吗?上述结论能说明吸烟与患病有关吗?列列2 222列列联表联表两个分类变量之间是否有关系?1.从列联表分别计算患病在两类中的频率。不患病不患病比例比例患病患病比例比例吸烟者与不吸烟者患病的可能性存在差异。吸烟者与不吸烟者患病的可能性存在差异。2.画出列联表的等高条形图例例1:随着:随着新还珠格格新还珠格格的热播,又掀起了一的热播,又掀起了一场场“还珠热还珠热”。为了了解喜爱看。为了了解喜爱看新还珠格格新还珠格格是是否与性别有关,小欣随机抽查了否与性别有关,小欣随机抽查了140名男性和名男性和160名女性,调查发现,男性和女性中分别有名女性,调查发现,男性和女性中分别有80人和人和120人喜爱看,其余人不喜爱看。人喜爱看,其余人不喜爱看。(2)利用图形判断性别与是否喜爱看)利用图形判断性别与是否喜爱看新新 还珠格格还珠格格有关?有关?(1)根据以上数据建立一个)根据以上数据建立一个22的列联表;的列联表; 有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。笛卡尔能否用数量来刻画能否用数量来刻画“有关有关”程度程度3.“有关”的可信程度是多少?即有“多少把握认为有关”呢?两个分类变量的独立性检验患病不患病总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d 利用随机变量K2来确定是否能以一定的把握认为“两个变量有关系”的方法,称为两个分类变量的独立性检验。 独立性检验第一步:第一步:H H0 0: 吸烟吸烟和和患病患病之间没有关系之间没有关系 患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二步:列出第二步:列出2 222列联表列联表 第三步:引入一个随机变量:第三步:引入一个随机变量:卡方统计量卡方统计量第四步:查对临界值表第四步:查对临界值表( (教材教材P13),P13),作出判断。作出判断。 利利用用独独立立性性检检验验来来考考察察两两个个分分类类变变量量是是否否有有关关系系,能较精确地给出这种判断的可靠程度能较精确地给出这种判断的可靠程度. .具体作法是:具体作法是:(1 1)根据实际问题需要的可信程度确定临界值)根据实际问题需要的可信程度确定临界值k k0 0;(2)由观测数据计算得到随机变量)由观测数据计算得到随机变量K2的观测值的观测值k;(3)如果)如果k6.635,就以,就以 1-P(K26.635)100%的把的把握认为握认为“X与与Y有关系有关系”;否则就说样本观测数据没有;否则就说样本观测数据没有提供提供“X与与Y有关系有关系”的充分证据的充分证据.10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.50(1 1)如果)如果k10.828k10.828,就有,就有99.9%99.9%的把握认为的把握认为“X X与与Y Y有关系有关系”;(2 2)如果)如果k7.879k7.879,就有,就有99.5%99.5%的把握认为的把握认为“X X与与Y Y有关系有关系”;(3 3)如果)如果k6.635k6.635,就有,就有99%99%的把握认为的把握认为“X X与与Y Y有关系有关系”;(4 4)如果)如果k5.024k5.024,就有,就有97.5%97.5%的把握认为的把握认为“X X与与Y Y有关系有关系”;(5 5)如果)如果k3.841k3.841,就有,就有95%95%的把握认为的把握认为“X X与与Y Y有关系有关系”;(6 6)如果)如果k2.706k2.706,就有,就有90%90%的把握认为的把握认为“X X与与Y Y有关系有关系”;(7 7)如果)如果k=2.706k=2.706,就认为没有充分的证据显示,就认为没有充分的证据显示 “X X与与Y Y有关系有关系”. .临界值临界值例例2 在在某某医医院院,因因为为患患心心脏脏病病而而住住院院的的665名名男男性性病病人人中中,有有214人人秃秃顶顶;而而另另外外772名名不不是是因因为为患患心心脏脏病病而而住住院院的的男男性性病病人人中中有有175人人秃秃顶顶。利利用用独独立立性性检检验验方方法法判判断断秃秃顶顶与与患患心心脏脏病病是是否否有有关关系?你所得的结论在什么范围内有效?系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:解:根据题目所给数据得到如下列联表:患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 根据列联表的数据,得到根据列联表的数据,得到所以有所以有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”。 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计72228300解:在假设“性别与是否喜欢数学课程之间没有关系”的前提下K2应该很小,并且例3.性别与喜欢数学课 由表中数据计算K2的观测值k 4.513。在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?而我们所得到的K2的观测值k 4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”。(1)列出出2 222列联表列联表(2)计算K2的观测值k(3)查表得结论(表111) 课堂小结课堂小结:独立性检验的步骤独立性检验的步骤
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号