资源预览内容
第1页 / 共27页
第2页 / 共27页
第3页 / 共27页
第4页 / 共27页
第5页 / 共27页
第6页 / 共27页
第7页 / 共27页
第8页 / 共27页
第9页 / 共27页
第10页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1.2独立性检验的基本(jbn)思想及其初步应用第一页,共27页。教学教学(jio xu)目标目标 v1理解独立性检验的基本思想v2、会从列联表、柱形图、条形图直观判断吸烟与患癌有关。v3、了解随机变量K2的含义。v理解独立性检验的基本思想及实施步骤(bzhu)。v教学重点:理解独立性检验的基本思想。独立性检验的步骤(bzhu)。 v教学难点;1、理解独立性检验的基本思想;2、了解随机变量K2的含义;独立性检验的步骤(bzhu)。 第二页,共27页。看到这个课题,你能想到(xin do)什么?第三页,共27页。案案 例:某医疗机构为了了解呼吸道疾病与吸例:某医疗机构为了了解呼吸道疾病与吸烟是否有关烟是否有关(yugun)(yugun),进行了一次抽样调查,进行了一次抽样调查,共调查了共调查了515515个成年人,其中吸烟者个成年人,其中吸烟者220220人,不人,不吸烟者吸烟者295295人。人。调查结果:吸烟调查结果:吸烟(x yn)(x yn)的的220220人中有人中有3737人患呼吸人患呼吸道疾病,道疾病,183183人未患呼吸道疾病;不吸烟人未患呼吸道疾病;不吸烟(x yn)(x yn)的的295295人中有人中有2121人患病,人患病,274274人未患病。人未患病。根据这些数据,能否断定:患呼吸道疾病与吸烟(x yn)有关?第四页,共27页。数据(shj)整理患病患病未患病未患病合计合计吸烟吸烟不吸烟不吸烟合计合计372158183274457220295515问题(wnt):判断的标准是什么?第五页,共27页。吸烟与不吸烟,患病的可能性的大小是否(sh fu)有差异?频率(pnl)估计概率患 病未患病合 计(n)吸 烟16.82%83.18%100%(220)不吸烟7.12%92.88%100%(295)第六页,共27页。通过图形通过图形(txng)直观判断直观判断不患病不患病(hun bn)比例比例患病患病(hun bn)比例比例第七页,共27页。解决问题:直观(zhgun)方法吸烟的患病率不吸烟的患病率37/220 16.82%21/295 7.12%根据统计分析的思想,用频率估计概率可知,吸烟者与不吸烟者患病的可能性存在差异。你能有多大把握认为“患病(hun bn)与吸烟有关”呢?第八页,共27页。 有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该(ynggi)去探求什么是最可能的。笛卡尔能否能否(nn fu)用数量来刻画用数量来刻画“有关有关”程度程度第九页,共27页。问题的数学(shxu)表述v“患呼吸道疾病与吸烟有关患呼吸道疾病与吸烟有关”这句话是什么意思这句话是什么意思(y s)?v“某成年人吸烟某成年人吸烟”记为事件记为事件A, “某成年人患病某成年人患病”记为事件记为事件Bv这句话的意思这句话的意思(y s)是:事件是:事件A与事件与事件B有关。有关。v问题的另一面是:事件问题的另一面是:事件A与事件与事件B独立。独立。第十页,共27页。患病患病未患病未患病合计合计吸烟吸烟不吸烟不吸烟合计合计372158183274457220295515第十一页,共27页。一般化:第十二页,共27页。P(A)、P(B)不知道(zh do),怎么办?频率(pnl)估计概率P(A) P(B) P(AB) 第十三页,共27页。同理,吸烟但不患病(hun bn)的人数约为n 由此估计: 吸烟且患病(hun bn)的人数约为 n 第十四页,共27页。不吸烟(x yn)但患病的人数约为n 不吸烟(x yn)也不患病的人数约为n 第十五页,共27页。第十六页,共27页。怎样估计实际观测值与理论(lln)估计值的误差?采用如下的量(称为2 统计量)来刻画(khu)这个差异:+第十七页,共27页。化简得=22统计(tngj)量2 11.8634第十八页,共27页。解决问题的思路(sl)v思路:反证法思想v(1)假设:H0:患病与吸烟无关v 即 P(A)P(B)= P(AB)v(2)在 H0成立(chngl)的条件下进行推理v(3)如果实际观测值与由(2)推出的值相差不大,则可以认为这些差异是由随机误差造成的,假设H0不能被否定;否则,假设H0不能被接受第十九页,共27页。反证法原理(yunl)与假设检验原理(yunl)反证法原理: 在一个已知假设(jish)下,如果推出一个矛盾,就证明了这个假设(jish)不成立。假设检验原理:在一个已知假设下,如果(rgu)推出一个小概率事件发生,则推断这个假设不成立的可能性很大。第二十页,共27页。一般地,对于两个研究对象一般地,对于两个研究对象和和,有两类有两类取值,即类取值,即类A A和和B B(如吸烟与不吸烟);(如吸烟与不吸烟);也有两类也有两类取值,即类取值,即类1 1和和2 2(如患病(如患病(hun bn)(hun bn)与不患病与不患病(hun bn)(hun bn))。于是得到)。于是得到下列联表所示的抽样数据:下列联表所示的抽样数据:类类1 1类类2 2总计总计类类A Aa ab ba+ba+b类类B Bc cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二十一页,共27页。要推断要推断“和和有关系有关系(gun x)”(gun x)”,可按下面的步骤,可按下面的步骤进行:进行:(1 1)提出假设)提出假设(jish)H0 (jish)H0 :和和没有关系;没有关系;(3 3)查对)查对(chdu)(chdu)临界值,作出判断。临界值,作出判断。(2 2)根据)根据2 2 2 2列联表与公式计算列联表与公式计算 的值;的值; 由于抽样的随机性,由样本得到的推断由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用有可能正确,也有可能错误。利用 进行进行独立性检验,可以对推断的正确性的概率作独立性检验,可以对推断的正确性的概率作出估计,样本量出估计,样本量n n越大,估计越准确。越大,估计越准确。第二十二页,共27页。0.50.40.250.150.10.050.0250.010.0050.001xo0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828卡方临界值表:卡方临界值表:则有则有99.9%99.9%的把握的把握(bw)(bw)认为认为“与与有关系有关系”;(1)1)若观测若观测(gunc)(gunc)值值2210.828.10.828.(3)3)若观测若观测(gunc)(gunc)值值222.7062.706,则,则(4)4)若观测值若观测值2 22.7062.706,则,则(2)2)若观测值若观测值2 26.6356.635,则有则有99%99%的把握认为的把握认为“与与有关系有关系”;则有则有90%90%的把握认为的把握认为“与与有关系有关系”;则没有充分的证据显示则没有充分的证据显示“与与有关系有关系”,但也不能作出结论,但也不能作出结论“H“H0 0成立成立”,即,即与与没有关系。没有关系。第二十三页,共27页。例2:为研究不同的给药方式(口服与注射)和药的效果(有效和无效(wxio))是否有关,进行了相应的抽样调查,调查的结果列在下表中,根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?有效有效无效无效合计合计口服口服584098注射注射643195合计合计12271193第二十四页,共27页。解:提出假设 H0:药的效果与给药方式无关系。根据列联表中的数据可以求出:当H0成立时, 的概率大于10%,这个概率比较大,所以根据目前的调查数据,不能否定假设H0,即不能作出药的效果与给药方式有关的结论。第二十五页,共27页。小结(xioji):1、所学的知识(zh shi);2、解决问题的思路(sl);3、假设检验原理。第二十六页,共27页。第二十七页,共27页。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号