资源预览内容
第1页 / 共32页
第2页 / 共32页
第3页 / 共32页
第4页 / 共32页
第5页 / 共32页
第6页 / 共32页
第7页 / 共32页
第8页 / 共32页
第9页 / 共32页
第10页 / 共32页
亲,该文档总共32页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
独立性独立性检验检验的基本思想的基本思想及其初步及其初步应应用用 1分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的 ,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的称为列联表22列联表一般地,假设两个分类变量X和Y,它们的取值分别为和,其样本频数列联表(也称为22列联表)为下表.不同类别频数表x1,x2y1,y22.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否,常用等高条形图展示列联表数据的y1y2总计x1ababx2cdcd总计acbdabcd互相影响频率特征如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过a,否则就认为在不超过a的前提下不能推断“X与Y的关系”,或者在样本数据中支持结论“X与Y有关系”4在独立性检测中,当K2 时,有95%的把握说事件A与B有关;当K2 时;有99%的把握说事件A与B有关;当K2 时,认为kk0犯错误的概率没有发现足够证据3.8416.6353.841事件A与B是无关的思路方法与技巧例1在一项有关医疗保健的社会调查中,发现被调查的男性有530人,女性有670人,其中男性中喜欢吃甜食的有117人,而女性中喜欢吃甜食的有492人,试判断喜不喜欢吃甜食与性别有无关系题型一:利用三维柱形图或二维条形图判断两个分类变量是否有关系解析作列联表如下(单位:人):性别与喜欢吃甜食列联表画三维柱形图,如图喜欢吃甜食不喜欢吃甜食总计男117413530女492178670总计6095911200比较来说,主、副对角线上两个柱体高度的乘积差别较大,因而可以在某种程度上认为“喜不喜欢吃甜食与性别有关系”点评在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个分类变量有关系的可能性就越大作三维柱形图时,作图要精确,且比较易于观察,以便对结论的判断不出现偏差如图所示是根据调查人的性格与性别有无关系的相应数据画出的三维柱形图,由该三维柱形图可知,人的性格与性别_关系(填“有”或“没有”)变式:答案有点评由题图可知,主副对角线上两个柱体高度的乘积差别较大,因而人的性格与性别有关系例2下面22列联表的K2的值为_.答案1.780题型二:计算K2的值2将K2的数值与两个临界值3.841与6.635进行对比;做出统计推断:当根据具体的数据算出的K23.841时,有95%的把握说事件A与B有关;当K26.635时,有99%的把握说事件A与B有关;当K23.841时,认为事件A与B是无关的某防疫站对屠宰场及肉食零售点的猪肉检查沙门氏菌情况,结果如下表,试检验屠宰场与零售点猪肉带菌率有无差异.带菌头数不带菌头数合计屠宰场83240零售点141832合计225072变式:分析这是一个22列联表,可以用K2检验来检验屠宰场与零售点猪肉带菌率有无差异例3在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,通过图形判断色盲与性别是否有关利用独立性检验判断,是否能够以99.9%的把握认为“色盲与性别有关系”你所得到的结论在什么范围内有效?解析根据题目所给的数据作出如下的列联表(单位:名):题型三:独立性检验色盲与性别列联表根据列联表作出相应的二维条形图,如图所示色盲非色盲总计男38442480女6514520总计449561000点评本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断1利用图形来判断两个分类变量是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以粗略地判断两个分类变量是否有关系,可以结合所给的数值来进行比较作图应注意单位统一,图形准确,但它不能给我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算2当需要利用公式计算K2的观测值大小来对问题作出推断时,首先要牢记公式,再将经过准确运算后得到的结果与临界值进行比较,最后才能得出合乎情理的结论为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?变式3:分析由题目可获取以下主要信息:甲在生产现场和不在生产现场时,产品中的合格品和次品数量;共调查统计了1500件产品解答本题的关键是准确把握数据作出22列联表,然后具体分析解析(1)22列联表如下:由列联表可得|adbc|982174938|12750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”合格品数次品数合计甲在生产现场9828990甲不在生产现场49317510合计14752515001可以粗略地判断两个分类变量是否有关系的是()A散点图B三维柱形图和二维条形图C独立性检验的思想D以上都不对 答案B解析用三维柱形图和二维条形图可以粗略地判断两个分类变量是否有关系,但无法精确给出结论的可靠程度训练题:2下表是一个22列联表:则表中a,b处的值分别为()A94,96B52,50C52,54D54,52y1y2总计x1a2173x222527总计b46100答案C3对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()Ak越大,推断“X与Y有关系”,犯错误的概率越大Bk越小,推断“X与Y有关系”,犯错误的概率越大Ck越接近于0,推断“X与Y无关”,犯错误的概率越大Dk越大,推断“X与Y无关”,犯错误的概率越小答案B4利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定断言“X与Y有关系”的可信度,如果k5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过()A0.25 B0.75C0.025 D0.975答案C解析通过查表确定临界值k.当kk05.024时,推断“X与Y”有关系这种推断犯错误的概率不超过0.025.5如果K2的观测值k为8.654,可推断“X与Y有关”犯错误的概率不超过_答案0.005解析k8.6547.879,就推断“X与Y有关”犯错误的概率不超过0.005.独立性检验的基本思想及实施步骤独立性检验的基本思想课堂小结
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号