资源预览内容
第1页 / 共31页
第2页 / 共31页
第3页 / 共31页
第4页 / 共31页
第5页 / 共31页
第6页 / 共31页
第7页 / 共31页
第8页 / 共31页
第9页 / 共31页
第10页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
假设检验 第一节假设检验的基本问题第二节总体均值的检验 第一节假设检验的基本问题 假设检验是抽样推断的另一项重要内容 它与参数估计类似 但二者的分析角度不同 参数估计是利用样本信息推断未知的总体参数 而假设检验则是先对总体参数提出一个假设值 然后利用样本信息判断这一假设是否成立 一 假设的陈述 一 假设的概念1 对总体参数的具体数值数值所作的陈述 称为假设 或称为统计假设 2 备择假设 通常将研究者想收集证据予以支持的假设称为备择假设 或称为研究假设 用H1表示 3 原假设 通常将研究者想收集证据予以反对的假设称为原假设 或零假设 用H0表示 二 假设的建立方法例1 一种零件的生产标准是直径为10cm 为对生产过程进行控制 质量监测人员定期对一台加工机床进行检查 以确定这台机床生产的零件是否符合标准要求 如果零件的平均直径大于或小于10cm 则表明生产过程不正常 必须进行调整 试陈述原假设和备择假设 解 设这台机床生产的所有零件平均直径的真值为 如果 10 表明生产过程正常 如果 10 都表明机床的生产过程不正常 我们需要检测这两种情况中的任何一种 根据原假设和备择假设的定义 研究者想收集证据予以证明的假设应是 生产过程不正常 所以H0 10 生产过程正常 H1 10 生产过程不正常 例2 某品牌洗涤剂中产品说明书中声称 平均净含量不少于500g 从消费者的利益出发 有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实 试陈述原假设和备择假设 解 H0 500 净含量符合说明书 H1 500 净含量不符合说明书 例3 一家研究机构估计 某城市中家庭拥有汽车的比例超过30 为验证这一估计是否正确 该机构随机抽取了一个样本进行检验 试陈述原假设和备择假设 解 H0 p 30 家庭拥有汽车比例不超过30 H1 p 30 家庭拥有汽车比例超过30 建立假设的应注意的问题 1 原假设和备择假设是一个完备事件组 而且相互对立 这就意味着 在一项假设检验中 原假设和备择假设必有一个成立 而且只有一个成立 2 在建立假设时 通常先确定备择假设 然后再确定原假设 3 在假设检验中 等号总是放在原假设上 将等号放在原假设上是因为原假设的内容总是表示参数没有差异或没有改变 或变量间没有关系等 假设检验的惯例是在原假设中只写 所以例2 3中的原假设都可以用 4 根据原假设和备择假设的定义 可知他们是具有主观色彩的 因此 对于同一个实际问题 不同的研究者有相反的假设是完全正常的 不管研究者怎样确定假设的形式 只要它们符合研究者的最终目的 便是合理的 5 假设检验的目的主要是收集证据拒绝 假设检验得出的统计结论都是根据原假设进行阐述的 我们要么拒绝原假设 要么不拒绝原假设 当不能拒绝原假设时 我们也不说 接受原假设 因为此时我们并未证实原假设是真的 二 假设检验的三种基本形式1 备择假设具有特定的方向性 并含有 的假设检验 称为单侧检验或单尾检验 如果研究者感兴趣的备择假设的方向为 右侧检验 2 备择假设没有特定的方向性 并含有符合 的假设检验 称为双侧检验或双尾检验 假设检验的基本形式 三 两类错误与显著性水平1 当原假设正确时拒绝原假设 所犯的错误称为第 类错误 又称为弃真错误 犯第 类错误的概率通常记为 2 当原假设错误时没有拒绝原假设 所犯的错误称为第 类错误 又称为取伪错误 犯第 类错误的概率通常记为 假设检验的结论与后果 3 发生第 类错误的概率也常用于检验结论的可靠性度量 显著性水平 假设检验中发生第 类错误的概率 称为显著性水平 记为 1 显著性水平是人们事先指定的犯第 类错误概率 的最大允许值 2 一般情况下 人们认为犯第 类错误的后果更严重一些 因此通常会取一个较小的 值 作为一个普遍适用的原则 人们通常选择显著性水平为0 05或者更小的概率 英国 罗纳德 费希尔 3 在事先给定的显著性水平下 如样本提供的证据拒绝原假设 我们称检验的结果是显著的 显著的 拒绝原假设 意味着通过样本数据分析的结果不是偶然得到的 如果不拒绝原假设 称检验的结果是不显著的 表明这样的样本结果是偶然得到的 没有充分的证据拒绝原假设 4 确定了显著性水平就等于控制了犯第 类错误的概率 但是犯第 类错误的概率却是不确定的 因此 我们在假设检验中采用 不拒绝原假设 而不采用 接受原假设 的表述 四 检验统计量与拒绝域1 检验统计量 根据样本观测结果计算得到的 并据以对原假设和备择假设做出决策的某个样本统计量 称为检验统计量 对于总体均值检验 检验统计量可以表示为 2 拒绝 区 域 能够拒绝原假设的检验统计量的所有可能取值的集合 称为拒绝域 拒绝域就是由显著性水平 所围成的区域 如果利用样本观测结果计算的检验统计量的具体数值落在了拒绝域内 就拒绝原假设 否则就不拒绝原假设 3 临界值 根据给定的显著性水平确定的拒绝域的边界值 称为临界值 将检验统计量的值与临界值进行比较 就可以做出拒绝或不拒绝原假设的决策 1 双侧检验 统计量的值 临界值 拒绝原假设 2 左侧检验 统计量的值 临界值 拒绝原假设 3 右侧检验 统计量的值 临界值 拒绝原假设 五 假设检验的步骤1 陈述原假设H0和备择假设H12 从所研究的总体中抽出一个随机样本 3 确定一个适当的检验统计量 并利用样本数据算出其具体数值 4 确定一个适当的显著性水平 并计算其临界值 同时制定拒绝域 5 将统计量的值与临界值进行比较 并做出决策 若统计量的值落在拒绝域内 拒绝原假设 否则不拒绝原假设 第二节总体均值的检验 1 总体是否服从正态分布2 总体方差是否已知3 样本是否为大样本注 本章内容都假定总体服从正态分布 一 总体均值的检验 一 总体方差已知 例 一种罐装饮料采用自动生产线生产 每罐的容量是225ml 标准差为5ml 为检验每罐容量是否符合要求 质检人员在某天生产的饮料中随机抽取40罐进行检验 测得每罐平均容量为255 8ml 取显著水平 0 05 检验该天生产的饮料容量是否符合标准要求 二 总体方差未知 例如 一种汽车配件的平均长度要求为12cm 高于或低于被认为是不合格的 汽车生产企业在购进配件时 通常是通过招标 然后对中标的配件提供商提供的样品进行检验 以决定是否采购 某汽车生产企业对一个配件提供商提供的10个样本进行了检验 其结果如下 单位 cm 12 210 812 011 811 912 411 312 212 012 3假定该供货商生产的配件长度服从正态分布 那么在0 05的显著性水平下 检验该供货商提供的配件是否符合要求 本章要求 1 了解假设检验的三种基本形式2 掌握两类错误 显著性水平的含义3 掌握总体均值假设检验的计算方法
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号