session13假设检验-－金锄头文库

Data, Model and Decisions 数据、模型与决策,Session 13 Hypothesis Testing 假设检验,Hypothesis Testing Methodology 假设检验思想 Z Test for the Mean (s Known) s已知的均值的Z检验 t Test of Hypothesis for the Mean 均值的T检验 Z Test of Hypothesis for the Proportion 比例的Z检验,Session Topics,Z Test for the Difference in Two Means 两个总体均值区别的Z检验 t Test for Difference in Two Means 两个总体均值区别的T 检验 F Test for Difference in two Variances 两个总体方差的F检验 t Tests for the Mean：Two Related Samples 两个相关样本的均值的T检验,Session Topics,假设（hypothesis）是对总体参数（assumption）的一个假定. 参数是总体的均值或比例参数必须在分析前已经确定,我假设班级中大家的平均成绩为B !,What is a Hypothesis? 什么是假设？,原假设是陈述将要检验的假设例如：我国平均每个家庭至少拥有3个小孩 (H0: m 3) 开始时假设原假设是正确的（TRUE）. 与在被证明有罪前是清白的模式相似（ innocent until proven guilty),The Null Hypothesis H0 原假设 H0,指的是现状（Status Quo）总是含有 “ = ” 符号原假设可能会被否决的.,备择假设是原假设的相反的假设例如：我国平均每个家庭最多拥有2个小孩(H1: m 3) 是对现状的挑战从不包含“=”符号备择假设不一定会被接受,The Alternative Hypothesis, H1 备择假设，H1,步骤: 陈述原假设 (H0: m 3) 陈述备择假设 (H1: m 3) 假设是互斥和穷尽的（mutually exclusive & exhaustive）有时先形成备择假设比较容易.,Identify the Problem 确定问题,Types of Hypothesis 假设的类型,H0: m m 0 H1: m m 0,H0: m m 0 H1: m m 0,H0: m = m 0 H1: m m 0,Hypothesis Testing Process 假设检验过程,Reason for Rejecting H0 拒绝 H0 的理由,定义原假设为真而样本统计值不能够表明称为抽样分布的拒绝区域让 a 来表示原假设为真时拒绝了原假设的概率典型的值是 0.01, 0.05, 0.10 研究一开始是有研究者确定的提供了假设检验的关键数值,Level of Significance, a 置信水平 a,Level of Significance&Rejection Region 置信水平和拒绝域,a,第一类错误（Type I Error）原假设为真而拒绝了它会产生很严重的后果第一类错误记为 a，称为置信水平第二类错误（Type II Error）原假设为假时却接受了它第二类错误的概率记为 b,Errors in Making Decisions 决策的错误,Result Possibilities 结果的各种可能性,Relationship Between a & b a & b 间的联系,总体参数的真正值置信水平 a 总体标准方差 s 样本量 n,Factors Affecting Type II Error, b 影响第二类错误的因素,1. 陈述 H0 H0 : m 3 2. 陈述 H1 H1 : m 3 3. 选择 a a = .05 4. 选择 n n = 100 5. 选择检验：各种检验,Hypothesis Testing: Steps 假设检验的步骤,假设检验的步骤：,6. 设定关键值 Z = -1.645 7. 收集数据 100 的家庭调查 8. 计算检验统计量 Test Stat.= -2 9. 做统计决策拒绝原假设 10. 表述决策视各种背景问题,Hypothesis Testing: Steps 假设检验的步骤,假设总体服从正态分布如果不是正态分布，使用大样本近似原假设是 = 或 = Z 检验统计量:,One-Tail Z Test for Mean (s Known) 均值的单边Z检验（ s已知）,Rejection Region 拒绝域,平均每箱包含大于等于 368 克吗?一个25个样本的随机抽样表明 X = 372.5. 公司确定标准方差 s 为15 克. 置信水平 a=0.05 下进行假设检验.,368 gm.,Example: One Tail Test 单边检验举例,H0: m 368 H1: m 368,_,实际举例,Finding Critical Values 找关键值,实际举例,a = 0.025 n = 25 关键值: 1.645,检验统计量: 决策: 结论:,a = .05 下，不拒绝,均值大于 368不明显,Z,0,1.645,.05,拒绝,H0: m 368 H1: m 368,Example: One Tail Test 单边检验举例,实际举例,368 gm.,Example: Two Tail Test 双边检验举例,H0: m = 368 H1: m 368,平均每箱包含 368 克吗? 一个25个样本的随机抽样表明 X = 372.5. 公司确定标准方差 s 为15 克. 置信水平 a=0.05 下进行假设检验.,实际举例,a = 0.05 n = 25 关键值: 1.96,检验统计量: 决策: 结论:,a = .05下，不拒绝,均值不是 368不明显,Z,0,1.96,.025,拒绝,-1.96,.025,H0: m = 386 H1: m 386,Example: Two Tail Test 双边检验举例,实际举例,假设总体服从正态分布如果不是正态分布，使用大样本近似检验统计量 t 检验统计量,t-Test: s Unknown t检验（ s未知）,368 gm.,H0: m 368 H1: m 368,s未知,Example: One Tail t-Test 单边t-检验举例,平均每箱包含大于等于 368 克吗?一个36个样本的随机抽样表明样本均值X = 372.5. 样本标准方差 s 为15 克. 置信水平 a=0.01 下进行假设检验.,实际举例,a = 0.01 n = 36, df = 35 关键值: 2.4377,检验统计量: 决策: 结论:,a = .01下，不拒绝,均值大于 368不明显,Z,0,2.4377,.01,拒绝,H0: m 368 H1: m 368,Example: One Tail t-Test 单边t-检验举例,实际举例,包含分类变量（categorical variables）其中一类的比例% 如果是两类结果服从二项分布抽样比例 (ps),Test Proportions 比例检验,Example:Z Test for Proportion 比例检验举例,问题: 一市场调研公司声称收到了 4%的有效邮件回收. 方法: 为了检验此声称，随机抽样500封邮件有25封有效回信. 求解: 在 a = .05 的置信水平下进行检验.,a = .05 n = 500,a = .05下不拒绝,H0: p = .04 H1: p .04,关键值: 1.96,检验统计量:,决策:,结论:,没有足够的证据证明原假设不成立,Z,0,拒绝,拒绝,.025,.025,Example:Z Test for Proportion 比例检验举例,实际举例,假设: 样本是独立和随机抽取的数据是数值型的总体方差已知样本量比较大（大于30）检验统计量:,Z Test Two Means (Variances Known) 方差已知的两均值差的Z检验,假设: 总体都服从正态分布如果不是正态分布，可以用正态分布近似样本是随机和独立抽取总体方差未知，但是假定相等,Z Test Two Means (Variances Unknown) 方差未知的两均值差的Z检验,设定假设:,Z Test Two Means (Variances Unknown) 方差未知的两均值差的Z检验,计算混合样本方差估计共同方差：,= 混合样本方差,= 样本1方差,= 样本2方差,= 样本 1 大小,= 样本 2 大小,Z Test Two Means (Variances Unknown) 方差未知的两均值差的Z检验,计算样本统计量:,Z Test Two Means (Variances Unknown) 方差未知的两均值差的Z检验,F Test in Two Variances 两方差的F检验,假设 H0: s12 = s22 H1: s12 s22 检验统计量 F = S12 /S22 自由度 df1 = n1 - 1; df2 = n2 - 1 关键值: FL( ) FU( ) FL = 1/FU*,n1 -1, n2 -1,n1 -1 , n2 -1,F Test in Two Variances 两方差的F检验,F Test: One Tail 单边F检验,检验两个相关总体的均值对比或匹配（Paired or Matched）重复度量的 (Before/After) 假设两个总体都服从正态分布如果不是正态分布，使用大样本近似,T-test for Mean :Two Related Samples 两个相关样本的均值T检验,在新旧软件下操作工人的操作时间的比较,Paired Sample t Test: Example 配对样本t检验举例,User Current Leader (1) New Software (2) Difference Di C.B. 9.98 Seconds 9.88 Seconds .10 T.F. 9.88 9.86 .02 M.H. 9.84 9.75 .09 R.K. 9.99 9.80 .19 M.O. 9.94 9.87 .07 D.S. 9.84 9.84 .00 S.S. 9.86 9.87 - .01 C.T. 10.12 9.86 .26 K.T. 9.90 9.83 .07 S.Z. 9.91 9.86 .05,实际举例,新的软件好吗 ( 0.05的置信水平 ) ?,.084,D =,H0: mD 0 H1: mD 0,a =.05,检验统计量,关键值=1.8331 df = n - 1 = 9,拒绝,a =.05,1.8331,决策: 拒绝 H0,结论: 新软件好.,Paired Sample t