资源预览内容
第1页 / 共29页
第2页 / 共29页
第3页 / 共29页
第4页 / 共29页
第5页 / 共29页
第6页 / 共29页
第7页 / 共29页
第8页 / 共29页
第9页 / 共29页
第10页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
A5 - 均值檢定 (Means Testing),展示四種關於均值的假設檢定 單樣本 Z-檢定 (One Sample Z-test) 單樣本 t-檢定 (One Sample t-test) 雙樣本 t-檢定 (Two Sample t-test) 配對 t-檢定 (Paired t-test) 練習均值檢定,綠帶+,章節目的與用途,140,分析階段: 可能取得的成果,專案回顧和第一次課程其餘成果 確定變異來源: 探測性資料分析 應用工具: FMEA 和用 Excel操縱資料 圖表技巧 確定變異來源: 統計分析 信賴區間 假設檢定與樣本大小 中心趨勢 確定變異來源: 變異數分析 實驗設計( DOE)規劃 完成階段總結 結論, 問題和下階段任務,141,爲什麽檢定均值?,減少缺陷的三條腿: 改善設計 改善目標值 減少變異 對準中心目標是6 Sigma 的一個方向 識別均值的差別有助於確認造成變異的原因,還記得 Taguchi 的損失函數嗎?,142,檢定均值,檢定一個均值 如已知s,樣本較大,用 Z-檢定 如未知s,或樣本較小,用 t -檢定 檢定兩個均值 2-樣本 t-檢定 配對 t-檢定 檢定三個或多個均值 1-因數 變異數分析 後面的章節會介紹,Ho: m = m目標值 Ha: m m目標值 m m目標值 Ho: m1 = m2 Ha: m1 m2 m1 m2 Ho: m1 = m2= m3= m4 Ha:至少有 一個不同,mtarget,143,假設檢定 通用方法,陳述實際問題 選取適當樣本大小 (設定 和 )* 陳述虛無假設和對立假設 檢查資料是否符合前提假設 計算恰當的統計檢定參數 (並計算 p-值),從適當的統計分佈表查找臨界值 (對應 ) 如果檢定參數滿足決策規定條件 (或 p-值 a) 則拒絕 H0 由統計結論制定實際方案,對所有假設檢定適用的通用方法.,* 必須有適當的樣本大小.,144,均值檢定 用圖表解釋,一個製程以往的平均數是100, 標準差是 16 如每次取四個樣品, 其分佈曲線是怎樣的? (提示, 用CLT) 這種分佈的平均數和標準差各是多少?,從母體取得的樣本其平均數 大於或等於116的機率是多少?,116,2.5% 2s,100,一個新樣本的四個樣品的測量結果的 平均數是 116,這個過程如何簡化?,145,還記得平均數的信賴區間嗎?,建立均值的假設檢定基於相同的分佈曲線與信賴區間 信賴區間的公式是,重新安排公式就得到單一樣本Z-檢定的檢定參數公式,這就是在s 已知時計算均值檢定參數的公式 該公式告訴得到的Z值在曲線尾部的位置,信賴區間和假設檢定是互相關聯的!,(註:其中 Z calc為單一樣本),146,Z 統計,參數 是樣本平均數 s 是母體的已知標準差 m 是目標平均數 n 是樣本大小 前提假設 樣本由母體隨機選取 母體是常態分佈的 s母體 (母體標準差)已知,記住: 是得出錯誤結論的風險度.,a,147,舉例 單一均值與目標值,背景 一個公司爲審計其網球存貨的質量隨機選取了10 個球. 平均彈跳高度是19.8 吋. 過往資料的 = 20.1, = 0.5.問題: 網球存貨的彈跳性能是否已經下降?用 = 0.05. 陳述實際問題: 存貨母體彈跳高度是否低於過往值 ? 選擇合適樣本大小: 我們假設事先已作過 (很快會論及有關內容). 陳述虛無假設和對立假設 : Ho: 存貨 = 20.1 Ha: 存貨 資料是常態的,MeanExamples.mtw,148,單一均值檢定舉例 (續),計算適當檢定參數 由正確的決策法則, a 和分佈曲線查找臨界值 如計算的統計參數滿足決策法則條件, 則拒絕H0,這和 Z-值的區別是什麽?,149,你如何找到 Zcritical ?,Minitab 結果常態分配, 平均數 = 0 標準差 = 1.00P( X = x) x 0.0500 -1.6449,在Minitab中選 Calc Probability Distributions Normal,把統計結論轉化爲實際答案 網球存貨確實有彈跳性能下降的問題,由 第 5步,Zcritical,Zcalc-1.897,Zcalc Zcritical嗎?,150,Minitab中的 Z-檢定,打開Minitab 文件 MeanExamples.mtw. 網球資料在 C1欄. 選取 Stat Basic Statistics 1-sample Z,Ha,MeanExamples.mtw,m,spopulation,151,Minitab Z-檢定結果,顯著水準,什麼是顯著水準?,接受還是拒絕 Ho?,Z-Test (Z-檢定) Test of mu = 20.1 vs mu 20.1 (檢定均值=20.1 或 20.1) The assumed sigma = 0.5 (假設標準差=0.5) Variable N Mean StDev SE MeanTennisBalls 10 19.800 0.529 0.158 Variable 95.0% Upper Bound Z PTennisBalls 20.060 -1.90 0.029,152,練習 均值與目標值,某些本地農場相信今年的豆類作物收成特別好. 過去五年國內平均收成是520 甫式爾/英畝, 標準差是 117. 共抽取了36個農場的資料, 結果在MeanExamples.mtw內 今年的豆類作物收成特別好嗎? 用 a = .05.,必考!,153,Z-檢定練習答案,陳述實際問題 選取適當樣本大小. 陳述虛無假設與對立假設 檢定前提: 資料是否常態 確定適當統計檢定參數,由及適當的分佈曲線獲得臨界值 若計算的統計參數滿足決策法則條件, 則拒絕H0 把統計結論轉化成實際結論,今年的豆類作物收成確實特別好.,今年的豆類作物收成比平時好嗎?,P-值 = 0.248 資料是常態的,把這個方法用於所有假設檢定.,154,1-樣本 Z 練習 (1-Sample Z),用Minitab 對豆類資料(C3)進行 1-樣本 Z-檢定 你的結論如何?,Z-Test Test of mu = 520 vs mu 520The assumed sigma = 117 Variable N Mean StDev SE MeanSoybeans 36 570.3 116.7 19.5 Variable 95.0% Lower Bound Z PSoybeans 538.2 2.58 0.005,155,1-樣本 t-檢定(1-Sample t-test ) 若 spopulation 未知,參數 是樣本平均數 s 是樣本標準差 m 是目標平均數 n 是樣本大小 d.f. = 自由度 = n-1 前提假設 樣本由母體隨機抽取 母體符合常態分佈,156,練習 均值與目標值 (t-檢定 ),一位老師從參加一個新型試驗性數學課程的學生中對隨機選出的15個學生進行考試. 國內平時平均分數是 85.5. 新的數學課程得到的結果和標準課程的一樣嗎? 手工建立 1-樣本 t-檢定檢查該假設. 用 a = .05. 用Minitab 作 1-樣本 t-檢定檢查計算結果.資料在文件 MeanExamples.mtw中 (提示: Stat Basic Statistics 1-sample t),必考!,157,1-樣本 t-檢定練習答案,陳述實際問題 選取適當樣本大小. 陳述虛無假設和對立假設 4. 檢定前提: 資料是否常態 5. 確定適當統計檢定參數,由及適當的分佈曲線獲得臨界值 若計算的統計參數滿足決策規則條件, 則拒絕H0 把統計結論轉化成實際結論,新的數由雙邊檢定結果可知,新的數學課程得到的結果和標準課程無顯著區別,新的數學課程得到的結果和標準課程的一樣嗎?,P 值 = 0.632 資料是常態的,如用單邊檢定結果如何?,課堂85.5,課堂85.5,158,1-樣本 t-檢定(1-Sample t-test) Minitab 結果,Test of mu = 85.5 vs mu 85.5Variable N Mean StDev SE MeanMathScores 15 80.79 8.93 2.31 Variable 95.0% Upper Bound T PMathScores 84.86 -2.04 0.030,結論是什麼?,159,比較兩個平均數,分析的根本問題: “兩組間真的有區別嗎?”,2-樣本 t-檢定是檢查平均數是否不同的假設檢定,母體 1,母體 2,比較兩個平均數是最常見的假設檢定之一.,160,你怎樣爲標準差取“平均”?,標準差通過“均方根”得到平均數而非用算術平均獲得 標準差取平均數的過程包括對變異數進行加權平均並開平方根. 對兩個母體:,如n1 = n2會怎樣?,161,2-樣本 t-檢定 統計參數,參數 , 是樣本平均數 s 是綜合樣本標準差. n1, n2 是樣本大小 d.f. = (n1-1)+(n2-1) 前提 樣本随機取自獨立的母體 母體屬於變異數相同的常態分佈,小心! 正確計算d.f.!,162,練習 2-樣本 t-檢定 (2-Sample t-test),一間金屬加工公司需要減少其排放廢水中的B.O.D(生物氧需求量)含量. 用於廢水處理的活化泥供應商建議用純氧取代空氣吹入活化泥以改善BOD. 從兩種處理的廢水中抽取了十個樣品, 資料錄入了Minitab文件 MeanExamples.xls的c9-c10欄. 該公司是否應改用更昂貴的氧氣減少B.O.D.? 手工建立2-樣本 t-檢定檢查該假設. 用 a = .05. 用Minitab進行2-樣本 t-檢定以檢查結果. (提示: Stat Basic Statistics 2-sample t),必考!,163,2-樣本 t-檢定 (2-Sample t-test)練習答案,陳述實際問題 選取適當樣本大小. 陳述虛無假設和對立假設 檢定前提: 資料是否常態 確定適當統計檢定參數,由 及適當的分佈曲線獲得臨界值 若計算的統計參數滿足決策規則條件, 則拒絕H0 把統計結論轉化成實際結論,吹氧氣取代吹空氣沒有顯著減少BOD 不值得額外開支.,用氧氣是否比用空氣産生較少的BOD?,P-值: 0.465, 0.369 資料是常態的變異數齊性: p-值 = 0.741,2-樣本 t-檢定評估變化是否有效.,氧氣 空氣,氧氣空氣,164,2-樣本 t-檢定(2-Sample t-test) Minitab 結果,Two Sample T-Test and Confidence Interval(2樣本T-檢定及信賴區間) Two sample T for Oxygen vs Air N Mean StDev SE Mean Oxygen 10 177.0 18.8 6.0 Air 10 184.8 21.1 6.7 Difference = mu Oxygen - mu Air(差别=mu氧氣-mu空氣) Estimate for difference: -7.80(差别估計值: -7.80) 95% upper bound for difference: 7.71(差别的95%上端邊界:7.71) T-Test of difference = 0 (vs ): T-Value = -0.87 P-Value = 0.197 DF = 18 Both use Pooled StDev = 20.0(差别的T-檢定=0(對應0): T-值=-0.87 P-值=0.197 DF=18. 二组都用綜合變異數 = 20.0),165,分配曲線的前提假設是怎樣的?,前提:各母體服從常態分配且變
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号