资源预览内容
第1页 / 共36页
第2页 / 共36页
第3页 / 共36页
第4页 / 共36页
第5页 / 共36页
第6页 / 共36页
第7页 / 共36页
第8页 / 共36页
第9页 / 共36页
第10页 / 共36页
亲,该文档总共36页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
DOE(实验设计)Cherry2018.09.15Contents目录0101假设检验假设检验02DOEDOE实验设计实验设计011原假设H0 :=2000kg;备择假设H1: 2000kg;在假设H0是成立的条件下,与大概率事件相比,小概率事件在一次试验中几乎不会发生,如果发生,则H0成立是不正确的,拒绝H0。小概率事件小概率事件21.1假设检验的基本原理及方法Question:配方药物的疗效是否比原配方药物疗效好?采取措施后合格率是否提高?Answer :先把某个结论当成一种假设,根据样品的观察值的情况,运用统计分析的方法对假设进行检验,并做出判断。Example:生产线的钢筋平均抗拉强度为2000kg,标准差为300kg,调整参数后,希望钢筋平均抗拉强度有所提高。项目团队实施改进后抽取了25批钢筋,测得平均抗拉强度为2150kg,问:能否断言平均抗拉强度有提高?先假定H0为真,若经过分析结果与H0矛盾,拒绝H0。1.2假设检验的基本步骤54321建立假设H0 := 0,H1: 0(单边假设)H0 := 0,H1: 0(单边假设)H0 := 0,H1: 0(双边假设)根据样本观察值,计算检验统计量的值并进行判断给出临界值,确定拒绝域给出检验中的显著性水平选择检验统计量,确定拒绝域的形式步骤步骤1.2.1建立假设建立假设假设检验根据实际的需要可以分为假设检验根据实际的需要可以分为 :双侧检验(双尾)双侧检验(双尾): 指只强调差异而不强调方向性的检验。指只强调差异而不强调方向性的检验。单侧检验(单尾)单侧检验(单尾):强调某一方向性的检验。:强调某一方向性的检验。 左侧检验左侧检验 右侧检验右侧检验1.2.2选择检验统计量,确定拒绝域的形式选择检验统计量,确定拒绝域的形式01总体均值进行检验用样本均值引出检验统计量正态总体的方差进行检验用样本方差引出检验统计量02根据检验统计量的值,我们把整个样本空间分成两部分:拒绝域W与接受域A确定单边和双边确定临界值C允许犯第一类错误的概率确定1.2.3给出检验中的显著性水平给出检验中的显著性水平v假设检验假设检验是依据样本提供的信息进行推断的是依据样本提供的信息进行推断的,即由部分来推断总体即由部分来推断总体,因因而假设检验不可能绝对准确而假设检验不可能绝对准确,是可能犯错误的。是可能犯错误的。 两类错误:两类错误:v 错误错误(I型错误型错误): H0为真时却被拒绝为真时却被拒绝,弃真错误弃真错误;v 错误错误(II型错误型错误): H0为假时却被接受为假时却被接受,取伪错误。取伪错误。 假设检验中各种可能结果的概率:假设检验中各种可能结果的概率: H0成立成立H1成立成立不拒绝不拒绝H0结论正确(概率为结论正确(概率为1-)第二类错误(概率为第二类错误(概率为)拒绝拒绝H0第一类错误(概率为第一类错误(概率为)结论正确(概率为结论正确(概率为1-)总体情况判断结论1.2.4给出临界值,确定拒绝域给出临界值,确定拒绝域有了显著性水平 后,可以根据给定的检验统计量的分布,计算或查表得到临界值,从而确定具体的拒绝域。1.2.5根据样本观察值,计算检验统计量的值并进行判断计算出检验统计量的观测值,将它与临界值进行比较当它落在拒绝域中就作出拒绝原假设的结论,否则就作出无法拒绝原假设的结论。计算总体参数的置信区间,然后看置信区间是否包含了原假设值,如果原假设值未被包含在内,则拒绝原假设,反之,则不能拒绝原假设。p 值:指的就是当原假设Ho 成立时,出现目前状况的概率。P0.05,拒绝原假设,接受备择假设。反之,不能拒绝原假设Ho 。 计算检验统计量的值并进行判断计算检验统计量的值并进行判断P值比较法值比较法临界值法临界值法置信区间法置信区间法生产线的钢筋平均抗拉强度为2000kg,标准差为300kg,调整参数后,希望钢筋平均抗拉强度有所提高。项目团队实施改进后抽取了25批钢筋,测得平均抗拉强度为2150kg,问:能否断言平均抗拉强度有提高?举例子解:设立原假设和备择假设H0=2000kg;H12000kg;方法1:计算统计量: Z=(2150-2000)/(300/25)=2.50Z1.645(查表得知拒绝域),故拒绝H0;方法2:用minitab软件,计算P为0.006,小于 0.05,则拒绝H0;方法3:置信区间:在本题中,样本均值为2150,总体均值可能稍大或稍小些,但我们可以有95%置信下限,总体均值上限是无穷的,因为原假设的均值2000比2051.3还小,并未落入此置信区间内,拒绝原假设。02DOE:DOE:即实实验验设设计计( (D Design esign o of f E Experimental)-xperimental)-是对实验方案进行优化设计、以降低实验误差和生产费用,减少实验工作量并对实验结果进行科学分析的一种科学研究方法;是一种藉用实验的手段来决定最佳设计或生产的方法。Doe目的:分析出“哪些自变量X显着地影响着Y,这些自变量X取什么值时将会使Y达到最佳值”。2.1 DOE的定义的定义2.2.1基本术语基本术语响应响应Y过程x1x2x3u1u2y1y2y3我们假定过程的结果当中,我们假定过程的结果当中,y1y1,y2y2,y3y3是我们关心的是我们关心的输出变量输出变量,这些我们常常称之为,这些我们常常称之为响应(响应(responseresponse)2.2.1基本术语基本术语可控因子可控因子 X我们将我们将影响响应的那些变量影响响应的那些变量称为实验问题中的因子。其中称为实验问题中的因子。其中x1,x2,x3x1,x2,x3是人们在实验中可以控制的因子,我们称为是人们在实验中可以控制的因子,我们称为可控可控因子(因子(controlled factorcontrolled factor)过程x1x2x3u1u2y1y2y3可控因子是输入变量,是影响过程最终结果的可控因子是输入变量,是影响过程最终结果的2.2.1基本术语基本术语不不可控因子可控因子ul在影响过程和结果的因子中除了控制因子还包括一些不不可控因子(可控因子(uncontrolled factoruncontrolled factor):u1,u2,他们通常包括环境环境、操作员操作员、材料批次等材料批次等,对于这些变量我们通常很难把它们控制在某个精确值上,常把它们当作试验误试验误差差来处理。过程x1x2x3u1u2y1y2y3不可控因子不可控因子-噪音噪音U2.2.1基本术语:基本术语:模型与误差模型与误差模型与误差模型与误差:在试验设计中建立的数学模型数学模型是Y = f(X1,X2, ,Xk) + f:是某个确定的函数关系,为试验误差。希望找到使响应变量Y达到最优的条件。工作中常有三种不同特性要求:望目望目特性特性:此特性具有一特定的目标值(愈近目标值愈好愈近目标值愈好),例如尺寸、换档压力、 间隙、粘度等。望小望小特性特性:目标的极端值是(值愈小愈好值愈小愈好),例如磨耗、收缩、劣化、杂音水准等望大望大特性特性:目标值为无限大(值愈大愈好值愈大愈好),例如强度、寿命、燃料效率等。2.2.1基本术语基本术语水平和处理水平和处理为了研究因子对响应的影响,需要用到因子的两为了研究因子对响应的影响,需要用到因子的两个或者更多不同的取值,这些取值称为个或者更多不同的取值,这些取值称为因子的水因子的水平(平(levellevel)。)。各因子选定了各自的水平之后,其组合被称为一各因子选定了各自的水平之后,其组合被称为一个个处理(处理(treatmenttreatment)或者或者一次实验(一次实验(trailtrail)200rpm230rpm转速转速level1level22.2.1基本术语基本术语主效应主效应举一个例子:在合成氨生产中,考虑两个因子,每个因子2水平,A:温度,低水平,700;高水平:720。B:压力,低水压:1200Pa,高水平:1250Pa,以产量y为响应变量(kg),列表如下:(表1) 低温低温高温高温低压低压200(kg)220(kg)高压高压230(kg)250(kg)A(温度)B(压力)表表1.可加模型数据表可加模型数据表(只有主效应而不考虑交互效应的模型)1.A(低水平)产量平均值(不考虑B因子):(200+230)/2=215kg A(高水平)产量平均值(不考虑B因子):(220+250)/2=235kg 产量由215kg提高到235kg,完全因为A因子,称因子A的主效应为:235-215=20kg 同理计算出B的主效应为:30kg;2.发现:当B为高压,A的效应:250-230=20kg;当B为低压,A的效应:220-200=20kg如果以因子A为横轴,以响应变量(产量)为纵坐标,使用Minitab作图,见图1图1 无交互作用的效应图从图1可以看出:两条线平行2.2.1基本术语基本术语交互作用交互作用如果数据变成另外一组,见表2 低温低温高温高温低压低压200(kg)220(kg)高压高压230(kg)270(kg)表表2.有交互作用的数据表有交互作用的数据表1.A(低水平)产量平均值(不考虑B因子):(200+230)/2=215kg A(高水平)产量平均值(不考虑B因子):(220+270)/2=245kg 产量由215kg提高到235kg,完全因为A因子,称因子A的主效应为:245-215=30kg 同理计算出B的主效应为:40kg;2.发现:当B为高压,A的效应:270-230=40kg;当B为低压,A的效应:220-200=20kg 同样在B不同状态下,A因子的效应变化量不同,所以因子A和因子B之间存在交互作用。如果以因子A为横轴,以响应变量(产量)为纵坐标,使用Minitab作图,见图2图2 有交互作用的效应图从图2可以看出:两条线不平行。定义两个因子间的交互作用为:如果因子A的效应依赖于因子B所处的水平时,则称A与B之间有交互作用。注意:如果两个因子间存在着显著的交互作用时,应该将主效应和交互效应结合在一起考虑。A AB BC CD D对照对照随机化随机化随机化的含义是以完全随机的方式安排各次试验的顺序或所用试验单元。对照是比较的基础,对照原则是主要用于比较实验的一个原则。空白对照、安慰剂对照、实验条件对照、标准对照、历史或中外对照。完全重复完全重复在相同的处理条件下对不同的实验单元做多次实验。区组化区组化区组因素也是影响实验指标的因素,但并不是实验者所要考察的因素,也称为非处理因素。2.1.2实验设计原则实验设计原则2.1.3试验设计试验设计的策划与安排的策划与安排2134用部分因子设计进行因子的筛选用部分因子设计进行因子的筛选:考虑到影响响应变量的因子个数可能较多(大于或等于5),所以先进行因子的筛选用全因子试验设计法全因子试验设计法对因子效应和交互作用进行全面的分析:当因子的个数被筛选到少于等于5 个之后,可以进一步在稍小范围内进行全因子试验设计以获得全部因子效应和交互作用的准确信息,并进一步筛选因子直到因子个数不超过3 个。用响应曲面方法响应曲面方法(RSM) 确定回归关系并求出最优设置:这种方法通常只对望大或望小特性的响应变量特别有效用稳健参数设计方法(田口设计田口设计)寻求望目特性的最优设置:为了寻求望目特性响应的最优解,则最好采用稳健参数设计方法。虽然试验次数比RSM 稍多些,但此种方法很有效。1.陈述实际问题和实验目的陈述实际问题和实验目的2.2.选择选择选择选择“ “Y Y” ”响应变量响应变量响应变量响应变量3.3.陈述因子和水平陈述因子和水平陈述因子和水平陈述因子和水平4.4.选择选择选择选择DOEDOE5.5.实施实验及收集数据实施实验及收集数据实施实验及收集数据实施实验及收集数据6.6.分析实验结果分析实验结果分析实验结果分析实验结果7.7.结论和计划结论和计划结论和计划结论和计划通过通过DOE 想想达达到到什么目的什么目的? Y是什么?计量型?计数型?是什么?计量型?计数型?如产出率如产出率, 作业时间作业时间, 清洁度等清洁度等 如温度如温度(100,150),重量重量(20,30,40kg) 全因子全因子实验, 田口田口设计, 2K因子因子实验或或响响应曲面曲面设计等等 收集收集实验结果的果的数数据据 运运用用Minitab等等软件件进行行实验数数据分析据分析制定改善方案制定改善方案 2.1.4试验设计试验设计的基本步骤的基本步骤必要时重复实验必要时重复实验2.1.4.12.1.4.1选择选择DOEDOE设计实验设计实验-确定实验设计方法确定实验设计方法筛选实验筛选实验6 6以上以上部分因子实验部分因子实验410410全因子全因子实验实验1515田口田口设计设计221 13 3DOE DOE 种类种类因子数量因子数量选别重要因子选别重要因子选别重要因子选别重要因子因子与因子与Y Y的关系的关系寻找因子的寻找因子的最佳条件组合最佳条件组合目的目的区区分主效果分主效果主效果和主效果和部分交互作用部分交互作用所有主效果和所有主效果和交互作用交互作用( (线性效果)线性效果)设计或工序或工序参数参数优化化作用作用低低现在现在工序知识工序知识状态状态高高响应曲面实验响应曲面实验2323设定因子的设定因子的最佳条件最佳条件反应变量的反应变量的预测模型预测模型( (曲线效果)曲线效果)效果效果陈述问题和实验目的陈述问题和实验目的选择选择“Y”响应变量响应变量陈述因子和水平陈述因子和水平选择选择DOE实施实验及收集数据实施实验及收集数据6.分析实验结果分析实验结果结论和计划结论和计划2.1.4.2分析实验结果分析实验结果1.为整个模型建立方差分析表 统计DOE因子分析因子设计简化模型(去除不显著的项或平方和影响低的项)2.进行残值诊断,保证模型适合 统计回归回归3.研究显著的交互作用(P-值DOE因子因子图 统计方差分析交互作用图4.研究显著的主效果(P-值DOE因子因子图 统计方差分析交互作用图5.陈述获得的数学模型Y=f(X),计算%SS的影响和评估实际的重要性2.1.4.2分析实验结果分析实验结果进行残差诊断,进行残差诊断,保证模型适合保证模型适合 四合一图的判断方法:四合一图的判断方法:1)正态概率图正态概率图:观察残差的正态性检验图:是否符合正态分布.2)残差残差与拟合值与拟合值图:图:观察残差对于以各自变量为横轴的散点图:是否有弯曲趋势。3)直方图直方图:观察残差对于以响应变量拟合预测值为横轴的散点图:等方差性,即是否 有“漏斗型”或“喇叭型”。4)残差残差与顺序与顺序图图:观察残差对于以观测值顺序为横轴的散点图:是否随机波动。需回答的问题:需回答的问题: Y是否存在改善迹象? 实验结果是否具有统计显著性? 实验结果是否具有实际显著性? 我们是否需要运行附加实验? 重新验证实验,实验结果能够再现吗? 以后应该如何应用实验结果控制该工程?总结与计划:总结与计划: 利用所有已知的情报解释实验结果 设定对输出变量的预测模型并决定最佳因子水平 追加实验确认结论 (再现性实验) 没有得到较好的结果应制定对策(必要的话实施追加实验) 将模型转换为真实的流程设置,下结论 对结论和改善方案制作成报告书 提议复制最佳状态,计划下一步实验并将变化制度化。7.结论和计划结论和计划陈述问题和实验目的陈述问题和实验目的选择选择”Y”响应变量响应变量陈述因子和水平陈述因子和水平选择选择DOE实施实验及收集数据实施实验及收集数据分析实验结果分析实验结果2.1.4.3分析实验结果分析实验结果结论和计划结论和计划2.2 2.2 单因子试验单因子试验1.比较因子的几个不同设置间是否有显著差异,如果有显著差异,哪个或哪些设置较好;2.建立响应变量与自变量间的回归关系(线性、二次或三次多项式);例子:在焊接工序中希望比较4种不同烘烤时间所得到的拉拔力是否相等。将20个焊件用随机序编号顺序号,再采用随机抽取的方法,让4种时间下各选用5个焊件,获得数据表如下A.完全重复:每种条件下进行5次试验; B.随机化:每组样品的分配和试验顺序完全随机化; C.区组化:如果有不同的型号,要分区组(本例不涉及);时间(s)55.566.5焊件186.594.389.686.4焊件29293.394.287.9焊件385.29290.890.6焊件487.989.892.784.5焊件58692.590.988.4表3 单因子试验设计拉拔力数据表分析:等方差性检验的P值为0.7980.05,无法拒绝原假设,可以认为四组数据的方差相等。2.2.12.2.1目的一:各条件下的平均值是否有显著差异?目的一:各条件下的平均值是否有显著差异?-单因子单因子ANOVA ANOVA 1、验证数据的正态性和等方差性(原假设):2、进行方差分析,检验各总体均值是否存在差异方差分析结果显示的P值为0.0030.05,可以认为不同焊接时间之间的拉拔力有显著差异。2.2.2 2.2.2 目的二:建立响应变量与因子间的回归关系目的二:建立响应变量与因子间的回归关系-回归分析回归分析从线性回归模型的拟合图和残差图可以看出,有明显的弯曲趋势。因为自变量取值达到了3个以上,因此可以拟合二次函数。在回归模型类型中选择“二次”。对回归结果进行分析:回归方程的P值0.001,方程有效;残差图无异常。回归方程:Y=-202.3+102.7X-8.940X*2由二次方程的特点可知,该方程的输出Y在 X=-102.7/2*(-8.940)=5.7时达到最大值92.63谢谢大家
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号