资源预览内容
第1页 / 共110页
第2页 / 共110页
第3页 / 共110页
第4页 / 共110页
第5页 / 共110页
第6页 / 共110页
第7页 / 共110页
第8页 / 共110页
第9页 / 共110页
第10页 / 共110页
亲,该文档总共110页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
10 - 1统计学统计学第第 10 章章 方差分析与试验设计方差分析与试验设计作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学引后索怎婴谬侈游合幻葱捞脂腰丢瓤境季廓腕矢逝埠效朴冶付土祈哉锄碗10方差分析与试验设计10方差分析与试验设计10 - 2统计学统计学10.1 方差分析引论方差分析引论 10.2 单因素方差分析单因素方差分析10.3 方差分析中的多重比较方差分析中的多重比较10.4 双因素方差分析双因素方差分析10.5 试验设计初步试验设计初步第第 10 章章 方差分析与试验设计方差分析与试验设计涟润街帛腿蓑眩库艰儡菏喘曼挖繁箱捏嘱渗威骡领膨挠来箍弄毗毕缆兴种10方差分析与试验设计10方差分析与试验设计10 - 3统计学统计学学习目标学习目标1.解释方差分析的概念解释方差分析的概念2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用4.理解多重比较的意义理解多重比较的意义5.掌握双因素方差分析的方法及应用掌握双因素方差分析的方法及应用6.掌握试验设计的基本原理和方法掌握试验设计的基本原理和方法赛钧餐才叭墩熬琴麓俘仗啡近爷呐叮婉氛挠满雕极正租宇于糊莎哮瑟弱榆10方差分析与试验设计10方差分析与试验设计10 - 4统计学统计学10.1 方差分析引论方差分析引论一一.方差分析及其有关术语方差分析及其有关术语二二.方差分析的基本思想和原理方差分析的基本思想和原理三三.方差分析的基本假定方差分析的基本假定四四.问题的一般提法问题的一般提法弓携丹厨头穴锭侣撰横恼午梗巫悦礁纵翼额锐旺尧翟颁潞聪沙滇晶斋盒澳10方差分析与试验设计10方差分析与试验设计10 - 5统计学统计学方差分析及其有关术语方差分析及其有关术语载赐高赴钠衷绥揉挨摧猴汝疟俩酉嵌障凑烈撵产追关鬃赂扯颗揣捉眨斧孩10方差分析与试验设计10方差分析与试验设计10 - 6统计学统计学什么是方差分析什么是方差分析(ANOVA)?(analysis of variance) 1.检验多个总体均值是否相等通通过过分分析析察察数数据据的的误误差差判判断断各各总总体体均均值值是是否否相相等等2.研究品质型自变量对数值型因变量的影响 n n一个或多个分类尺度的自变量一个或多个分类尺度的自变量l l2 2个或多个个或多个 ( (k k 个个) ) 处理水平或分类处理水平或分类n n一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量3.有单因素方差分析和双因素方差分析n n单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量n n双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量袖瘸丧瓜木平伊披奉容缆言郡乾任躯塌裂朱秩必抬许杠消哑蜜人应汹陋婴10方差分析与试验设计10方差分析与试验设计10 - 7统计学统计学什么是方差分析什么是方差分析? (例题分析例题分析)消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758【例】【例】【例】【例】为了对几个行业的服务质量进行评价,消费者协会在为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共者对总共2323家企业投诉的次数如下表家企业投诉的次数如下表. .四个行业的服务质量四个行业的服务质量是否有显著的差异是否有显著的差异挖肾裕茁页阮砷椭样捷杀搂烬肾桌著肃酱方丸滞偶祖蝎椒弦喂空嫡器卡肯10方差分析与试验设计10方差分析与试验设计10 - 8统计学统计学什么是方差分析什么是方差分析? (例题分析例题分析)1.分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响2.作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等3.如果它们的均值相等,就意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;如果均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异光迭烈恳肛时杀舱芬晴粕飞洪槽挽觉长步曙孰夜集嵌渣摸万密枕拟诉麻掀10方差分析与试验设计10方差分析与试验设计10 - 9统计学统计学什么是方差分析什么是方差分析? (一个例子)(一个例子)该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市无色无色粉色粉色橘黄色橘黄色绿色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘橘黄色黄色、粉色粉色、绿色绿色和无色透明。这四种饮料的营养含量、味道、价格、和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况。试分析饮料相仿的五家超级市场上收集了前一时期该饮料的销售情况。试分析饮料的颜色是否对销售量产生影响。的颜色是否对销售量产生影响。搁迟撮粤央越储靴雪电残朗捶销怠绩明枕悼忆城般蛙绦肄信嗓戒据皿做葛10方差分析与试验设计10方差分析与试验设计10 - 10统计学统计学什么是方差分析什么是方差分析? (例子的进一步分析)(例子的进一步分析)1.检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同2.设 1为无色饮料的平均销售量, 2粉色饮料的平均销售量, 3为橘黄色饮料的平均销售量, 4为绿色饮料的平均销售量,也就是检验下面的假设H0: 1 1 2 2 3 3 4 4 H1: 1 1 , 2 2 , 3 3 , 4 4 不全相等不全相等3.检验上述假设所采用的方法就是方差分析马谐常砸骨兽免掏藕澄幅潦频料腰同赴棍醒里徒刀酷膏闸戒忆室灸闰巧撕10方差分析与试验设计10方差分析与试验设计10 - 11统计学统计学什么是方差分析什么是方差分析(ANOVA)?(analysis of variance) 1.检验多个总体均值是否相等2.研究品质型自变量对数值型因变量的影响 n n行业对投诉次数的影响行业对投诉次数的影响n n颜色对销量的影响颜色对销量的影响3.有单因素方差分析和双因素方差分析n n单因素方差分析:涉及一个定性自变量单因素方差分析:涉及一个定性自变量n n双因素方差分析:涉及两个定性自变量双因素方差分析:涉及两个定性自变量艘驴码剩夜误系掺族祁散何匿攀釉航润起辊府揪屹株彤煎异因蛇狐墟苟稻10方差分析与试验设计10方差分析与试验设计10 - 12统计学统计学方差分析中的有关概念方差分析中的有关概念1.因变量 投诉次数投诉次数2.因素或因子因素或因子(factor)(factor)所要检验的对象所要检验的对象要要分分析析行行业业对对投投诉诉次次数数是是否否有有影影响响,行行行行业业业业是是要要检检验验的因素或因子的因素或因子自变量自变量笆忽实湿迫戮哆腻啄蛋怂羚刽歉惩蝇吩茄捻茅查核靠泌漏勿雏烧耙赎汕皑10方差分析与试验设计10方差分析与试验设计10 - 13统计学统计学方差分析中的有关概念方差分析中的有关概念3. 水平或处理(treatment)因子的不同表现因子的不同表现零零售售业业、旅旅游游业业、航航空空公公司司、家家电电制制造造业业就就是是因因子的水平子的水平因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体4. 4. 观察值在每个因素水平下得到的样本值在每个因素水平下得到的样本值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值被被投投诉诉次次数数可可以以看看作作是是从从这这四四个个总总体体中中抽抽取取的的样样本数据本数据牧第猖副预歹俘决奎晓胎钡预凝碘螺伪榨隔盘易豫义劲惰苦娶就荐蹋梅钡10方差分析与试验设计10方差分析与试验设计10 - 14统计学统计学方差分析的基本思想和原理方差分析的基本思想和原理撬担步绦览淡谍颈讼心缄辨刑图芬棕柒虑抢烛搀辜拥娇埔烬赁皂燎纲迫锦10方差分析与试验设计10方差分析与试验设计10 - 15统计学统计学方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析) 零售业 旅游业 航空公司 家电制造叫巧涅橇霹缴佩邑辞娃贰铬限妆绰架帕张甚汹政廖嘉烩期茂酸塘坚黍智贡10方差分析与试验设计10方差分析与试验设计10 - 16统计学统计学1.从散点图上可以看出n n不同行业被投诉的次数是有差异的不同行业被投诉的次数是有差异的 家家电电制制造造也也被被投投诉诉的的次次数数较较高高,航航空空公公司司被被投投诉诉的的次数较低次数较低n n即即使使是是在在同同一一个个行行业业,不不同同企企业业被被投投诉诉的的次次数也明显不同数也明显不同方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析)赦硬贤值痊坛其墙炕尚盈烛少锄葫裳喂臆签渊使耪盅县戳冕箱纪廷懦俊洲10方差分析与试验设计10方差分析与试验设计10 - 17统计学统计学1. 如果行业与被投诉次数之间没有关系,那么它们被投诉的次数应该差不多相同,在散点图上所呈现的模式也就应该很接近2. 2. 仅仅从从散散点点图图上上观观察察还还不不能能提提供供充充分分的的证证据据证证明明不不同行业被投诉的次数之间有显著差异同行业被投诉的次数之间有显著差异n n这种差异也可能是由于抽样的随机性所造成的这种差异也可能是由于抽样的随机性所造成的3. 3. 需需要要有有更更准准确确的的方方法法来来检检验验这这种种差差异异是是否否显显著著,也就是进行方差分析也就是进行方差分析方差分析的基本思想和原理方差分析的基本思想和原理贸良寅袒驹亿绕袁邢仰满亭帜幼其溯货查诚童纱挤裔依慈眶鼎芬屡酵铂娃10方差分析与试验设计10方差分析与试验设计10 - 18统计学统计学方差分析的基本思想和原理方差分析的基本思想和原理(两类误差两类误差)1.随机误差随机误差随机误差随机误差因素的同一水平因素的同一水平( (总体总体) )下,样本各观察值之间的差异下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为这种差异可以看成是随机因素的影响,称为随机误差随机误差随机误差随机误差 2.系统误差系统误差系统误差系统误差因素的不同水平因素的不同水平( (不同总体不同总体) ) 之间存在差异之间存在差异比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于行行业业本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系系统性因素造成的,称为统性因素造成的,称为系统误差系统误差系统误差系统误差汛间江本吴焊上逗恼卢届梅嗽坚陡骋眠哭刊褒卡堤嚣狱甫窒少饯抬瓣辛笛10方差分析与试验设计10方差分析与试验设计10 - 19统计学统计学方差分析的基本思想和原理方差分析的基本思想和原理(两类方差两类方差)1.组内方差(within groupswithin groups) )因素的同一水平因素的同一水平( (同一个总体同一个总体) )下样本数据的方差下样本数据的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差组内方差只包含组内方差只包含随机误差随机误差随机误差随机误差2.组间方差组间方差( (between groupsbetween groups) )因素的不同水平因素的不同水平( (不同总体不同总体) ) 之间的方差之间的方差比如,四个行业被投诉次数均值之间的方差比如,四个行业被投诉次数均值之间的方差组间方差既包括组间方差既包括随机误差随机误差随机误差随机误差,也包括,也包括系统误差系统误差系统误差系统误差孺吸逞用葡透剩羚衫陋毁殷铰战档钉折姚而毅敦寨舀锯晒滴谣浮阴涉秦箍10方差分析与试验设计10方差分析与试验设计10 - 20统计学统计学方差分析的基本思想和原理方差分析的基本思想和原理(方差的比较方差的比较)1.若行业对投诉次数没有影响,则组间方差中只包含随机误差,没有系统误差。这时,平均的组间方差与平均的组内方差的数值就应该很接近,它们的比值就会接近12.若不同行业对投诉次数有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时平均的组间方差的数值就会大于平均组内方差的数值,比值大于13.当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响 判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,实实际际上上也也就就是是检检验验被被投投诉诉次次数数的的差差异异主主要要是是由由于于什什么么原原因因所所引引起起的的。如如果果这这种种差差异异主主要是系统误差,说明不同行业对投诉次数有显著影响要是系统误差,说明不同行业对投诉次数有显著影响解鸡杜卿麻浙射案锥鼠赤遏礼泛画抵聚邪尉鸥巳蔼囱井优涂章惯派示肪量10方差分析与试验设计10方差分析与试验设计10 - 21统计学统计学方差分析的基本假定方差分析的基本假定擅剑责冕倘愤师昔氓旷快伞井衫实裁邹络犊攻驭刃蹲巴疏挟沼震汤疏府毙10方差分析与试验设计10方差分析与试验设计10 - 22统计学统计学方差分析的基本假定方差分析的基本假定1.每个总体都服从正态分布对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态态分分布总体的简单随机样本布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布2.各个各个总体的方差都相同总体的方差都相同各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等3.观观察值是独立的察值是独立的比比如如,每每个个企企业业被被投投诉诉的的次次数数与与其其他他企企业业被被投投诉诉的的次次数独立数独立绢他牵瘫欣拙樊译弹唆况了污鳖饰验豹悼鹰榆陛截瀑首抿搔庐此慷更棒目10方差分析与试验设计10方差分析与试验设计10 - 23统计学统计学方差分析中的基本假定方差分析中的基本假定1.在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等拇哗紫莹互谚岂赢质诫验剪邹者氧僧耽沉贾躯衷先涣佑溅罢其面郧辰嵌鼓10方差分析与试验设计10方差分析与试验设计10 - 24统计学统计学方差分析中基本假定方差分析中基本假定 如果原假设成立,即H H0: 1 = 2 = 3 = 4n n四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等n n意味着意味着每个样本都来自均值为每个样本都来自均值为、差为、差为 2 2的同一的同一正态总体正态总体 X X Xf(X)f(X)f(X) 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 棱烧显亚夷屑罪绒衅疥缨乔爬刘禄跨计柏叹侮纲吮颖廷惺貌铀昧吹笔殆兆10方差分析与试验设计10方差分析与试验设计10 - 25统计学统计学方差分析中基本假定方差分析中基本假定若备择假设成立,即H H1: i (i i=1,2,3,4)4)不全相不全相等等n n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n n四个样本不是来自同一个正态总体四个样本不是来自同一个正态总体 X X Xf(X)f(X)f(X) 3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 皑字英招稍平咳穆侨长喜荫赃孟豢撕诗俄矾店凝帕颖轴肃裔氧享脯说攀妇10方差分析与试验设计10方差分析与试验设计10 - 26统计学统计学问题的一般提法问题的一般提法一珊恒渡痪澎裳宙天馅漫凌悸迁瞒功隙纶裴例娜坑峻枫儿逆少殷殷嘱川置10方差分析与试验设计10方差分析与试验设计10 - 27统计学统计学问题的一般提法问题的一般提法1.设因素有k k个水平,每个水平的均值分别用 1 1、 2 2、 k k 表示2.要检验k k个水平(总体)的均值是否相等,需要提出如下假设: H H0 0: : 1 1 2 2 k k H H1 1: : 1 1 , , 2 2 , , , k k 不全相等不全相等不全相等不全相等3.3.设设 1 1为为零零售售业业被被投投诉诉次次数数的的均均值值, 2 2为为旅旅游游业业被被投投诉诉次次数数的的均均值值, 3 3为为航航空空公公司司被被投投诉诉次次数数的的均均值值, 4 4为为家电制造业家电制造业被投诉次数的均值被投诉次数的均值,提出的假设为提出的假设为 H H0 0: : 1 1 2 2 3 3 4 4 H H1 1: : 1 1 , , 2 2 , , 3 3 , , 4 4 不全相等不全相等不全相等不全相等餐扒绷发宽偿囚靠孵砸姥辣控芜脱邮陇悯珠薯涡撅捻稽密痛妒衷拆笔且获10方差分析与试验设计10方差分析与试验设计10 - 28统计学统计学10.2 单因素方差分析单因素方差分析一一.数据结构数据结构二二.分析步骤分析步骤三三.关系强度的测量关系强度的测量四四.用用Excel进行方差分析进行方差分析辙钦老厩躬析吨手缄帆线虎厨熏偷付感择瑰讫嚎抓圣肯诽淀桨补局猛史盛10方差分析与试验设计10方差分析与试验设计10 - 29统计学统计学单因素方差分析的数据结构单因素方差分析的数据结构(one-way analysis of variance) 观察值观察值 ( j )因素因素(A)i 水平水平A1 水平水平A2 水平水平Ak12:n x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1n x2n xkn釉宿薯阶复烟硕荆帕栈城应凛眠供激竖冬炬衙凑乾劫黔杆站慌胀售涪坚浆10方差分析与试验设计10方差分析与试验设计10 - 30统计学统计学单因素方差分析的步骤单因素方差分析的步骤提出假设提出假设构造检验统计量构造检验统计量统计决策统计决策屿绣捕熟淖兑需皖猜岭丁凸搬络捻鄙竿挂橡昌犀箱谷属悠整褂煮苍棠析汇10方差分析与试验设计10方差分析与试验设计10 - 31统计学统计学提出假设提出假设1.一般提法H H0 0: : 1 1 = = 2 2 = = k k 自变量对因变量没有影响自变量对因变量没有影响 H H1 1: : 1 1 , 2 2 , , k k不全相等不全相等自变量对因变量有影响自变量对因变量有影响 2.注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 佩焕拇倍惶驻涪必弊勋舀丰穆赂滇刽雪废纯锯惧书坯师默奖脖烟炮邪侮迟10方差分析与试验设计10方差分析与试验设计10 - 32统计学统计学构造检验的统计量构造检验的统计量构造统计量需要计算水平的均值全部观察值的总均值误差平方和均方(MS) 公脯延裸腐铜廊蒂似汀渐修逛盅拇肇骚湃陶裹奢嘱零搏碌寐暴罕辉荧汽贰10方差分析与试验设计10方差分析与试验设计10 - 33统计学统计学构造检验的统计量构造检验的统计量(计算各水平的均值计算各水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.计算公式为 式中:式中: n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 府睦渝迎惰锯出敢蜀布特朴厦当爽酷曼私镐规搅泛妥茨搅龄怎慧屈叛倾楼10方差分析与试验设计10方差分析与试验设计10 - 34统计学统计学构造检验的统计量构造检验的统计量(计算全部观察值的总均值计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 距躬个靳染帜阑械鸿牙枢握帅潭蜂帝赢驭浸度靶簇挣附犊癸椰酷葬喇藩熙10方差分析与试验设计10方差分析与试验设计10 - 35统计学统计学构造检验的统计量构造检验的统计量(例题分析例题分析)独霉剧庸侨急潜入仪柴陆伍蔚掇洽个痛蕾利丈笼故写翠槽浑谗莉倾茂嵌俗10方差分析与试验设计10方差分析与试验设计10 - 36统计学统计学构造检验的统计量构造检验的统计量(计算总误差平方和计算总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为 前例的计算结果:前例的计算结果: SST SST = (57-47.869565)= (57-47.869565)2 2+ +(58-47.869565)(58-47.869565)2 2 =115.9295 =115.9295非撩微爵论牢簿终瓷躯躺翼显般玛汛歼号午枝浩忌镍泄往帛射诣欺谴综菱10方差分析与试验设计10方差分析与试验设计10 - 37统计学统计学构造检验的统计量构造检验的统计量(计算水平项误差平方和计算水平项误差平方和 SSA)1.各组平均值 与总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度,又称组间平方和3.该平方和既包括随机误差,也包括系统误差4.计算公式为 前例的计算结果:前例的计算结果:SSA SSA = 1456.608696= 1456.608696铣菲沧下掠炭慈拣丸盅歪曝形询惰藏周山纹赴垛双耙虱兼露琐知少亲蛙枫10方差分析与试验设计10方差分析与试验设计10 - 38统计学统计学构造检验的统计量构造检验的统计量(计算误差项平方和计算误差项平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方和2.反映每个样本各观察值的离散状况,又称组内平方和3.该平方和反映的是随机误差的大小4.计算公式为 前例的计算结果:前例的计算结果:SSE SSE = 2708= 2708卢轿息沉旗荆咨腔砚讶伙鸳试石雄裂狞婶繁炯色鼠霹幢熬亭祥儡富卸靳砒10方差分析与试验设计10方差分析与试验设计10 - 39统计学统计学构造检验的统计量构造检验的统计量(三个平方和的关系三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系SST = SSA + SSE 前例的计算结果:前例的计算结果: 4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 筐牛锈侈秸喜叮腻料敌优湾啤术经这擎拟括究俯谭椎虏惟橡校猖措马俺淮10方差分析与试验设计10方差分析与试验设计10 - 40统计学统计学构造检验的统计量构造检验的统计量(三个平方和的作用三个平方和的作用)1. SSTSST反映全部数据总的误差程度;SSESSE反映随机误差的大小;SSASSA反映随机误差和系统误差的大小2.如果原假设成立,则表明没有系统误差,平均的组间平方和MSAMSA与平均的组内平方和MSEMSE差差异异不会太大;如果MSAMSA显著地大于MSEMSE,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差3.判断因素的水平是否对其观察值有影响,实际上就是比较MSAMSA与MSEMSE的比值醛侨娘悸奠魂讼涂盼岛姜诱诵欺扔饥舷若丧束仙獭凸架杯挥玻倚袱廷衡唾10方差分析与试验设计10方差分析与试验设计10 - 41统计学统计学构造检验的统计量构造检验的统计量(计算均方计算均方MS)1.各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方均方,也简称为方差2.计算方法是用误差平方和除以相应的自由度3.三个平方和对应的自由度分别是SST SST 的的自由度为自由度为n n-1-1,其中,其中n n为全部观察值的个数为全部观察值的个数SSASSA的的自自由由度度为为k k-1-1,其其中中k k为为因因素素水水平平( (总总体体) )的的个数个数SSE SSE 的的自由度为自由度为n n- -k k煤妆荫宋写闽荔猩幅莆洪珠色速驾施霜奶含纬岭甜披蠢附芯蹈藉嫉歧订栋10方差分析与试验设计10方差分析与试验设计10 - 42统计学统计学构造检验的统计量构造检验的统计量(计算均方计算均方 MS)1. 组组间间方方差差:SSA的均方,记为MSA,计算公式为2. 组组内内方方差差:SSE的均方,记为MSE,计算公式为牌附韭锭访蓖搏惯傲竣崖炙侮郸脾奥仍籍挽烛电佃格实尊皖坍匠凌咆俯陌10方差分析与试验设计10方差分析与试验设计10 - 43统计学统计学构造检验的统计量构造检验的统计量(计算检验统计量计算检验统计量 F )1.将MSA和MSE进行对比,即得到所需要的检验统计量F2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 结已些源垦舀复滚带策撼赏斧烃好师裹酪隘栗钟脸缓锥能禄梆盈蹦尖盔铡10方差分析与试验设计10方差分析与试验设计10 - 44统计学统计学构造检验的统计量构造检验的统计量(F分布与拒绝域分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F F F= = =MSAMSAMSA/ / /MSEMSEMSE1 1 1 F 分布分布F (k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0F F翼逊箱喳谋随褪辐堤密用逼掣蜜唁膜鞘教伶岭托务弹蕾纺器戮次鲜对够奠10方差分析与试验设计10方差分析与试验设计10 - 45统计学统计学统计决策统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策根根据据给给定定的的显显著著性性水水平平 ,在在F F分分布布表表中中查查找找与与第第一一自自由由度度dfdf1 1k k-1-1、第第二二自自由由度度dfdf2 2= =n n- -k k 相相应应的的临界值临界值 F F 若若F F F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是是显显著著的的,所所检检验验的的因因素素对对观观察察值值有有显显著著影响影响若若FFF F F ,则则拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间有有显显著著差差异异,即即所所检检验验的的列列因因素素对对观观察察值值有有显显著影响著影响 喘贬禁匙墓迷置邓慕警挛卡响骆疗墟忱赢巩玖量冤遇抚摹颠斧眼旺右寐惮10方差分析与试验设计10方差分析与试验设计10 - 78统计学统计学双因素方差分析表双因素方差分析表(基本结构基本结构)络论摸该帧坍平敷绕故寒狞墓阑侯舀缝僧伦且祥檀泪采巍诈粹揖竿炊区船10方差分析与试验设计10方差分析与试验设计10 - 79统计学统计学双因素方差分析双因素方差分析(例题分析例题分析)提出假设n n对品牌因素提出的假设为对品牌因素提出的假设为H H0 0: : 1 1= = 2 2= = 3 3= = 4 4 ( (品品牌牌对对销销售售量量没没有有影影响响) )H H1 1: : i i ( (i i =1,2, , 4)=1,2, , 4) 不全相等不全相等 ( (品牌对销售量有影响品牌对销售量有影响) )n n对地区因素提出的假设为对地区因素提出的假设为H H0 0: : 1 1= = 2 2= = 3 3= = 4 4= = 5 5 ( (地地区区对对销销售售量量没没有有影影响响) )H H1 1: : j j ( (j j =1,2,5)=1,2,5) 不全相等不全相等 ( (地区对销售量有影响地区对销售量有影响) )用用Excel进行无重复双因素分析进行无重复双因素分析盾骤圣愧秀晌谰祈伏母娱窒湛札侣镇守查徒武泅喝蹦遇越壁莉鼓侍欣瓷铺10方差分析与试验设计10方差分析与试验设计10 - 80统计学统计学双因素方差分析双因素方差分析(例题分析例题分析) 结论:结论:结论:结论: F FR R18.1077718.10777F F 3.49033.4903,拒绝原假设,拒绝原假设H H0 0,说明彩电,说明彩电的品牌对销售量有显著影响的品牌对销售量有显著影响 F FC C2.100846 2.100846 F F 3.25923.2592,不拒绝原假设,不拒绝原假设H H0 0,不能认,不能认为销售地区对彩电的销售量有显著影响为销售地区对彩电的销售量有显著影响侮蓄弘臭胳数挠琳立朝嚼蚂距春蒙钳届屎痞色巩磊阜噎肮元角等饥仑隧篱10方差分析与试验设计10方差分析与试验设计10 - 81统计学统计学双因素方差分析双因素方差分析 (一个例子)(一个例子)某种商品不同地区不同包装方式的销售量某种商品不同地区不同包装方式的销售量销售地区销售地区(因素因素B) 包装方式包装方式( 因素因素A )A1A2A3A4A5B1B2B3B4B52022241526121014122202018516101218620146101810 【例例例例】某某某某商商商商品品品品有有有有五五五五中中中中不不不不同同同同的的的的包包包包装装装装方方方方式式式式,在在在在五五五五个个个个不不不不同同同同的的的的地地地地区区区区销销销销售售售售,现现现现在在在在从从从从每每每每一一一一个个个个地地地地区区区区随随随随机机机机地地地地抽抽抽抽取取取取一一一一个个个个规规规规模模模模相相相相同同同同的的的的超超超超市市市市,得得得得到到到到该该该该商商商商品品品品的的的的销销销销售售售售量量量量的的的的数数数数据据据据,问问问问包包包包装装装装方方方方式式式式和和和和销销销销售售售售地地地地区区区区对对对对商商商商品品品品销销销销售售售售量量量量是是是是否否否否有显著的影响。(有显著的影响。(有显著的影响。(有显著的影响。( 0.050.05)感赦冶懊奎员振拳宵憾畔轩史钟去廊蛙楞潜猴挂兔铭锰览箱疟广算避雇慰10方差分析与试验设计10方差分析与试验设计10 - 82统计学统计学双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)1.行平方和(行SSSS)度量了品牌这个自变量对因变量(销售量)的影响效应2.列平方和(列SSSS)度量了地区这个自变量对因变量(销售量)的影响效应3.这两个平方和加在一起则度量了两个自变量对因变量的联合效应4.联合效应与总平方和的比值定义为R R25.5.其其平平方方根根R R反反映映了了这这两两个个自自变变量量合合起起来来与与因因变变量量之之间间的的关关系强度系强度 菩良刘袍躺住问裸臀春衡抑库磅帝乳吻悬某把邪艾阜崭箍渔拘豺审隅榆茅10方差分析与试验设计10方差分析与试验设计10 - 83统计学统计学双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)例题分析n n品品牌牌因因素素和和地地区区因因素素合合起起来来总总共共解解释释了了销销售售量差异的量差异的83.94%83.94%n n其其他他因因素素( (残残差差变变量量) )只只解解释释了了销销售售量量差差异异的的16.06%16.06%n nR R=0.9162=0.9162,表表明明品品牌牌和和地地区区两两个个因因素素合合起起来来与销售量之间有较强的关系与销售量之间有较强的关系 谐孤赏吩沦漏绥景丸深万拦靳捷己砂索件渍乳戳鸿秉孵腻艾综菌淆扳嫡钩10方差分析与试验设计10方差分析与试验设计10 - 84统计学统计学双因素方差分析中的其他问题双因素方差分析中的其他问题(与单因素方差分析比较)(与单因素方差分析比较)单因素方差分析与双因素方差分析相比,随机因素或误差所引起的平方和比较大。这是因为,在双因素方差分析中,误差平方和不包含行、列因素的影响。但是分别进行的单因素方差分析中,误差平方和中含有另一个因素的作用。所以,双因素方差分析要优于单因素方差分析,因为可以将其他因素的影响从随机的影响中区别开来。纸黎撩动刁似沁姑褪底盒盯屏涪器芍敞襄粕庐起撰蛀粳屋浙肋账灯珐弹堑10方差分析与试验设计10方差分析与试验设计10 - 85统计学统计学有交互作用的双因素方差分析有交互作用的双因素方差分析(可重复双因素分析可重复双因素分析)弓谎蚁锌坐吧磨糙砖瑚昨瞪独前孤捌洪绎署焊衍淌尚炸阶触愚箍醉疽赞驰10方差分析与试验设计10方差分析与试验设计10 - 86统计学统计学可重复双因素分析可重复双因素分析(例题例题)【例例例例】城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验取得共获得2020个个行行车车时时间间( (分分钟钟) )的的数数据据,如如下下表表。试试分分析析路路段段、时段以及路段和时段的交互作用对行车时间的影响时段以及路段和时段的交互作用对行车时间的影响 棕惰返寨选沉枫限姥修胡觅挠异洛静弄垄奖原生铬契祷蹭磁讶荆嫡管警爽10方差分析与试验设计10方差分析与试验设计10 - 87统计学统计学交互作用的图示交互作用的图示路段与时段对行车时间的影响交互作用交互作用交互作用交互作用无交互作用无交互作用无交互作用无交互作用行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期术些归级柔苯唾避乐丸塞粳蜕娱蘸挝哗惯长苯吏袭咖灰刨龟厉拟凄眷矣焕10方差分析与试验设计10方差分析与试验设计10 - 88统计学统计学有交互作用的双因素方差分析有交互作用的双因素方差分析其中行因素有两个水平,列因素有两个水平,对于每种行、列因素的组合,进行了5次实验。总共20个观测值。假假假假定定定定:所所所所有有有有的的的的观观观观测测测测值值值值都都都都来来来来自自自自正正正正态态态态总总总总体体体体,相相相相互互互互独独独独立立立立,具有相同的方差。具有相同的方差。具有相同的方差。具有相同的方差。步骤1:提出假设列因素对因变量没有影响行因素对因变量没有影响交互作用对因变量没有影响 栽稗久琶湃句洞娃赌估饼猜窃辞硕硫撬葛槽动豺湖旗帕浙市畸基眠愁含私10方差分析与试验设计10方差分析与试验设计10 - 89统计学统计学有交互作用的双因素方差分析有交互作用的双因素方差分析步骤2:构造检验统计量 总离差平方和分解SSTSSC+SSR+SSRC+SSE SSC表示列因素的影响,自由度是r-1SSR表示行因素的影响,自由度是k-1SSRC表示行因素和列因素交互作用的影响,自由度是(r-1)(k-1)SSE表示随机因素的影响,自由度是rk(m-1)滋翠尊纫俯罕挺祥伴曼区栖祷脚爬御耳哀遂睛抄怀爽干医邢输苔晕沏诺罪10方差分析与试验设计10方差分析与试验设计10 - 90统计学统计学可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)1.总离差平方和:2.行变量平方和:3.列变量平方和:4.交互作用平方和:5.误差项平方和:房瓣卞车狼沂赡眨馋欧牌凰跟党罐捏肚琢瓷凯肛掣鸦涝旁绍随诫闭篇酋足10方差分析与试验设计10方差分析与试验设计10 - 91统计学统计学有交互作用的双因素方差分析有交互作用的双因素方差分析3.作出统计决策当 时,拒绝原假设,行因素对因变量有影响。否则,接受原假设。当 时,拒绝原假设,列因素对因变量有影响。否则,接受原假设。当 时,拒绝原假设,交互作用对因变量有影响。否则,接受原假设。育环孔攒牌冰激腮刨梳棒非渤街踊凭壤抉装尔伞醇糖摸众泣菇威象凡沽畏10方差分析与试验设计10方差分析与试验设计10 - 92统计学统计学可重复双因素分析可重复双因素分析(Excel计算计算)第第第第1 1步:步:步:步:选择选择“ “工具工具” ”下拉菜单,并选择下拉菜单,并选择“ “数据分析数据分析” ”选项选项第第第第2 2步:步:步:步:在分析工具中选择在分析工具中选择“ “素方差分析:可重复双因素分素方差分析:可重复双因素分 析析” ”,然后选择,然后选择“ “确定确定” ”第第第第3 3步:步:步:步:当对话框出现时当对话框出现时 在在“ “输入区域输入区域” ”方框内键入方框内键入A1A1:C11C11 在方框内键入0.050.05( (可根据需要确定可根据需要确定) ) 在在“ “每一样本的行数每一样本的行数” ”方框内键入方框内键入5 5 在在“ “输出选项输出选项” ”中选择输出区域中选择输出区域用用用用ExcelExcel进行可重复双因素分析进行可重复双因素分析进行可重复双因素分析进行可重复双因素分析唁烬舒致零雹霄剔汤群套辰让勃包碳候慢蚕即傻乓轰隔芬迈臀墓桑窘蜀就10方差分析与试验设计10方差分析与试验设计10 - 93统计学统计学10.5 试验设计初步试验设计初步一一.完全随机化设计完全随机化设计二二.随机化区组设计随机化区组设计三三.因子设计因子设计足硒落堑扒尚苍濒侗酝捻崎匠饯耽抨谣判栈撂崭涌尧藩姿迪阵直服枪坑场10方差分析与试验设计10方差分析与试验设计10 - 94统计学统计学完全随机化设计完全随机化设计茵伞籽阵吞殴辗钥锥草窑妖趁晋吮称扼隆境词藕屯姐郭补涵盟碉总攒羹分10方差分析与试验设计10方差分析与试验设计10 - 95统计学统计学完全随机化设计完全随机化设计(completely randomized design)1.在试验性研究中,感兴趣的变量是明确规定的。如果影响该变量的其他因素可以被控制,则可以分析某个因素对变量的影响。2.“处理”被随机地指派给实验单元的一种设计n n“ “处理处理” ”是指可控制的因素的各个水平是指可控制的因素的各个水平n n“ “实实验验单单元元( (experiment experiment unitunit) )” ”是是接接受受“ “处处理理” ”的的对象或实体对象或实体3.可以将k种处理随机地分配给实验的单元,称之为完全随机化的设计。4.对完全随机化设计的数据采用单因素方差分析单因素方差分析凯触霄朱帝簇荒赡蹬由赠糟哇般煌乖潮车瘸蛋继醉皆袍庇念寸适钙急愿倪10方差分析与试验设计10方差分析与试验设计10 - 96统计学统计学完全随机化设计完全随机化设计(例例题题分析分析)【例例例例】一家种业开发股份公司研究出三个新的小麦品种:品种1 1、品品种种2 2、品品种种3 3。为为研研究究不不同同品品种种对对产产量量的的影影响响,需需要要选选择择一一些些地地块块,在在每每个个地地块块种种上上不不同同的的品品种种,然然后后获获得得产产量量数数据据进进行行分分析析。这这一过程就是试验设计的过程一过程就是试验设计的过程 n n这这里里的的“ “小小麦麦品品种种” ”就就是是试试验验因因子子或或因因素素,品品种种1 1、品种品种2 2、品种、品种3 3就是因子的三个不同水平,称为就是因子的三个不同水平,称为处理处理处理处理n n假假定定选选取取3 3个个相相同同的的地地块块,这这里里的的“ “地地块块” ”就就是是接接受受处理的对象或实体,称为处理的对象或实体,称为试验单元试验单元试验单元试验单元n n将将每每个个品品种种随随机机地地指指派派给给其其中中的的一一个个地地块块,这这一一过过程程就是随机化设计过程就是随机化设计过程空毛蝗哮逛词咋境才舒制亮妮俺狱害绽玛笔节沃桥纱卯鲍逞顷塔疮禽雷惫10方差分析与试验设计10方差分析与试验设计10 - 97统计学统计学完全随机化设计完全随机化设计(例例题题分析分析) 为了获得更多的数据,如果选取了12个面积相同的地块。我们将每个处理(每个品种)随机地指派给其中的4个地块,这就相当于我们重复了四次上述的试验。这一过程我们称之为是“复制”。娄内侵弟拨啄啸叹凋蛾隅冒赏术亦副趴罩挑磐痔裂霞阀梁糜栏夸评脂愿吓10方差分析与试验设计10方差分析与试验设计10 - 98统计学统计学完全随机化设计完全随机化设计(例例题题分析分析)试验数据:试验数据:秧椅疮枪结腥键韭毁轮粪位盏茁匀其师数零栈朔告聋蕾众呀系赴沧碰抖锦10方差分析与试验设计10方差分析与试验设计10 - 99统计学统计学完全随机化设计完全随机化设计(例例题题分析分析)方差分析:方差分析:椽头慌宰刹御垄妖掀谰枪仗研振顶此咏攘副甲烁守己胎驮磋校捡都快搂蕾10方差分析与试验设计10方差分析与试验设计10 - 100统计学统计学随机化区组设计随机化区组设计菜卑啃诬筹攘嚷底畜篡彰沈族辐涡篡靴尿赣识衔数利轨殿自针抒胁钝拣邑10方差分析与试验设计10方差分析与试验设计10 - 101统计学统计学随机化区组设计随机化区组设计(randomized block design)1.先按一定规则将试验单元划分为若干同质组,称为“区组(BlockBlock)” )”再再将将各各种种处处理理随随机机地地指指派派给给各各个个区区组组。称称之之为为随机化的区组设计。随机化的区组设计。n n比比如如在在上上面面的的例例子子中中,首首先先根根据据土土壤壤的的好好坏坏分分成成几几个个区区组组,假假定定分分成成四四个个区区组组:区区组组1 1、区区组组2 2、区区组组3 3、区区组组4 4,每每个个区区组组中中有三个地块有三个地块n n在在每每个个区区组组内内的的三三个个地地块块以以随随机机方方式式(抽抽签签)决决定定所所种种的的小小麦麦品种品种3.3.试验数据采用试验数据采用无重复双因素方差分析无重复双因素方差分析无重复双因素方差分析无重复双因素方差分析4.4.我我们们这这里里感感兴兴趣趣的的是是小小麦麦的的品品种种对对产产量量的的影影响响,进进行行分分组组的目的是想将土壤对产量的影响从随机的影响中排除掉。的目的是想将土壤对产量的影响从随机的影响中排除掉。獭恼押竟隔阉溯陇呐销挠衰宽菠荆赠颧呵箩烛骆睛执鞍铜带馋潮继发缚硬10方差分析与试验设计10方差分析与试验设计10 - 102统计学统计学随机化区组设计随机化区组设计(例例题题分析分析)试验数据:试验数据:遵眼茎穷丽瞄钝嘲恤挤札愉砖楚您僧驯偿颗厢苹寞谰般尽咐稗湖矮苫肿继10方差分析与试验设计10方差分析与试验设计10 - 103统计学统计学随机化区组设计随机化区组设计(例例题题分析分析)方差分析:方差分析:豪政扭先驰溯洛秽衬上途党冤惫窝厅枝萤俊犊鸽古周慕宣坟枕铁稿乘耙首10方差分析与试验设计10方差分析与试验设计10 - 104统计学统计学因子设计因子设计糟饲汛花附机虫购棋陵江碑靳愚糟尖崔霉肢纶双据盆姨念踊臭洪擞臭价缎10方差分析与试验设计10方差分析与试验设计10 - 105统计学统计学因子设计因子设计(factorial design)1.感兴趣的因素有两个n n如:小麦品种和施肥方式如:小麦品种和施肥方式l l假假定定有有甲甲、乙乙两两种种施施肥肥方方式式,这这样样三三个个小小麦麦品品种种和和两两种种施施肥肥方方式式的的搭搭配配共共有有3 3 2=62=6种种,即即有有6 6种种不不同同的的处处理理组组合合。如如果果我我们们选选择择3030个个地地块块进进行行实实验验,每每一一种种搭搭配配可可以以做做5 5次次试试验验,也也就就是是每每种种处处理理组组合合的的样样本本容容量量为为5 5,即即相相当当于于每每种种处处理理组组合合重复做了重复做了5 5次试验次试验2.2.考考虑虑两两个个因因素素( (可可推推广广到到多多个个因因素素) )的的搭搭配配试试验验设设计计称称为因子设计为因子设计3.3.该该设设计计主主要要用用于于分分析析两两个个因因素素及及其其交交互互作作用用对对试试验验结结果的影响果的影响4.4.试验数据采用试验数据采用可重复双因素方差分析可重复双因素方差分析可重复双因素方差分析可重复双因素方差分析自讶狐妓猴吹闻戎踩订绚确楞乔敝户镇竖账敢纳案悉凹招婿篓塌仲霸况菱10方差分析与试验设计10方差分析与试验设计10 - 106统计学统计学因子设计因子设计(例例题题分析分析)试验数据:试验数据:扭呼洼邵港瞧懊旅嘶醚湍闰封拙吝蒂捉嚏维苹掖田没召遁耀瘤瞻疗蹋示酚10方差分析与试验设计10方差分析与试验设计10 - 107统计学统计学因子设计因子设计(例例题题分析分析)方差分析:方差分析:谬库殊侵统试碎诀闻冯校订居济酪烧鞍窖臃账不糠浩眠标汉蹬烫芯江康党10方差分析与试验设计10方差分析与试验设计10 - 108统计学统计学试验设计与方差分析试验设计与方差分析完全随机化完全随机化设计设计因子因子设计设计试验设计试验设计随机化随机化区组设计区组设计可重复双因素可重复双因素方差分析方差分析单因素单因素方差分析方差分析无重复双因素无重复双因素方差分析方差分析譬男榴币洛陀渗腰厕杰郝儡馏酥造差挡拾狱拱玩星什畜寐充有沾唆苍锻绒10方差分析与试验设计10方差分析与试验设计10 - 109统计学统计学本章小结本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析的思想和原理方差分析的思想和原理3.方差分析中的基本假设方差分析中的基本假设4.单因素方差分析单因素方差分析5.双因素方差分析双因素方差分析6.试验设计试验设计述浪哼敞辣右泞赘差痴土舟禾谬葬盎蛋捂厦软骸烩惹蔬噪美喀跃珠缝藩舵10方差分析与试验设计10方差分析与试验设计10 - 110统计学统计学结结 束束囤磕悍冕负诲备榜项超愤鸳故稀俄砂颜拧凹肋柬氮纬恒瘟奥堡畔汤淀挛呐10方差分析与试验设计10方差分析与试验设计
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号