资源预览内容
第1页 / 共34页
第2页 / 共34页
第3页 / 共34页
第4页 / 共34页
第5页 / 共34页
第6页 / 共34页
第7页 / 共34页
第8页 / 共34页
第9页 / 共34页
第10页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第第 10 讲讲 统计应用统计应用: 方差分析方差分析11.1 11.1 方差分析的基本原理方差分析的基本原理11.2 11.2 方差分析应用方差分析应用11.1. 方差分析的基本原理方差分析的基本原理一、什么是方差分析一、什么是方差分析 1、方差分析(、方差分析(ANOVA)的定义)的定义 是通过样本是通过样本, 来检验多个总体来检验多个总体均值均值是否相等的统计方法。是否相等的统计方法。ANOVA分析的本质仍然是假设检验分析的本质仍然是假设检验H0 :m1 = m2 = mk H1 :m1 ,m2 , ,mk 不全相等不全相等可看出,可看出,ANOVA比假设检验的比假设检验的功能更强大,应用更广泛!功能更强大,应用更广泛!2、方差分析应用广泛、方差分析应用广泛四个不同行业(四个不同行业(Xi)消费者的投诉次数)消费者的投诉次数(Y) 观测值观测值行行 业业 差差 异异零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758H0 :m零售 = m旅游 = m航空 = m家电 H1 : m零售 、 m旅游 、 m航空 、 m家电不全相等不全相等3、方差分析的两个核心概念、方差分析的两个核心概念因子:是指影响函数值的主要自变量(本例因子为行业)。因子:是指影响函数值的主要自变量(本例因子为行业)。水平:是指因子这种分类变量的不同取值(水平:是指因子这种分类变量的不同取值(零售业等四类)观测值:各种水平下所得到的样本观察值。观测值:各种水平下所得到的样本观察值。四个行业消费者的投诉次数四个行业消费者的投诉次数 观测值观测值行行 业业 差差 异异零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758本例的因子有几个?属于本例的因子有几个?属于单因子还是双因子分析?单因子还是双因子分析? 单因素方差分析的数据结构单因素方差分析的数据结构观察值观察值 ( j )因素因素(A) 水平水平A1 水平水平A2 水平水平Ak12:n x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1n x2n xkn提问:因子、水平和提问:因子、水平和观测值分别是什么?观测值分别是什么? 双因素方差分析的数据结构双因素方差分析的数据结构 品牌和区位和彩电销售量数据品牌和区位和彩电销售量数据 品牌因素品牌因素地地 区区 因因 素素地区地区1 1地区地区2 2地区地区3 3地区地区4 4地区地区5 5品牌品牌1 1品牌品牌2 2品牌品牌3 3品牌品牌4 4365345358288 350368323280 343363353298 340330343260 323333308298 双因子方差分析:研究两个因子作为自变量对因变量影双因子方差分析:研究两个因子作为自变量对因变量影响效应的统计分析。响效应的统计分析。 同单因子一样,两因子都是分类变量。同单因子一样,两因子都是分类变量。 双因素方差分析数据结构双因素方差分析数据结构 哪个是行的均值、哪个是行的均值、列的均值、所有列的均值、所有观测值的均值?观测值的均值?第第 i 行的均值行的均值第第 j 列的均值列的均值小结:方差分析的核心小结:方差分析的核心进行假设检验进行假设检验H0 :m1 = m2 = mk 含义:自变量对因变量没有显著影响含义:自变量对因变量没有显著影响 H1 :m1 ,m2 , ,mk不全相等含义:自变量对因变量有显著影响含义:自变量对因变量有显著影响 结论: 如如果果拒拒绝绝了了原原假假设设,则则表表明明自自变变量量(因因子子)对对因因变变量量有有影影响响。反反之之,则则该该因因子子的的不不同同取取值值(水水平平)对对因因变变量不会产生影响量不会产生影响。 二、方差分析的基本思想二、方差分析的基本思想 零售业零售业 旅游业旅游业 航空公司航空公司 家电制造家电制造11、需要进行方差分析吗?、需要进行方差分析吗?这仅仅是对一个随机样本的观测,而假设检验是对总体的一种这仅仅是对一个随机样本的观测,而假设检验是对总体的一种推断,因此还需要以样本为基础,运用统计量进行分析。推断,因此还需要以样本为基础,运用统计量进行分析。这仅仅是一这仅仅是一个样本!个样本!SST = SSA + SSE总离差平方和总离差平方和(SST)组内离差平方和组内离差平方和(SS组内组内)组间离差平方和组间离差平方和(SS组间组间)=+22、如何分析:核心是构造、如何分析:核心是构造“离差平方和离差平方和”随机差异结构差异总差异33、方差分析的步骤、方差分析的步骤 提出假设提出假设 根据离差平方和,构造检验根据离差平方和,构造检验 F F 统计量(如下)统计量(如下) 给定显著性水平给定显著性水平a a做出(不)拒绝原假设的决策做出(不)拒绝原假设的决策 组间平方和组间平方和组间平方和组间平方和组内平方和组内平方和组内平方和组内平方和图解:除式的统计量服从图解:除式的统计量服从 F F 分布分布如果如果如果如果如果如果MSMSMS组间组间组间组间组间组间 MSMSMS组内差组内差组内差组内差组内差组内差,则,则,则,则,则,则算出的统计量的值一定算出的统计量的值一定算出的统计量的值一定算出的统计量的值一定算出的统计量的值一定算出的统计量的值一定在置信区间内在置信区间内在置信区间内在置信区间内在置信区间内在置信区间内 F 分布分布F (k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0F F若若FFFF ,则拒绝原假设,则拒绝原假设H H0 0 ,则,则认为总体之间的差异是显著的。认为总体之间的差异是显著的。若若P P 13.35临临界界值值3.283.28,故拒绝,故拒绝H HO.O. 方方法法2 2(P P值值检检验验):由由于于统统计计量量p p值值 18.10777F F 3.49033.4903,拒绝原假设拒绝原假设拒绝原假设拒绝原假设HH0 0,说明彩电说明彩电说明彩电说明彩电的品牌对销售量有显著影响的品牌对销售量有显著影响的品牌对销售量有显著影响的品牌对销售量有显著影响 F FC C2.100846 2.100846 F F 3.25923.2592,不拒绝原假设不拒绝原假设不拒绝原假设不拒绝原假设HH0 0,不能认不能认不能认不能认为销售地区对彩电的销售量有显著影响为销售地区对彩电的销售量有显著影响为销售地区对彩电的销售量有显著影响为销售地区对彩电的销售量有显著影响方法方法2:用:用P值决策(值决策(与显著性水平与显著性水平 比较)比较)若PR ,拒拒绝绝原假设H0 ,表明均值之间的差异是显著的,即所检验的行因子对观察值有显著影响。若PC 35.771F F 3.4033.403,拒绝原假设拒绝原假设拒绝原假设拒绝原假设HH0 0,说明超市位说明超市位说明超市位说明超市位置对销售量有显著影响置对销售量有显著影响置对销售量有显著影响置对销售量有显著影响 F F列列列列14.892 14.892 F F 3.0083.008,拒绝原假设,拒绝原假设,拒绝原假设,拒绝原假设HH0 0,说明竞争者,说明竞争者,说明竞争者,说明竞争者数量对销售量有显著影响数量对销售量有显著影响数量对销售量有显著影响数量对销售量有显著影响F F交互交互交互交互3.2838 F3.2838 F 2.5082.508,拒绝原假设,拒绝原假设,拒绝原假设,拒绝原假设HH0,说明超市,说明超市,说明超市,说明超市位置和竞争者数量的交互影响对销售量也有显著影响位置和竞争者数量的交互影响对销售量也有显著影响位置和竞争者数量的交互影响对销售量也有显著影响位置和竞争者数量的交互影响对销售量也有显著影响第第1步:步:选择“工具工具”下拉菜单,并选择【数据分析数据分析】选项第第2步:步:在分析工具中选择【方差分析:可重复双因子分方差分析:可重复双因子分 析析】,然后选择【确定】第第3步:步:当对话框出现时 在【输入区域】方框内键入数据区域 在【】方框内键入0.05(可根据需要确定) 在【每一样本的行数每一样本的行数】方框内键入重复实验次数(3) 在【输出区域】中选择输出区域 选择【确定】 用用用用ExcelExcel进行可重复双因子分析进行可重复双因子分析进行可重复双因子分析进行可重复双因子分析续前:能分析一下各部分的续前:能分析一下各部分的关系强度吗?(方法同前)关系强度吗?(方法同前)第11讲讲完了。谢谢大家!
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号