资源预览内容
第1页 / 共66页
第2页 / 共66页
第3页 / 共66页
第4页 / 共66页
第5页 / 共66页
第6页 / 共66页
第7页 / 共66页
第8页 / 共66页
第9页 / 共66页
第10页 / 共66页
亲,该文档总共66页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
方方差差分分析析单因素单因素:完全随机设计:完全随机设计两因素两因素:随机区组设计:随机区组设计多因素:?多因素:?重复重复测量设计测量设计单组单组多组多组单因素方差设计只涉及一个处理因素单因素方差设计只涉及一个处理因素该因素该因素至少至少有两个水平有两个水平有有两水平时:称为两样本均数比较两水平时:称为两样本均数比较两水平以上:称多个样本均数比较的方差分析两水平以上:称多个样本均数比较的方差分析知识点:多重比较时有知识点:多重比较时有特定的方法,不能用两特定的方法,不能用两样本均数比较,此时容样本均数比较,此时容易加大易加大类错误(把本类错误(把本无差别的两个总体判为无差别的两个总体判为有差别)的概率有差别)的概率。为什么为什么?Why?举例:举例:有有4个个样本均数样本均数如果用如果用t检验每次比较选检验每次比较选0.05,不犯不犯错误的概率错误的概率16次次不犯不犯错误(错误( 1)6总的水准:总的水准:1( 1)6 1( 10.05)6=0.26比比0.05大多了!大多了!比较的次数越多犯比较的次数越多犯错误的概率越大!错误的概率越大!把无差别的结果判为有差别把无差别的结果判为有差别完全随机设计完全随机设计如比较如比较4种饲料对小鼠体重增加量的影响,处理种饲料对小鼠体重增加量的影响,处理因素是饲料,有因素是饲料,有4个水平(不同饲料)。个水平(不同饲料)。完全随机设计是完全随机设计是将将n个小鼠随机分为个小鼠随机分为4组。组。随机区组设计随机区组设计是将是将n个小鼠按个小鼠按出生体重相近出生体重相近的原则,的原则,4个一组个一组相配(称为区组)后,再随机分不同的水平组,相配(称为区组)后,再随机分不同的水平组,称为两因素方差分析。称为两因素方差分析。非处理因素非处理因素应用条件应用条件1. 各样本是相互独立的随机样本,均服各样本是相互独立的随机样本,均服从正态分布。从正态分布。2. 相互比较的各样本的总体方差相等,相互比较的各样本的总体方差相等,具有方差齐性。具有方差齐性。重复测量设计重复测量设计一、重复测量资料的数据特征一、重复测量资料的数据特征当对同一受试对象在不同时间重复测量次数当对同一受试对象在不同时间重复测量次数p3时,称为重复测量设计或重复测量数据。时,称为重复测量设计或重复测量数据。测测 量量 时时 间间 点点受试者受试者 1 2 p1 y11 y12 y1p2 y21 y22 y2p:n yn1 yn2 y n p图例重复测量资料重复测量资料是是同同一一受受试试对对象象的的同同一一观观察察指指标标在在不不同同时时间间点点上上进进行行多多次次测测量量所所得得的的资资料料,常常用用来来分分析析该该观观察察指指标标在在不不同同时时间间点点上上的的变变化化。有有时时是是从从同同一一个个体体的的不不同同部部位位(或或组组织织)上上重重复复测测量量获得的指标的观测值。获得的指标的观测值。目的:就是比较不同时间点动态变化趋势的特征目的:就是比较不同时间点动态变化趋势的特征问题?问题?想想一一想想?同同一一观观察察单单位位具具有有多多个个观观察察值值,而而这这些些观观察察值值来来自自同同一一受受试试对对象象的的不不同同时时点点(部部位位等等),这这类类数数据据间间往往往往有有相相关关性性存存在在,违违背背了了方方差差分分析析要要求求数数据据满满足足独独立性立性基本条件。基本条件。在这种情况下:在这种情况下:若若使使用用一一般般的的方方差差分分析析,就就不不能能充充分分揭揭示示出出内在的特点,有时甚至会得出错误结论。内在的特点,有时甚至会得出错误结论。所所以以重重复复测测量量资资料料需需要要采采用用专专门门的的统统计计分分析析方方法法,该该方方法法是是近近代代统计学研究的热点之一。统计学研究的热点之一。实际中:重复测量资料比独立资料更多见。实际中:重复测量资料比独立资料更多见。临床研究中,需要观察病人在不同时间的某些生理、临床研究中,需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,研究不同时间或疗程生化或病理指标的变化趋势,研究不同时间或疗程的治疗效果。的治疗效果。流行病学研究中,观察队列人群在不同时间上的发流行病学研究中,观察队列人群在不同时间上的发病情况。研究不同职业、性别人群实施某种控制后,病情况。研究不同职业、性别人群实施某种控制后,不同时间的多次效果考察。不同时间的多次效果考察。卫生学研究中,纵向观察儿童生长发育规律等,不卫生学研究中,纵向观察儿童生长发育规律等,不同地区和环境营养状况。同地区和环境营养状况。提醒大家提醒大家重复测量数据在医学研究中十分常见,在重复测量数据在医学研究中十分常见,在医学类杂志上约占四分之一,而且统计医学类杂志上约占四分之一,而且统计表达和分析误用情况严重。表达和分析误用情况严重。主要优点主要优点减少样本含量减少样本含量控制个体变异控制个体变异非实验因素(干扰因素)非实验因素(干扰因素)重复测量设计重复测量设计与与随机区组设计随机区组设计的区别?的区别?1. 随机区组设计要求每个区组内随机区组设计要求每个区组内实验单位实验单位彼此独立彼此独立区组号区组号 A营养素营养素 B营养素营养素 C营养素营养素 1 50.10 58.20 64.50 2 47.80 48.50 62.40 3 53.10 53.80 58.60 4 63.50 64.20 72.50 5 71.20 68.40 79.30 6 41.40 45.70 38.40 7 61.90 53.00 51.20 8 42.20 39.80 46.20 表表 A、B、C 3种营养素喂养种营养素喂养 小白鼠所增体重(克)小白鼠所增体重(克)处理因素只能在处理因素只能在区组内随机分配区组内随机分配每个实验单位接每个实验单位接受处理是不同的受处理是不同的见左表:见左表:2. 重复测量设计区组内实验单位重复测量设计区组内实验单位彼此不独立彼此不独立,见表,见表12-3但同一受试的血样重复测量结果是高但同一受试的血样重复测量结果是高度相关的,见表度相关的,见表12-6:提示:分析存在一定的复杂性。提示:分析存在一定的复杂性。二、重复测量资料分类二、重复测量资料分类repeated measurement data 单变量重复测量方差分析单变量重复测量方差分析 多变量重复测量方差分析多变量重复测量方差分析 单变量重复测量方差分析单变量重复测量方差分析1. 单组重复测量单组重复测量指同一组内(或接受同一种处理)的多个受试指同一组内(或接受同一种处理)的多个受试者,在多个时间点上的反应变量所作的测量,者,在多个时间点上的反应变量所作的测量,又称为单变量重复测量。又称为单变量重复测量。测测 量量 时时 间间 点点受试者受试者 1 2 p1 y11 y12 y1p2 y21 y22 y2p:n yn1 yn2 y n p2.多组重复测量多组重复测量(多组并不等于多因素)(多组并不等于多因素)指将受试者按处理的不同水平分为几个组,对这指将受试者按处理的不同水平分为几个组,对这些组内的每一受试者,都在不同时间点对他们些组内的每一受试者,都在不同时间点对他们的反应变量进行测量。的反应变量进行测量。表3.1(余松林)1. 单组重复测量数据方差分析单组重复测量数据方差分析2. 两组重复测量数据方差分析两组重复测量数据方差分析 单变量重复测量方差分析单变量重复测量方差分析三、重复测量资料分析的前提条件和基本步骤三、重复测量资料分析的前提条件和基本步骤1.前提条件:前提条件:首先要求样本是随机的,首先要求样本是随机的,除了满足一般方差分析除了满足一般方差分析条件外,特别强调满足条件外,特别强调满足协方差阵(协方差阵(covariance matrix)球形性。球形性。sphericity概念:概念:协方差阵的球对称性是指该对角线元素(方差)协方差阵的球对称性是指该对角线元素(方差)相等、非主对角线元素(协方差)为零相等、非主对角线元素(协方差)为零方差指在某一时点上测定值变异的大小,而协方差是方差指在某一时点上测定值变异的大小,而协方差是指在两个不同时点上测定值相互变异的大小。如果在指在两个不同时点上测定值相互变异的大小。如果在某个时点上的取值不影响其它时点上的取值。则协方某个时点上的取值不影响其它时点上的取值。则协方差为差为0,相反,则不为,相反,则不为0。由协方差构成的矩阵称为协方差阵。由协方差构成的矩阵称为协方差阵。00若球对称性得不到满足,方差分析的若球对称性得不到满足,方差分析的F值是有值是有偏的,会增大偏的,会增大类错误的概率类错误的概率2. 用用Mauchly法法检验协方差阵的球形性质检验协方差阵的球形性质如果如果P值大于值大于,说明协方差阵的球对称性质得说明协方差阵的球对称性质得到满足。否则,必须对与时间有关的到满足。否则,必须对与时间有关的F统计量统计量的分子和分母的分子和分母自由度自由度进行调整,减少进行调整,减少类错误的类错误的概率。调整系数为:概率。调整系数为:(读:读:epsilon)3.自由度常用调整方法自由度常用调整方法Greenhouse-Geisser 法,简称:法,简称:G-G法法Huynh-Feldt 法,简称:法,简称:H-F法法Lower-bound法,简称:法,简称:L-B下界法下界法以上前两种方法较复杂,采用软件计算。以上前两种方法较复杂,采用软件计算。4. 举例:举例:单组重复测量数据的方差分析单组重复测量数据的方差分析观察观察10名慢性乙型肝炎患者治疗前、治疗名慢性乙型肝炎患者治疗前、治疗12周、周、24周、周、36周四个时间点上谷丙转氨酶(周四个时间点上谷丙转氨酶(ALT)水平的变化趋水平的变化趋势,结果见下表,试进行统计推断。势,结果见下表,试进行统计推断。分析分析: 数据结构上与完全区组设计相似数据结构上与完全区组设计相似但实质不同但实质不同各观测点时间顺序是固定的,不能随机分配;不同观测各观测点时间顺序是固定的,不能随机分配;不同观测点数据彼此不独立或不完全独立,存在一定的相关性。点数据彼此不独立或不完全独立,存在一定的相关性。SAS结果中包括偏相关阵结果中包括偏相关阵例题例题 1.建立假设,确定检验水准建立假设,确定检验水准0.012.进行球对称性检验进行球对称性检验球对称性通常采用球对称性通常采用Mauchlys test检验标准来判断检验标准来判断3.调整时间点调整时间点F值的自由度值的自由度调整原则:调整原则:当资料满足当资料满足“球对称球对称”(Sphericity)条件时条件时( P) ,不作调整。不作调整。当资料不满足当资料不满足“球对称球对称” 条件时(条件时( P27的肥胖患者的肥胖患者40名随机等分成名随机等分成表9-13可以看出重复测量资料中同一受试对象可以看出重复测量资料中同一受试对象(看成区组)的数据高度相关(看成区组)的数据高度相关无论哪位受试对象服用曲明片剂或是胶囊,其服药后无论哪位受试对象服用曲明片剂或是胶囊,其服药后8周、周、16周和周和24周的体重均和前面时间点(含服药前周的体重均和前面时间点(含服药前的的0周)的体重相关。不同时点数据其相关性较强。周)的体重相关。不同时点数据其相关性较强。 重复测量资料方差分析的基本步骤重复测量资料方差分析的基本步骤分为三步:分为三步:计算检验统计量:使用统计软件进行计算结果如下计算检验统计量:使用统计软件进行计算结果如下 :确定确定P值,做出推断结论:值,做出推断结论: 根据专业知识和假设检验,直接由计算机所根据专业知识和假设检验,直接由计算机所给给 P值做出推断结论。值做出推断结论。按按=0.05水水准准,减减肥肥药药剂剂型型k(片片剂剂和和胶胶囊囊),剂剂型型k与与时时间间i的的交交互互效效应应ki均均不不拒拒绝绝H0,无无统统计计学学意意义义,还还不不能能认认为为曲曲明明不不同同剂剂型型的的减减肥肥效效果果不不同同,也也还还不不能能认认为为剂剂型型k与与时时间间i间间有有交交互互效效应应。而而时时间间因因素素i拒拒绝绝H0,接接受受H1,有有统统计计学学意意义义,可可认认为为服服用用减减肥肥药药盐盐酸酸西西市市曲曲明明前前后后不不同同时时间间(8周周、16周周和和24周周)的的平平均均体重不全相同。体重不全相同。重复测量资料方差分析的前提条件重复测量资料方差分析的前提条件重复测量资料的方差分析,除了满足一般方差重复测量资料的方差分析,除了满足一般方差分析的条件外,还要满足协方差阵的球形性或分析的条件外,还要满足协方差阵的球形性或复合对称性。若条件不能满足,复合对称性。若条件不能满足,F值有偏性,通值有偏性,通常采用常采用Mauchly检验来判断,通过软件选参数检验来判断,通过软件选参数计算。计算。校正后的结果:校正后的结果:两组重复两组重复测量数据测量数据结构结构SAS程序显示该资料不满足球对称性,参看校正结果。显示该资料不满足球对称性,参看校正结果。结果表明经结果表明经G-G和和H-F调整后,按调整后,按0.05检验水准,检验水准,A(不同不同药物)和药物)和A与与TIME(时间)无统计学意义,后者无交互作用,时间)无统计学意义,后者无交互作用,而时间因素间有统计学意义。而时间因素间有统计学意义。例例4 用丹参注射液治疗用丹参注射液治疗7例慢性肾功能衰竭患者,治例慢性肾功能衰竭患者,治疗前后不同时间各患者的血尿素氮(疗前后不同时间各患者的血尿素氮(BUN)的变化,的变化,如表所示。试比较治疗前后不同时间各患者血尿素氮如表所示。试比较治疗前后不同时间各患者血尿素氮的变化是否不同?的变化是否不同? 表表4-5 4-5 丹参注射液治疗慢性肾衰患者丹参注射液治疗慢性肾衰患者 不同时间的不同时间的BUNBUN(mg/dlmg/dl)变化变化 治 疗 后不同患者 治疗前 第2周 第4周 第6周 1 60.7 41.0 34.5 36.2 2 65.2 44.7 41.2 39.4 3 66.3 42.4 40.5 37.7 4 67.1 49.1 43.3 40.2 5 62.8 38.5 40.1 35.8 6 72.5 52.3 44.6 37.6 7 58.0 35.0 38.6 37.2题意分析:题意分析:本题要探讨治疗前后本题要探讨治疗前后“不同时间不同时间”,又要研究,又要研究“不同患者不同患者”的血尿素氮的变化,的血尿素氮的变化,是属于按两因素分组的多个均数间比较的重复是属于按两因素分组的多个均数间比较的重复测量方差分析测量方差分析 首先在首先在Insight中建立数据集,本题变量中建立数据集,本题变量FL为为不同治疗时间的分组变量,如治疗前为不同治疗时间的分组变量,如治疗前为1,治,治疗后第疗后第2周为周为2,第,第6周为周为4。X为为BUN的测的测定值。建好结构录入数据,格式如图定值。建好结构录入数据,格式如图4-17所示,所示,数据集名为数据集名为L2, 存入存入SASUSER库中,备用。库中,备用。 如图所示:如图所示:
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号