资源预览内容
第1页 / 共21页
第2页 / 共21页
第3页 / 共21页
第4页 / 共21页
第5页 / 共21页
第6页 / 共21页
第7页 / 共21页
第8页 / 共21页
第9页 / 共21页
第10页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
通俗理解T检验与F检验的区别1 , T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的 概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率 分布(probability distribution)进行比较,我们可以知道在多少的机 会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少, 亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有 信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲, 就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现, 出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧 合,也许是巧合,也许不是,但我们没能确定。F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分 布和t分布。统计显著性(sig )就是出现目前样本这结果的机率。2,统计学意义(P值或sig值) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。 专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能 认为样本中变量的关联是总体中各变量关联的可靠指标。P值是将观 察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中 变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量 间均无关联,我们重复类似实验,会发现约20个实验中有一个实验, 我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说 如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总 体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学 效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误 的边界水平。3,T检验和F检验至於具体要检定的内容,须看你是在做哪一个统计程序。举一个例子,比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差 别是否能推论至总体,代表总体的情况也是存在著差异呢? 会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本 的数值不同?为此,我们进行t检定,算出一个t检定值。与统计学家建立的以总体中没差别作基础的随机变量t分布进行 比较,看看在多少的机会(亦即显著性sig值)下会得到目前的结果。 若显著性sig值很少,比如0.05(少於5%机率),亦即是说,如果 总体真的没有差别,那麼就只有在机会很少(5%)、很罕有的情况 下,才会出现目前这样本的情况。虽然还是有5%机会出错 (1-0.05=5%),但我们还是可以比较有信心的说:目前样本中这 情况(男女生出现差异的情况)不是巧合,是具统计学意义的,总体 中男女生不存差异的虚无假设应予拒绝,简言之,总体应该存在著 差异。每一种统计方法的检定的内容都不相同,同样是t-检定,可能是上述 的检定总体中是否存在差异,也同能是检定总体中的单一值是否等於 0或者等於某一个数值。至於F-检定,方差分析(或译变异数分析,Analysis of Variance),它 的原理大致也是上面说的,但它是透过检视变量的方差而进行的。 它主要用于:均数差别的显著性检验、分离各有关因素并估计其对 总变异的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。4,T检验和F检验的关系t检验过程,是对两样本均数(mean)差别的显著性进行检验。惟t检验 须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方 差是否相等而有所不同。也就是说,t检验须视乎方差齐性(Equality of Variances)结果。所以,SPSS在进行t-test for Equality of Means的 同时,也要做Levenes Test for Equality of Variances。1.在Levenes Test for Equality of Variances栏中 F值为2.36, Sig. 为.128,表示方差齐性检验没有显著差异,即两方差齐(Equal Variances),故下面t检验的结果表中要看第一排的数据,亦即方差 齐的情况下的t检验的结果。2.在 t-test for Equality of Means 中,第一排(Variances=Equal)的情 况:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99 既然Sig=.000,亦即,两样本均数差别有显著性意义!3.到底看哪个 Levenes Test for Equality of Variances 一栏中 sig,还是 看 t-test for Equality of Means 中那个 Sig. (2-tailed)啊? 答案是:两个都要看。先看Levenes Test for Equality of Variances,如果方差齐性检验没有显著差异,即两方差齐(Equal Variances),故接著的t检验 的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结 果。反之,如果方差齐性检验有显著差异,即两方差不齐(Unequal Variances),故接著的t检验的结果表中要看第二排的数据,亦即方差 不齐的情况下的t检验的结果。4.你做的是T检验,为什么会有F值呢?就是因为要评估两个总体的方差(Variances )是否相等,要做 Levenes Test for Equality of Variances,要检验方差,故所以就有 F值。另一种解释:t检验有单样本t检验,配对t检验和两样本t检验。单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进 行比较,来观察此组样本与总体的差异性。配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受 试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处 理;3,同一受试对象处理前后。F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首 先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则 直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定 量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分 布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设 计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方 差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计 算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检 验方法。简单来说就是实用T检验是有条件的,其中之一就是要符合方差齐次 性,这点需要F检验来验证。1、问:自由度是什么?怎样确定? 答:(定义)构成样本统计量的独立的样本观测值的数目或自由变动 的样本观测值的数目。用df表示。自由度的设定是出于这样一个理由:在总体平均数未知时,用样本平 均数去计算离差(常用小s )会受到一个限制要计算标准差(小s ) 就必须先知道样本平均数,而样本平均数和n都知道的情况下,数据 的总和就是一个常数了。所以,“最后一个”样本数据就不可以变了, 因为它要是变,总和就变了,而这是不允许的。至于有的自由度是n 2什么的,都是同样道理。在计算作为估计量的统计量时,引进一个统计量就会失去一个自 由度。通俗点说,一个班上有50个人,我们知道他们语文成绩平均分为 80,现在只需要知道49个人的成绩就能推断出剩下那个人的成绩。 你可以随便报出49个人的成绩,但是最后一个人的你不能瞎说,因为 平均分已经固定下来了,自由度少一个了。简单点就好比你有一百块,这是固定的,已知的,假设你打算买 五件东西,那么前四件你可以随便买你想买的东西,只要还有钱的话, 比如说你可以吃KFC可以买笔,可以买衣服,这些花去的钱数目不等, 当你只剩2块钱时,或许你最多只能买一瓶可乐了,当然也可以买一 个肉松蛋卷,但无论怎么花,你都只有两块钱,而这在你花去98块那时就已经定下来了。 (这个例子举的真不错!)2、问:X方检验中自由度问题答:在正态分布检验中,这里的M (三个统计量)为N (总数)、平 均数和标准差。因为我们在做正态检验时,要使用到平均数和标准差以确定该正 态分布形态,此外,要计算出各个区间的理论次数,我们还需要使用 到N。所以在正态分布检验中,自由度为K - 3。(这一条比较特别,要 记住!)在总体分布的配合度检验中,自由度为K- 1o在交叉表的独立性检验和同质性检验中,自由度为(r- 1 )x( c- 1)o3、问:t检验和方差分析有何区别答:t检验适用于两个变量均数间的差异检验,多于两个变量间的均 数比较要用方差分析。用于比较均值的t检验可以分成三类,第一类是针对单组设计 定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成 组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究 对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t 检验,都必须在满足特定的前提条件下应用才是合理的。若是单组设计,必须给出一个标准值或总体均值,同时,提供一组 定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态 分布;若是配对设计,每对数据的差值必须服从正态分布;若是成 组设计,个体之间相互独立,两组资料均取自正态分布的总体,并 满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前 提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理 论依据的检验方法。值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即 正态性和方差齐性。t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理 定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因, 不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研 究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检 验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方 法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要 求,促成了 t检验的流行。但是,由于某些人对该方法理解得不全 面,导致在应用过程中出现不少问题,有些甚至是非常严重的错 误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以 下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验; 将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验 进行均值之间的两两比较。以上两种情况,均不同程度地增加了得 出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研 究实验因素之间的交互作用的大小。问:统计学意义(P值) 答:结果的统计学意义是结果真实程度(能够代表总体)的一种估计 方法。专业上,P值为结果可信程度的一个递减指标,P值越大,我 们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如 P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假 设总体中任意变量间均无关联,我们重复类似实验,会发现约20个 实验中有一个实验,我们所研究的变量关联将等于或强于我们的实 验结果。(这并不是说如果变量间存在关联,我们可得到5%或95% 次数的相同结果,当总体中的变量存在关联,重复研究和发现关联 的可能性与设计的统计学效力有关。)在许多研究领域,0.05的P值 通常被认为是可
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号