资源预览内容
第1页 / 共43页
第2页 / 共43页
第3页 / 共43页
第4页 / 共43页
第5页 / 共43页
第6页 / 共43页
第7页 / 共43页
第8页 / 共43页
第9页 / 共43页
第10页 / 共43页
亲,该文档总共43页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
实验经济学第五讲:假设检验杜宁华上海财经大学经济学院,经济学实验室 2008 年 3月1 采用什么办法进行假设检验与实验设置设计密 切相关。 前几讲在介绍完全随机设计、随机区组设计、拉丁方 和拉丁矩等各种设计方法时,都详细讨论了如何运用 该设计下的方差分析进行假设检验。 实验数据与生活中的实地数据的根本区别在于 数据的产生过程;而实验数据在处理过程中也 有其特殊性。 由于实验数据的样本容量比较小,进行非参数的检验 往往成为无法替代的选择。 2讨论的要点:关于均值的参数检验 关于方差和均值差的参数检验 非参数的检验方法3一、关于均值的参数检验4 考虑如下情形:我们得到了一个随机样本,其样 本容量为n, 且样本服从正态分布N(x , x2) ;分 布的方差x2已知,而分布的均值x未知。我们所 感兴趣的理论假设是x = 0 。相对应于零假设的 备择假设有如下三种形式: x 0. (实际均值仅可能高于0) x 0. (双侧检验) 5检验上面三种形式的被择假设所共用的检验统 计量为:令z为对应于标准正态分布的区间关键值。例 如, z0.05=1.65的含义是,对于服从标准正态分 布的随机变量Z而言,Z 1.65的概率为0.05。 由此得到显著水平为的Z检验的拒绝域:6H0H1Critical Regionx = 0x 0z zx = 0x 0|z| z/ 272.只有在方差已知的情况下,Z检验才是“恰当”的检 验方法。当方差未知,而样本仍服从正态分布时 ,关于均值的恰当的检验统计量为: 8对于T检验的拒绝域的描述与前面对Z检验的拒 绝域的描述类似,唯一的区别是标准正态分布 换成了t分布。例如,双侧被择假设x 0被接 受、零假设x = 0被拒绝的条件为: 9例:假设我们相信在某个对策环境中,某个特定的 纳什均衡解出现的概率为p。我们并不知道在实 际操作中p为多少,但理论中对p的预测为25% 。这里我们需要检验的零假设为p = 0.25,被择 假设为p 0.25。为了检验这一假设,我们征召 100组实验对象进行实验,观察在实验中纳什均 衡解是否出现。由此,我们得到100个服从伯努 利分布的、成功率为p的独立观察值。 10服从伯努利分布的随机变量的概率密度函数为 : f(x) = px(1 p)1 x , x = 0, 1根据中心极限定理,对p的估计量的极限分布为 正态分布:11假设我们根据观察值得到对p的估计量 = 0.2, 这也是对p的估计量的极限分布的均值的估计量 。同时,我们得到对p的估计量的极限分布的方 差的估计量,0.2*0.8/100 = 0.0016。由此,我 们可以构造出检验零假设的Z检验统计量,并将 该统计量与关键值相比较:我们无法在5%的显著水平下拒绝零假设。12二、关于方差和均值差的参数 检验13 我们从某个方差未知的正态分布中得到含有n个 观察值的随机样本。如果我们需要检验的零假 设为该分布的方差等于100,相应的备择假设为 双侧假设,那么在零假设为真的前提下会有 (n 1)S2/1002(n 1)。因此,我们可以通过比较 统计量S2与2(n 1)分布来检验零假设是否为真 。零假设的拒绝域为:或142.从两个独立的正态分布X和Y中我们分别 得到m和n个观察值。我们需要检验的零 假设是分布X和分布Y的方差相同,被择 假设为双侧假设。 (n 1)SX2/x2 2(n 1) 且 (m 1)SY2/Y2 2(m 1),在零假设为 真的前提下我们有x2 = Y2 ,因此SX2/SY2 F (n 1, m 1) 。153.从两个独立的正态分布X和Y中我们分别得到m 和n个观察值。假设我们已知两个分布的方差相 同,我们需要检验的零假设是分布X和分布Y的 均值相同,被择假设为双侧假设。为检验这一 假设,我们需要构造的统计量为::该统计量服从自由度为n + m 2的t分布。 164.当两个独立的正态分布X和Y的方差不相 同时,我们很难运用传统的方法检验这两 个分布的均值是否相同。(其原因是我们在构造统计量时无法直接剔 除方差的影响,这一问题被称作Behrens- Fisher问题。) 17检验这一假设的近似统计量为 该统计量近似服从自由度为n + m 2的t分布。 样本容量越大,该统计量的近似效果越好。当 样本容量足够大时,t检验可以被z检验替代。 当分布X和分布Y的方差为已知量X2和Y2时,我 们可以用X2和Y2替代Sx2和SY2 ,此时的统计量准 确服从自由度为n + m 2的t分布。18三、非参数检验方法Siegel and Castellan, 1988. Nonparametric Statistics for the Behavioral Sciences. 19 非参数统计检验的优势 在小样本的情况下,我们无法用正态分布描 述数据生成过程。非参数检验成了无法替代 的选择。 易于执行秩检验 运用非参数检验易于比较来自不同分布的均 值,非参数方法能够很好地解决前面提到的 Behrens-Fisher问题。 对统计量的构造直观 202.非参数检验的劣势 由于非参数检验不对样本的来源总体的分布 进行任何假设,其检验强度要低于参数检验 (即相同的显著水平下,非参数检验“取伪”的 可能性更大)。 213. 常用的非参数检验方法 2契合度检验 用于检验某样本是否服从某种特定的分布。 H0:样本服从概率密度函数为f的分布。 H1:其它情况。 22检验的统计量为: Oi:落入第i个类别的观察值的数量 Ei:当零假设为真时预期落入第i个类别的观 察值的数量 k:类别的数量 当显著水平为、且 2(k 1)时,零假 设被拒绝。23例: 某实验记录了n个实验参与者在多回合的重复对 策中的序列决策。 Period/ChoiceABCD125%10%50%15%225%40%25%10%350%40%0%10%40%60%20%20%24Yjk = G(X1jk,,Xnjk,),j=1,4,k=A,Dj:对策的回合k:实验参与者可能的选择Y:频率X1至Xn:描述实验参与者特征的向量 :参数向量现研究人员需要评价参数模型G()能否很好地 解释在实验中实验参与者在各回合做出各种不 同决策的频率。25用2契合度检验来回答这一问题: 估计参数模型。根据观察值X1Xn,Y得到参 数向量的点估计 。 根据估计量 和参数模型得到在各回合中所有实 验参与者总的选择各种决策的频率的估计值( 在这个例子中的“类别”,就是表中的各单元)。 最后,计算统计量并将其与分布2(15)相比较 。 26 统计量只是渐进服从2分布。 当数据量较小、特别是当实验者所划分的 每个类别内的观察值少于5个时,实验者 应适当合并类别以增加每个类别内的观察 值数量。 当类别数量和类别内的观察值数量都很少 时,该检验的结果可能会不准确。27 配对排列检验 相对实验中检验实验效果的有效检验。零假设:在不同实验条件下所观察到的实 验结果差异完全不是因为实验条件的变化 造成的。 28 研究人员希望了解A和B两种市场机制下 的平均交易价格有无显著差异。 独立地征召10组实验参与者共进行10次 实验,每次实验分别在A和B两种市场机 制下让实验参与者进行交易。 投掷硬币决定机制实施次序。 用H表示先A后B,用T表示先B后A。 29参与者(组) 机制A下的 交易价格PA 机制B下的 交易价格PB PB PA 1 (H)13.214.0.8 2 (H)8.28.8.6 3 (T)10.911.2.3 4 (H)14.314.2-.1 5 (T)10.711.81.1 6 (H)6.66.4-.2 7 (H)9.59.8.3 8 (H)10.811.3.5 9 (T)8.89.3.5 10 (H)13.313.6.3 Mean: 0.4130 如果零假设为真,则各组参与者调换实施机制A 和机制B的次序,所造成的交易价格差PB PA 的变化仅体现在正负符号上。 10组参与者一共有210 = 1024种实施实验的可 能。 对其它1023种可能的实施方案下的结果,在零 假设为真的前提下,如果某组参与者实施A和B 的次序与真实的实验次序一致,则预期的价格 差与真实的实验结果一致;如果实施A和B的次 序与真实的实验次序相反,则预期的价格差与 真实的实验结果符号相反。 31 1023种方案下的1023个预期平均价格差 就构成了零假设下的取样分布。 将实验中得到的平均价格差与其它的 1023个预期平均价格差相比较,实验者 就得到了实验所得平均价格差在配对排列 检验中的P值(P值是在零假设为真的前 提下,预期的平均价格差高于实验所得平 均价格差的机率)。 32 1023个预期平均价格差当中仅仅有3个预 期平均价格差高于0.41,仅仅有4个预期 平均价格差等于0.41。实验者所实施的配 对排列检验的P值为7/1024,约等于0.7% 。 实验效果非常显著,实验者应当拒绝零假 设。 33 由于配对排列检验运用样本中的全部信息,在 非参数检验方法中配对排列检验是检验强度较 高的检验方法。 缺点: 观察值的数量较大时该检验方法的计算负 担较繁重。 与配对排列检验方法类似、计算量又相对较小 的非参数检验方法是Wilcoxon符号秩检验,有 时该方法也被称作配对符号秩检验。 只考虑实验结果差异的符号、并不记录实验结果差异 的真实值。 34 中位数检验 中位数检验用于检验两个独立的样本是否 具有相同的中位数。 由于中位数检验不对两个独立样本背后的 分布作出很强的假设,该检验适用范围很 广。 35将两个独立样本合并、得到合并样本的中位数,然后构建下表: 样本I 样本II大于合并样本中位数的 观察值数量 AB小于合并样本中位数的 观察值的数量 CD观察值数量 mn36令观察值总量为N,N = m + n,则取样分 布的近似统计量为 中位数检验的零假设为两个独立样本的 中位数相同。在零假设为真的前提下,统 计量v服从分布2(1)。样本容量越大,统 计量v的近似效果越好。37 Wilcoxon-Mann-Whitney检验是与中位数 检验相类似的非参数检验方法。 Wilcoxon-Mann-Whitney检验的强度要高 于中位数检验的强度,但代价是 Wilcoxon-Mann-Whitney检验要作出更强 的假设,比如两个独立样本所服从的分布 的方差相同。 38 Jonckheere检验 假设实验者从k个独立的总体中得到k个数 据集,令第i个总体的中位数为i, Jonckheere检验可用于检验下面的假设:零假设H0:各总体的分布相同。 备择假设H1:各个总体的中位数不同, 其次序为1 k, 且至少有一个 不等式为严格不等式。39为进行Jonckheere检验,首先我们需要构 建下面的表格: 数据集1(中 位数最小的数 据集) 数据集2(中 位数次小的数 据集) 数据集k(中 位数最大的数 据集) X(1,1)X(1,2)X(1,k) X(2,1)X(2,2)X(2,k) X(n1,1)X(n2,2)X(nk,k) 表中各列由小到大排序 40Jonckheere检验的统计量J*: 对表中前k1列中的每一个观察值X(i,j),构造 与其相对应的N(i,j)。N(i,j)是第j+1列至第k列 中所有大于X(i,j)的观察值的数量。 将J定义为所有N(i,j)的和,j k1。41 在零假设为真的前提下(各总体的分布相同 ),统计量J的取样分布的
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号