资源预览内容
第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
亲,该文档总共4页全部预览完了,如果喜欢就下载吧!
资源描述
山东外语教学19 9 2年第3期(总第4 8期) 应用语言学定量研究中常用 的统计方法 刘成志孟悦 应用语言学(本文只涉及其狭义范畴 , 即第 二语言或外语学 习与教学)研究中 , 由于具有精 确和客观等特点 , 定量方法 正在得到愈来愈广 泛的应用(H e n n i ns , 1986) 。 然而 由于各种原因 , 我国许 多外语工作者对定量研究 方法 不 很熟 悉 , 尤其是对其使用的统计方法了解较少 , 结 果面对各式各样的表格往往不知所措 。 但随着研 究的深入 , 定量方法很可能成为应用语言学研 究的主要方法 , 统计方法的应用自然也会愈来 愈多 , 不熟悉它就有可能落伍 。 从高一点的角度 看 , 统计方法不过是用 一种特有的手段表达我 们并不陌生的思维方式 。 如果说在技术上娴熟地 掌 握它有相当难度的话 , 对其主要特点有一 个 大致了解还是不难做到的 。对 于从事应 用语言学 研究的人们来说 , 能较好地掌握统计方法 最好 , 做不到也可以在有关人员协助下进行研 究 , 但 无 论如 何 , 了解一点常用的统计方法的意 义是 十分必要的 。 应用语言学定量研究不外乎三种类型 : 对 现 状的总结性描述 , 对某些 现象整体与部分或 部分之 间差异的检验 、 以及对事物间相互关系 的密切程度的考察 。 与之相呼应的统计方法则是 描述统计方法 、 推 断统计 方法 、 相关分析 方法 (后者常常被看作是描述统计诸方法中的一种) 。 本文拟 对这三 类统计方法 作简单介绍 。 除表 3 外 , 文中的其他表格都是我们虚构的 。 一 、 对现状的总结性描述 在应用语言学定量研究文献中 , 常常会看 到 用数字对某些现象进行概括 。 这里使用的是统 计学中称作描述统 计( d e s e ri Pt iV e st at is tic s )方法 , 常见的有总数(一般用 N 表示) 、 均数(一般用 又表示) 、 百 分比 、 标准差(用 s 或 s D 表示) , 等 等 。 4 4 表 卜 不同性别 、 班级得分比较 学学 生又 sDDFTP P P 男男 7 4 . 30 9 . 275 2 3 . 47 0 . 01 1 1 女女 78 . 6 08 . 424 4 4 4 一一班 75 . 109 . 2 2491 . 3 1 0 . 20 0 0 二二班 7 6 . 3 08 . 68 47 7 7 均数是描述统计中一个最常用的指标 。 均数 在一般情况下是一组数据(称为分布)中最有代 表性的一个值 。 表 l 显示的是两个班级一次英语 测试所得的结果 。 其中两个班全体 男生均数为 又一7 4 . 3 , 女生贾一7 8 . 6 , 一班全体均数为又 7 5 . 1 , 二班为又7 6 . 3 。 也就是说 , 从平均水平 来看 , 女生 测验成绩高于 男生 , 二班高于一班 (对于这 些差 异的统计学 意 义 , 下 一部分将作讨 论) 。 1 1 1359 %34 13% 3413% ,35 9% 图 l 正态曲线下的面积 (以标准差为单位) 标准差是描述统计方法中另 一个十分重 要 的指标 , 它表示一个分布中所有的分数相对于 均数的离散程度 , 标准差愈大 , 分数之间差异 愈大 。 表 1 中 , 两个班全体女生得分的标准差 为 8 . 4 2 , 男生为9 . 27 , 一班为9 . 2 2 , 二班为8 . 68 , 表 明女生 之 间分数差 异小于男 生 , 二班 学 生分 数之间的差异小于 一班 。 标准差还有一个很重要 的用途 , 就 是在正态分布中可能表明某个分数 在全体分数中的相对位置 。 在正 态分布中 , 均数 加减一个标准差的范 围大约包括 了 全部分数的 68% , 均数加减两个标准差的范围内是9 6% , 3 个标准 差则是9 9 . 7 4 %(见 图 1) 。 如果一班某个 学生 得8 5分 , 比该班得分的均数高一 个标准差 左右 , 那么 , 从理论上讲该班约有8 4 %的学生 的成绩不及他高 。 二 、 检验差异 由表 1 我们知道 , 女生平均得分高于男生 , 二班高于一班 。 这是否就是定论呢?实践 中常常 有人这样认为;但从统计学角度来看 , 不一定如 此 。 统计学要求对差异进行严格检验 , 弄清它究 竟是反映 了 两者本质上的不 同 , 还是由于偶然 机遇(di f feren ee by ehan ee)造成 的 。 这也就是统计 学 中常常提到的显著性检验 (t e s t o f s ig n i f i c a ”c e ) , 它可以说是统计方法的精髓 。 根 据统计学的观点 , 显著性检验并非孤 立 地对两 组或两组以上的事物(统计学上称样本 , 即二mP l e )进行比较 , 而是通 过考察二者是否来 自同一整体(统计学 上称为总体 , 即 po Pu la tio n) 来进行的 。 如果来自同 一整体 , 它们之间就 不 会 有 显著差 异 ; 如 果有显著差 异则 表 明它们并非 来 自同一整体 , 在性质上是不 同的 。 一般用 P 表 示样本间显著差异的概率 , 常用的有 两 个标 准 , 即 P镇0 . 05和P簇0 . 01 。 当 p簇0 . 0 5 时 , 意味着 所考察的样本之间的差异 由偶然机遇造成的可 能性小于或等于 5% ; 当 P镇0 . 0 1 时 , 则 这种可 能性小于或等于 l% 。 这 就意味着 , 我们有相 当 大的把握说 , 这些 样本不属于同一总体 。 当 P 0 . 0 5 时 , 则很难确定差异不 是 由偶然机遇造成 的 , 我们也不能认为它们有根本的区别 。 t检验(t e s o是 显著性检验 中一 个 经常使用 的方法 , 其目的是通 过 两详本提供的信息推断 其代表的两 总体是 否吻合 。 如果两样本的均数无 显著差异 , 就意味着它们代表的总体没有差别 , 即它们来自同一总体 ; 反之则表明总体是 不 同 的 。 现在让我们再回过头来考察表 1 提供的情 况 。 用 t 检验对 男 、 女 生之间和 一 、 二班之间分数 的差异分别作检验(表 l 的右半部分) , 我 们可 以看到 , 男 、 女生之间的差 异 为 P 0 . 05) , 也就是说 , 两者的差异很有可能是偶 然机 遇造成的 。 表 中另外还有 自由度和 t 值两栏 . o 简 言之 , 自由度等于样本总数减 1 , t 值是观察到 的差异与同一 总体内不同样本因偶然机遇而 出 现的差异之比 , t 值愈大 , 差异愈大 。 计算中先 求 t 值 , 再根据自由度大 小从 有关表 中查 出 P 值即可 。 表 2 . 四个年级得分的方差分析 方差来源 组间 组内 总平方和 DF 均方 FP 6 2 . 22 320 . 74 4 . 510 . 01 597 . 69 973 . 83 t 检验只能比较两个样本之间的差 异 , 当样本超 过 两个时 , 则必须用其他方法 , 方差分析( an a ly - s i s o fv a ri nn c e)就 是 一个最常用的分析两个以上 样本之间差 异的方法 。 方差分析考察的是 不同样 本之间的方 差与各样本内部的方差的关系 。 如果 各样本来自同一 总体 , 不 同样本之间的方差与 各样本 内部的方差的差异应较小 , 不然则表明 它们不是来 自同一总体 , 总的说存在显著差异 。 表 2 提供的是我们假设的对四个班级的测验成 绩做方差分析的结果 。 表 中显示 , 四个班级之间 有显著差 异( P 0 . 0 1) 。 表中万差来源一栏 , 组 间方 差指不 同样本(这里即四个班级)之间的方 差 , 组 内方差指各样本(这里指各班级)内部的 方差 。 两者之间的比例即 F 值 , 其值愈大 , 样本 之间的方差与样本内部方差的差异就愈大 , 到 了一定界限(称为界值 , 即 e ritic a l value) , 我们 就有很大把握认为它们不 是来自同一个总体了 。 P 值根据 F 值和自由度可在有关表格中查到 。 三 、 检验相关关系 为了了解外语学习和教学的机制 , 应 用语 4 5 言学研究 , 常常探讨不同现象之间关系的密切 程度 , 如 学习方 法与学习成绩 , 词汇量与阅读 理解等等 。 考察不 同现象之间关系的性质和 强度 的相关分析 , 是应用语言学定量研究中经常使 用的统计方法 。 总起来说 , 有几种性质不同的相 关关系 。 当两个现象之间 , 一个现象的值大小和 另 一个现象的值的大小成正 比时 , 统计学 上称 二者之间存在正相关关系 , 如学习外语的兴趣 和学习外语的时间一般是正相关关系 。 当一方的 值的大小和 另一方无任何关系时 , 则 是零相关 关系 , 如学习外语的兴趣和肺活量不会有任何 关系 。 相关关系的第三种情况是负相关关系 , 即 一方的值大 , 另一方 的值就小 , 如 同词汇量大 小和查字典的次数之间就是负相关关系 。 一般用 相关系数( eor relat io neo e ff i ei ent)r 表示相关关系 的性质和强度 。 r 的正值 、 零 、 负值分别表示两个 现象之间的正 、 零和负相关关系 。 就强度来说 , 一般认为0 . 9 0 一1 . 0 0表示十分密切 , 0 . 7 0 一0 . 90 表示密切 , 0 . 4 0 一0 . 7 0表示较密切 , 0 . 2 0 一 0 . 4 0表示不大密切 , 低于 0 . 2 0表示不密切 。 表 3 . EPT 各个部分的相关系数人数 : 5 8 数分别为 r 一0 . 6 2和 r 一0 . 5 5 , 属较密切相关关 系 , 也就 是说语法 较好的 考生在一定程度上 综 语语语法结构 词汇与阅读 c lo z 。 听力写作总分 分 ( ( ( ( (l)(2)(3)(4)(5)(6) ) ) ( ( (l) ) ) 0 . 70 一一 ( ( (2) ) )0 . 620 . 66 一一 ( ( (3) ) ) 0 . 550 . 670 . 64 一一 ( ( (4) ) )0 . 08 0 . 2 50 . 210 . 17 一一 ( ( (5) ) ) 0 . 770 。 920 . 81 0 . 80 0 . 39 一一 ( ( (6) ) ) ) ) 表 3 是桂诗春先生根据中南地区部分考生 三次参加 E P r 考试结果 , 计算出的各测试 项目 之间的相关系数(桂诗春 , 19 88 , 2 32 ) 。 从表中可 以看到每一个 项目与另外各项目的相关系数 , 例如 : 语法结构与词汇阅读之间的相关系数为全 一0 . 70 , 和总分的相关系数为 r一 0 . 7 7 , 均属密 切 相关关系 , 表明语法掌握得好的考生词 汇量 一般较大 , 阅读能力一般 也较好 ; 总体能力也 是如此 。 语法结构和 c lo s ete st 以及听力的相关系 合判断能力(c lo s e te so 和 听力也较强 。 语法结构 和 写作之间却没有什么关系( r一0 . 08) 。 值得指 出的是 , 两个现象之间的相关关系不能理解为 因 果关系 。 虽然有时二者之间的确存在因果关 系 , 但在许多情况下是 另外的因素对二者共同 产生作用的结果 。 很显然 , 表 3 的各种相关关系 是属后一种情况 。 此外 , 相关关系也存在显著性 检验的间题 , 也就是说 , 我们必 须搞清这种关 系 是不是偶然机遇造成的 。 查表可知 , 对于自由 度为5 6 (对于相关系数自由度为样本总数减2 ) 的相关系数 , P镇0 . 0 1 时 , r 应等于或大于 0 . 3 5 , P毛0 . 0 5时 , r 应等于或大于 0 . 2 7 。 表 3 中 大多数相关系数大于 0 . 2 7 , 其中多数
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号