资源预览内容
第1页 / 共18页
第2页 / 共18页
第3页 / 共18页
第4页 / 共18页
第5页 / 共18页
第6页 / 共18页
第7页 / 共18页
第8页 / 共18页
第9页 / 共18页
第10页 / 共18页
亲,该文档总共18页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
读书之法 ,在循序而渐进 ,熟读而精思心理测量学知识复习概要第一节概 述(324)第一单元测量与测量量表(324)一、什么是测量对测量的描述正确的是,测量就是依据一定的法则用数字对事物加以确定 。测量的 元素 包括:法则;数字;事物。测量所用数字具有自然数的特点,即具有:区分性;等级性;等距性;可加性。二、测量要素任何测量都应该具备的要素是:参照点;单位。(一)参照点:参照点就是确定事物的量时,计算的起点 。参照点有两种,即:绝对零点;相对零点。参照绝对零点可加减乘除,参照相对零点只能加减(心理测量参照相对零点)。(二)单位:好的单位必须具备两个条件:确定的意义;相同的价值。心理现象既没有确定的意义,也没有相同的价值。心理测验的结果是有误差的,要用区间来解释,而不是用点来解释。三、测量量表定义:在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。斯蒂文斯( S.S.Stevens )将测量从低级到高级分成4种水平:命名量表;顺序量表;等距量表;等比量表。(一)命名量表:是测量水平最低的量表形式,只是用数字来代表事物或把事务归类。用1 代表男,用2代表女等等,这样的量表通常叫命名 量表。(二)顺序量表:比命名量表水平高,数字不仅指明类别,同时指明类别的大小或属性程度。我们通常将学生的考试结果按名次排队,这些名次属于顺序 变量。在顺序量表中,变量具有等级 。(三)等距量表:比顺序量表进一步,有相等的单位,其数值可以相互做加减 运算;但没有绝对零点,因此不能做乘除运算。0并不意味着没有温度,这种说法对 。(四)等比量表:最高水平量表,有相等单位又有绝对零点,所得的数字可以做加减乘除运算。其数值可以进行加、减、乘、除运算的量表是等比变量 。一般说来,心理测量是在顺序量表 上进行的,主要用于分等级和排序。斯蒂文斯的4 种量表(水平从低到高)水平量表属性可进行大小关系相等单位绝对零点1 命名量表无无无标记和分类2 顺序量表有无无分等级和排序3 等距量表有有无加减运算4 等比量表有有有加减乘除运算精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思第二单元心理测验的基本概念(327)一、心理测验的定义正确的说法是,心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。二、心理测验的性质心理测验具有独特的性质,即具有:间接性;相对性;客观性。相对性 属于心理测验的重要性质。影响心理测量客观性的要素是:测验刺激的客观性;对反应的量化的客观性;对测验结果的推论的客观性。测验的客观性不包括绝对的标准 的客观性。第三单元心理测验的分类(328)一、按测验的功能分类按测验的功能进行分类,可将测验分为:智力测验;特殊能力测验;人格测验。二、按测验材料的性质分类按测验材料的性质分类,可将测验分为:文字测验;操作测验。三、按测验材料的严谨程度分类按测验材料的严谨程度分类,可将测验分为:客观测验;投射测验。刺激没有明确意义,对被试反应没有明确规定的心理测验,称之为投射测验 。投射测验的主要特点是刺激材料的意义是不明确的。四、按测验的方式分类按测验的方式分类,可将测验分为:个别测验;团体测验。团体测验始于第一次世界大战,陆军甲种和乙种智力测验是第一个团体测验。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思五、按测验的要求分类按测验的要求分类,可将测验分为:最高作为测验;典型行为测验。心理测验的分类分类原则测验种类测验实例按功能分类智力测验特殊能力测验人格测验比内一西蒙智力测验;斯坦福一比内智力量表;韦氏儿童成人智力量表升学、职业指导,特殊工种人员筛选,临床较少MMPI 、16PF、EPQ 、罗夏、 主题统觉 (TAT ) (0308-3-191 )按材料性质分类文字测验操作测验MMPI 、EPQ 、16PF、韦氏智力量表中的言语量表罗夏、 TAT 、瑞文测验、韦氏智力量表中的操作量表按材料严谨程度分类客观测验投射测验绝大多数心理测验均属此类罗夏、主题统觉、自由联想、句子完成按方式分类个别测验团体测验比内一西蒙智力量表;韦氏智力量表;不能用于团体陆军甲种乙种测验;教育成就测验;团体测验可个别实施,如 MMPI 、EPQ 、16PF等按要求分类最高作为测验典型行为测验智力测验、成就测验均属最高作为测验各种人格测验均属典型行为测验第四单元纠正错误的测验观(330)一、错误的测验观错误的测验观包括:测验万能论;测验无用论;心理测验即智力测验。错误的测验观不包括“以上一个也不是” 。二、正确的测验观正确的测验观包括(习题 137) :心理测验是重要的心理学研究方法之一,是决策的辅助工具;心理测验作为研究方法和测量工具尚不完善。第五单元心理测验在心理咨询中的应用(331)我国目前心理门诊中运用较多的心理测验有:智力测验;人格测验;心理评定量表。一、智力测验我国修订后的韦氏智力量表包括:WAIS-RC ; C-WISC ; C-WYCS1 。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思二、人格测验三、心理评定量表第六单元心理测验的发展史(332)一、科学心理测验的产生与发展英国生物学家和心理学家高尔登 (F.Galton )的主要贡献有:提出人的不同气质特点和智能是按身体特点的不同而遗传的;为了研究差异的遗传性,设计了测量差异的方法;为心理测验奠定了统计学基础,第一个提出了相关的概念。美国心理学家卡特尔 (J.M.Cattell)对促进心理测验发展做出的巨大贡献是:使心理测验首次出现于心理学文献中;认为心理学应立足于实验和测验;认为心理测验应有统一的标准。比内 (A.Binet )编制了世界上第一个正式的心理测验。20 世纪以后,心理测验在如下几方面取得了长足发展:操作测验;团体智力测验;能力倾向测验;人格测验。20 世纪在智力测验方面的新发展是研发了:罗夏测验;团体测验;操作测验;投射测验(P335) 。有关心理测验的发展史,正确的描述是中国的科举制度是世界上较早的心理测验的实践。二、现代心理测验在我国的发展近些年来,我国心理学家正在致力于心理测验的本土化研 究。第二节测验的常模(335)第一单元常模团体(335)一、常模团体的性质常模团体 是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。常模团体的选择一般包括:确定一般总体;确定目标总体;确定样本。二、常模团体的条件常模团体的条件包括:群体构成的明确界定;对群体具有代表性;样本量大小要适当;具有新近性(标准化样组是一定时空的产物)。抽样方法 不是常模团体的条件。(一)群体的构成必须明确界定(二)常模团体必须是所测群体的代表性样本(三)样本大小要适当实际工作中,样本量大小适当须从如下几方面考虑:经济;实用;减少误差。常模样本量的大小,一般最低不小于30 或 100。全国性常模,样本量一般要在2000 3000 之间。样本大小适当的关键是样本要有代表性 。(四)标准化样组是一定时空的产物三、取样的方法抽样的方法一般有:简单随机抽样;系统抽样;分组抽样;分层抽样。取样是指从 目标人群 中选择有代表性的样本。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思随机号码表法是简单随机抽样。系统抽样要求:目标总体无序可排;无等级结构存在。系统抽样法的关键是计算组距 。先将群体分组,再在组内进行随机取样的方法是分组抽样 。四、常模分数与常模(一)常模分数定义:常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数 。常模分数又叫 导出分数 。导出分数的特性:与原始分数等值;具有意义;等单位;具有参照点。(二)常模常模分数构成的分布,就是通常所说的常模 ,它是解释心理测验分数的基础。对于某些特殊的群体来说,情况很具体而特殊,我们就需要制定特殊常模 。常模表示一种最简单、最基本的且常用的呈现常模资料的方法。它的构成要素为:原始分数;导出分数;对常模团体的有关具体描述。第二单元常模的类型(339)一、发展常模发展常模就是 年龄量表 。在 年龄 量表中,个人的分数指出了他的行为在按正常途径发展方面处于什么样的发展水平。(一)发展顺序量表发展顺序量表可以告诉人们某儿童的发育与其年龄相比:超前;滞后;正常。最早的一个发展顺序量表的范例是葛塞尔 发展程序表。葛塞尔发展程序表,其中按月份显示儿童在如下几方面的大致发展水平:运动水平; 适应性; 语言。社会性。按照葛塞尔研究的婴儿行为变化的顺序,16 周的婴儿能使头保持平衡。皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展,尤其注重某些特殊概念的形成,其中最著名的工作就是对 守恒 概念的研究。皮亚杰发现,儿童在不同时期出现不同的守恒概念,通常儿童到5 岁时才会理解质量守恒;6 岁时才会掌握重量守恒;7 岁时才具有容量守恒概念。发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地改变。所以,它的基本要素是:一组可以区分不同年龄组的题目;一个常模团体;常模表。最直观的发展常摸是发展顺序量表。(二)智力年龄比内一西蒙 量表中首先使用智力年龄的概念。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫 智力年龄 ,简称 智龄 。在吴天敏修订的比内一西蒙量表中,某儿童通过了 4 岁组的全部题目,5 岁组通过3 题, 6 岁组通过2 题,7 岁组通过1 题,其智龄为5 岁。用陆志韦修订的比内西蒙量表做测验,某儿童6 岁组题目全部通过,7 岁组通过 4 题, 8 岁组通过3 题, 9 岁组通过2 题,其智龄为7 岁 6 个月 。(三)年级当量精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思常模样本中6 年级的算术平均分为35,某儿童在算术测验中得35 分,那就是说,该儿童的算术年级当量是 6 年级水平 。二、百分位常模百分位常模包括:百分等级;百分点;四分位数;十分位数。(一)百分等级一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。55 的百分等级表示在常模样本中有55的人比这个分数低。王红在 30 名同学中物理成绩是 80 分,排列第五名,则其百分等级为85。(二)百分点在分数量表上,相对于某一百分等级的分数点就叫百分点 或 百分位数 。高考的最高分为650,其百分等级为100,最低分为105 分,百分等级为1,要录取20的学生进入大学,百分等级为80 的百分位数540。(三)四分位数和十分位数四分位数是将量表分成四等份,相当于百分等级的25 、50和 75对应的三个百分数分成的四段。十分位数1 10 为第一段。三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。常见的标准分数有Z分数和: Z分数; T 分数;标准九分数;离差智商。标准分数可以通过线性转换 和 非线性转换 得到。(一)线性转换的标准分数Z( XX) /SD 式中 SD 为样本标准差 。X为任一原始分数,X为样本平均数。ZABZ 式中 Z 为转换后的标准分数,A 、 B 为根据需要指定的常数。加上一个常数是为了去掉负值 ,乘以一个常数是为了使单位变小从而去掉小数点。(二)非线性转换的标准分数当原始分数不是常态分布时,也可以使之常态化,这一转换过程是非线性的 。常态化 过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。当以 50 为平均数,以10 为标准差来表示时,通常叫T 分数 。最早使用T分数者是 麦柯尔 。 注:未见教材中描述。标准九分是一种标准分数系统,其量表是个9 级的分数量表。它是以5 为平均数,以2 为标准差的一个量表。标准十分,平均数为5,标准差为1.5 。标准二十分,平均数为10 ,标准差为3 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思。常用标准分数标准分数平均数标准差分数样本平均数样本标准差SD 分数50 10 标准九分5 2 标准十分5.5 1.5 标准二十分10 3 离差智商100 15 (韦氏)四、智商及其意义若儿童的心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在实践中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄 儿童间的可比性。(一)比率智商比率智商( IQ)被定义为 心理年龄 与实足年龄之比。比率智商的计算公式是IQ( MA CA ) 100。不符合比率智商含义的说法是:心理年龄除以实足年龄所得的商数;实足年龄除以心理年龄所得的商数;被试成绩与平均数之差除以标准差所得的商数;被试成绩除以标准差所得的商数。由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄不同步 增长,所以比率智商并不适合于年龄较大的被试者。(二)离差智商韦克斯勒将离差智商的平均数定为100,标准差定为15。离差智商的优点是:建立在统计学的基础之上;表示的是个体智力在年龄组中所处的位置;表示的是智力高低的一种理想的指标。离差智商 表示的是个体智力在年龄组中所处的位置。IQ100 十 15Z 100 十 15(XX) SD是离差智商 的计算公式。从不同测验获得的离差智商只有当标准差 相同或接近时才可以比较。两种智商及其计算公式智商计算公式比 率 智 商IQ( MA CA ) 100离差智商(韦氏)IQ100 十 15(XX) SD第三单元常模分数的表示方法(345)一、转换表法最简单而且最基本的表示常模的方法就是转换表 ,有时也叫常模表。测验的使用者利用转换表 可将原始分数转换为与其对应的导出分数,从而对测验的分数做出有意义的解释。二、剖面图法剖面图 是将测验分数的转换关系用图形表示出来,从而可以很直观地看出被试者在各个分测验上的表现及其相对的位置。第三节测验的信度(348)精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思第一单元信度的概念(348)一、信度的定义信度 是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。信度只受 随机误差 的影响。在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率,即rxxST2/ Sx2。二、信度的指标(一)信度系数与信度指数公式rxxrxT2ST2Sx2和公式rxTSrSx 表明信度指数的平方 就是信度系数。(二)测量标准误SE Sxxxr-1公式中SE 为测量的标准误,Sx 是所得分数的标准差,rxx为测验的信度系数。从公式中可以看出,测量的标准误与信度之间的关系是:信度越低,标准误越大;信度越高,标准误越小。第二单元信度评估的方法(349)估计信度的方法一般有:重测信度;复本信度;内部一致性信度;评分者信度。一、重测信度使用同一测验, 在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫重测信度 ,又称 稳定性系数 。用重测法估计信度,最适宜的时距随测验的目的、性质和被试者的特点而异,一般是24 周较宜,间隔时间最好不超过6 个月。二、复本信度复本信度又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在内容 上的等值性。如果复本信度考虑到两个复本实施的时间间隔,并且两个复本的施测相隔一段时间,则称:重测复本信度;稳定与等值系数。复本信度的缺点有:如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题;对于许多测验来说,建立复本是十分困难的。三、内部一致性信度(一)分半信度分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验 内容取样的一致程度。斯皮尔曼一布朗公式rxx2rhh/(1rhh) 式中rhh为一半分数 的相关系数,rxx为测验在原长度时的信度估计值。(二)同质性信度同质性信度主要代表测验内部所有题目 间的一致性。KR20公式、 KR21公式有别于克伦巴赫 a 系数的是,它们只能用于是非题 。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思四、评分者信度一般要求在成对的受过训练的评分者之间平均一致性达到0.90 以上,才认为评分是客观的正确的描述是:随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度;所有题目看起来好像测量同一特质,但相关很低或为负相关时,则测验为异质的;人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化;不同的信度反映测验误差的不同来源。第三单元信度与测验分数的解释(352)一、解释真实分数与实得分数的相关rxx 为信度系数。下列情况属于极端情况:rxx0;rxx1.00 。二、确定信度可以接受的水平确定可以接受的信度水平的一般原则是,当rxx 0.70 时,测验不能用于对个人做出评价或预测,而且不能作团体比较。0.70 rxx0.85 时,可用于团体比较;rxx0.85 可用于个人和团体三、解释个人分数的意义信度系数在解释个人分数的意义时的作用是:估计真实分数的范围;了解实得分数再测时可能的变化情形。“大约有 95 的可能性真分数落在所得分数1.96SE 的范围内,或有 5的可能性落在范围之外”的描述,其置信区间为X1.96SE XT X1.96SE 。四、比较不同测验分数的差异甲被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100 为平均数, 15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87 和 0.88 ,那么甲被试的操作智商不显著高 于言语智商。第四单元影响信度的因素(354)一、样本特征一般而言,若获得信度的取样团体较为异质的话,往往会高估 测验的信度。二、测验长度一般来说,在一个测验中增加同质的题目,可以使信度提高。下列描述中正确的是:测验越长,测验的测题取样或内容取样就越有代表性;测验越长,被试者受猜测因素的影响就越小;测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。一个包括 40个题目的测验信度为 0.80 ,欲将信度提高到 0.90 ,通过斯皮尔曼一布朗公式的导出公式计算出至少应增加50 个题数。 教材( P355)和习题74 均错: K=0.9(1-0.8)/0.8(1-0.9 )=2.25,即要取得0.9 的信度,测验长度应为原来的2.25 倍(而不是2.5 倍) ,即需增加402.25 40=50,习题 74 的正确选择应为 (姜长青)。三、测验难度对于不同平均能力水平的团体,题目的难度 会影响信度系数。洛德( Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,0.70 ;四择一测题,0.74 ;三择一测题,0.77 ;二择一题,0.85 。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思四、时间间隔以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大。第四节测验的效度(357)第一单元效度的概念(357)一、效度的定义在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的 准确性 。在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率。二、效度的性质效度具有两个性质:相对性;连续性。效度具有相对性,因此,在评鉴测验的效度时,必须考虑测验的目的 与功能 。 专栏 5-4 信度和效度的关系信度与效度的关系可表述为:信度是效度的必要而非充分条件;效度是受信度制约的。第二单元效度评估的方法(359)美国心理学会在1974 年发行的教育与心理测量之标准一书中将效度分为几个大类:即:内容效度;构想效度;效标效度。一、内容效度(一)什么是内容效度内容效度 指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。(二)内容效度的评估方法内容效度的评估方法有:专家判断法;统计分析法;经验推测法。1专家判断法专家判断法,就是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。 如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。因此, 内容效度有时又称逻辑效度 。为了使内容效度的确定过程更为客观,弥补不同专家对同一测验的判断可能不一致,可采用的步骤是:定义好测验内容的总体范围;编制双向细目表;制定评定量表来测量测验的整个效度。2统计分析法除了描述性语言外,内容效度的确定也可采用一些统计分析方法,如:计算两个评分者一致性;复本相关;再测法。3经验推测法(三)内容效度的特性在编制测验时,效度是重要的要考虑的特性。如果是编制最高行为测验,除了内容效度,也要求有较高的表面效度 。相反,典型行为测验却要求较低的表面效度。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思二、构想效度(一)什么是构想效度构想效度是: 构思效度 (结构效度) ;主要涉及的是心理学的理论概念问题;指测验能够测量到理论上的构想或特质的程度;测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。(二)构想效度的估计方法构想效度的估计方法包括:对测验本身的分析;测验间的相互比较;效标效度的研究证明;实验法和观察法证实。1对测验本身的分析可以作为构思效度证据的有:测验的内容效度;测验的内部一致性指标;分析被试者对题目的反应特点。2测验间的相互比较可以作为构思效度的测验间比较的有:相容效度;区分效度;因素分析法。计算两种测验之间得分的相关,其中一种测验是待研究效度的,另一种是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。这种方法叫 相容效度 。3效标效度的研究证明4实验法和观察法证实三、效标效度(一)什么是效标效度又称实证效度。效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。它可分为:同时效度;预测效度。在检验一个测验的效标效度时,难点在于找到合适的效标。因此效标的选择至关重要,一个好的效标必须具备如下条件:效标必须能最有效地反映测验的目标,即效标测量本身必须有效;效标必须具有较高的信度,稳定可靠,不随时间等因素而变化;效标可以客观地加以测量,可用数据或等级来表示;效标测量的方法简单,省时省力,经济实用。(二)效标效度的评估方法效标效度的主要评估方法有:命中率法;区分法;相关法。1相关法相关法是求测验分数与效标资料间的相关,这一相关系数称为效度系数。根据变量的不同,可选用的计算方法有:积差相关法;点二列相关公式;二列相关公式;贾斯朋(Juspen )多系列相关公式。2区分法区分法 是检验测验分数能否有效地区分由效标所定义的团体的一种方法。3命中率法命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。命中的情况是指:预测成功而且实际也成功;预测失败且实际上也失败。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 11 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思第三单元效度的功能(365)一、预测误差效度系数的实际意义常常以决定系数来表示,如测验的效度是 0.80 ,则测验的总方差中有64的方差是测验分数的方差。如果某测验的效度是0.70 ,则在测验中无法作出正确预测的比例是0.51 。Sest Sy)-(12xyr中,rxy2代表效度系数的平方,即决定系数 ,Sy为效标成绩的标准差。二、预测效标分散Y a + bxy式中 Y是预测的效标分数三、预测效标指数预测效率指数 E 值的大小表明使用测验比盲目猜测能减少多少误差。如一个测验的效度系数为 0.80 ,E40,这表明由于该测验的使用,使得我们在估计被试者的效标分数时减少了40 的误差。第四单元影响效度的因素(366)一、测验本身的因素要保证测验具有较高效度,测验本身的因素要做到:测验材料必须对整个内容具有代表性;测题设计时应尽量避免容易引起误差的题型(如是非题);测题难度要适中,具有较高的区分度;测验长度要恰当,测题的排列应先易后难。二、测验实施中的干扰因素测验实施中的干扰因素包括:主试者的影响因素;测验情境; 其他干扰因素;被试者的影响因素。三、样本团体的性质(一)样本团体的异质性如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低 。(二)干涉变量样本团体的性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的特征。由于这些特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特征为干涉变量 。美国心理学家吉赛利(E.E.Ghiselli)提出了如何找出干涉变量的一套方法,它们是: 用回归方程求得每个人的预测效标分数,将该分数与实际效标分数相比较,获得差异分数D。如果 D的绝对值很大,说明测验中可能存在干涉变量; 根据样本团体的组成分析,找出对照组,分别计算效度,从而找出干涉变量; 对于欲测团体, 根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。对于预测性高的团体,获得的测验效度会有所提高。四、效标的性质效标与测验分数之间的相关,用皮尔逊积差相关系数的前提是假设两个变量的关系是线性 的分布。效标测量本身的可靠性如何亦是值得考虑的一个问题。效标测量的可靠性即效标测量的信度 。第五节项目分析(368)一般来说,测验的项目分析包括定性 分析和 定量 分析。项目的定性分析包括考虑项目的内容效度,题目编写的恰当性 和有效性 等。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思第一单元项目的难度(368)一、定义难度是指项目的难易程度。用P代表。 P值越 大,难度越低。在能力测验中通常反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标称通俗性 。在 200 个学生中,答对某项目的人数为120 人,则该项目的难度为0.6 。二、计算方法(一)二分法记分的项目计算项目难度的公式如下:PR/N100; P( PHPL)/2 ; P X/Xmax100。在 370 名被试者中, 选为高分组和低分组的被试者各有100 人,其中高分组有70 人答对第1 题,低分组有40 人答对第1 题,则第 1 题的难度为0.55 。吉尔福特为了平衡机遇对难度的影响,提出的难度校正公式是Cp( KP-1 ) /(K-1 ) 。(二)非二分记分的项目数学测验的第7 题满分为15 分,该题考生的平均得分为9.6 分,则该题的难度为0.64 。三、难度水平的确定(一)项目的难度难度 P值越接近于0 或接近于1,越无法区分被试者之间能力的差异。相反,P值越接近于0.50 ,区别力越高。为了使测验具有更大的区别力,应选择难度在0.50 左右的试题比较合适,各题难度应在0.50 0.20 之间。(二)测验的难度第二单元项目的区分度(370)一、定义项目 区分度 也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。二、计算方法(一)鉴别指数鉴别指数的计算步骤为(2-1-3-4 ) : (1)确定高分组与低分组,每一组取答卷总数的27; (2)按测验总分高低排列答卷; (3)分别计算高分组与低分组在该项目上的通过率或得分率;(4)按下列公式估计出项目的鉴别指数: DPHPL。1965 年,美国测验专家伊贝尔(L.Ebel )根据长期的经验提出用鉴别指数评价项目性能的标准,鉴别指数D为 0.19 以下 ,说明该项目差,必须淘汰。(二)相关法计算区分度最常用的方法是相关法,常用的相关法有:点二列相关;二列相关;相关;积差相关。1点二列相关:点二列相关 适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。2二列相关:二列相关 适用于两个连续变量,但其中一个变量被人为分成两类的相关计算。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思3 相关法: 相关 适用于两个变量均为二分称名变量的相关计算。三、区分度与难度的关系难度与区分度的关系,一般来说,较难的项目对高水平的被试者区分度高,中等难度的项目对中等水平的被试者区分度高。项目难度的分布一般以常态 分布为好,这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对被试者具有较高的区分能力。第六节测验编制的一般程序(373)第一单元测验的目标分析(373)一、测验的对象在编制测验前首先要明确测量的对象,也就是该测验编成后要用于哪些团体。只有对受测者的如下几方面心中有数,编制测验时才能有的放矢:年龄;受教育程度;社会经济水平;阅读水平。二、测验的用途测验用途不同,编制测验时的取材范围以及试题难度等也不尽相同。在测验编制前就应明确所编出的测验是要对被试者做:描述;诊断;选拔;预测。(一)显示性测验显示性测验是指测验题目和所要测量的心理特征相似的测验。古德纳夫曾经将其分为样本测验 和标记测验。(二)预测性测验三、测验的目标心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。心理测验的目标分析以测验不同而异,一般可分为:工作分析;对特定概念下定义;确定测验的具体内容。对于选拔和预测功用的预测性测验,它的主要任务就是要对所预测的行为活动作具体分析,我们称之为任务分析或工作分析(job analysis) 。这种分析包括如下步骤:确定哪些心理特征和行为可以使要预测的活动达到成功;建立衡量被试者是否成功的标准,这个标准我们称之为效标。第二单元测题的编写(375)一、搜集资料心理测验题目的来源应该排除直接翻译国外测验的题目。题目来源分为三方面:已出版的标准测验;理论和专家的经验;临床观察和记录。二、命题的一般原则心理测验命题的一般原则可以从几方面来考虑:内容;文字;理解;社会敏感性。(一)内容方面心理测验命题在内容方面的主要要求是:内容符合测验的目的;避免贪多而乱出题;内容取样要有代表性;题目间内容相互独立。(二)文字方面精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思心理测验命题在文字方面的主要要求是:使用准确的当代语言;语句简明扼要;排除与答案无关的因素;最好是一句话说明一个概念。(三)理解方面心理测验命题在理解方面的主要要求是:有确切的答案;除创造力测验和人格测验外不应具有引起争议的可能;内容不要超出受测团体的知识水平和理解能力;格式要不被人误解。(四)社会敏感性方面有些测验必须涉及一些社会敏感性问题,菲力普(Phillips,D.L)列举了值得参考的几个策略:命题时假定被试者具有某种行为;命题时假定规范不一致;指出该行为是常见的,虽然是违规的。三、测题的编制要领(一)选择题选择题要编好题干,也要编好选项,必须注意:题干问题明确,避免与选项用词一致;选项简明扼要,长度相等;每题只给一个正确答案;选项最好用同一形式。(二)是非题编制是非题应注意:内容以有意义的概念、事实或基本原则为基础;每道题只能包舍一个概念;尽量避兔否定的叙述,尤其是双重否定;“是”、 “非”题的数目应基本相等,随机排列。(三)简答题编制简答题的原则包括:宜用问句形式;填充形式的空格不宜太多;每题应只有一个正确答案。编制简答题的原则不包括将其操作化 。(四)操作题编制操作测验的原则有:明确所要测量的目标,并将其操作化;尽量选择真实性程度较高的项目;指导语要简明扼要;制订评分标准,确定计分方法。第三单元测验的编排和组织(378)一、合成测验(一)选择与审定试题1选择试题的形式在选择题目形式时,需要考虑:测验的目的;材料的性质;接受测验的团体的特点;各种实际因素。2审定题目审定试题要注意题目的:范围应与测验计划的双向细目表相一致;数量要比最后所需的数目多一倍至几倍;难度必须符合测验目的的需要;说明必须清楚明白。(二)测题的编排测验编排的一般原则应排除答案混合排列。测验编排的一般原则包括:难度逐步上升,先易后难;将同类型的测题组合在一起;依各种类型测题本身的特点编排题目与选项。测题常见的排列方式有:并列直进式;混合螺旋式。二、预测与项目分析精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思预测应注意:对象应取自将来正式测验准备应用的群体;实施过程与情境应力求与将来正式测验时的情况相近似;时限可稍宽一些,最好使每个被试者都能将题目做完;预测过程中,随时记录被试者的反应情形。三、信度和效度考察四、常模制订五、编写指导手册测验指导手册的内容有:测验的目的和功用;编制的理论背景,选材的原则、方法;实施测验的说明,测验的标准答案和记分标准;测验的心理计量学特征、常模资料。第七节心理测验的使用(382)第一单元主试的资格(382)一、知识结构主试者的知识结构是指开展心理测验工作所必须具备的:心理学基础知识;心理学专业理论知识;本行业的专业知识;心理测验专业技能。二、专业理论知识和专业技能(一)专业理论知识主试者的心理测验专业理论知识,具体言之,包括:对心理测验的特点、性质和作用的认识;对心理测验局限性的认识;了解测验的基本特征;熟悉保证心理测验标准化的必要性。(二)专业技能主试者必须具有实际操作心理测验的专业技能和经验,接受严格、系统的心理测验专业训练,熟悉有关测验的如下方面:内容;适用范围;测验程序;记分方法。三、职业道德主试者的职业道德包括:测验的保密;测验的控制使用;测验中个人隐私的保护。心理测验的保密涉及到:测验内容;测验结果;个人隐私。第二单元测验的选择(383)选择测验必须注意,所选测验必须:适合测量的目的;符合心理测量学的要求。一、所选测验必须适合测量的目的二、所选测验必须符合心理测量学的要求第三单元测验前的准备及注意事顶(384)一、测验的准备工作测验前的准备工作主要包括:预告测验; 准备测验材料;熟悉测验指导语;熟悉测验的具体程序。二、测验中主试的职责测验中主试者的职责是指:应按照指导语的要求实施测验;测验前不讲太多无关的话;主试者不应对被试者的反应做出任何暗示性反应;对特殊问题要有心理准备。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 16 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思三、建立协调关系在心理测验实施中,主试者和被试者之间建立了一种友好的、合作的、能促使被试者最大限度地做好测验的关系,叫 协调 关系。第四单元测验实施的程序及要素(385)一、指导语测验指导语一般组成为:如何选择反应形式;如何记录这些反应;时间限制;给例题,有时告知被试者测验目的。二、时限一般来说,心理测验除典型行为测验以外,都有时限。三、测验的环境条件对于测验的环境条件:必须完全遵从测验手册的要求;记录下任何意外的测验环境因素;在解释测验结果时也必须考虑这一因素。安排测验材料不是对测验环境条件的要求。第五单元被试误差及控制方法(386)一、应试技巧与练习效应(一)应试技巧被试者对测验的经验或应试技巧会影响测验成绩,“测验油子” 的表现有: 能觉察出正确答案与错误答案的细小差别;懂得合理分配测验时间;常常是各种题型都见过;熟悉测验的程序。(二)练习效应受练习效应影响较大的情况,具体表现为:智力较高者;重复实施相同的测验;着重速度的测验。二、动机与焦虑因素(一)应试动机受应试动机影响不太大的测验是投射 测验。(二)测验焦虑适度的焦虑 会提高智力测验、成就测验和能力倾向测验的成绩。研究表明,如下者,测验焦虑较高:对自己能力没有把握;抱负水平过高,求胜心切;缺乏自信、患得患失、情绪不稳定;测验成绩关系重大,压力过大。三、反应定势反应定势 是指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试者得到不同的测验分数。作测验时,几种常见的反应定势有:求“快”与求“精确”;喜好正面叙述;喜好较长选项;喜好特殊位置;猜测。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 17 页,共 18 页读书之法 ,在循序而渐进 ,熟读而精思(一)求“快”与求“精确”的反应定势除非“反应速度” 本身即为重要的研究目标,否则让被试者有充分的时间反应,同时注明每题的答题时间,可以减少如下定势的影响:求“快”;求“精确”。(二)喜好正面叙述的反应定势在编制是非题时, “是”、 “否”题大致相等或答“否”题略多,是控制肯定定势 的有效方法。(三)喜好特殊位置的反应定势在测验编制过程中,正确答案的位置在整个测验中出现在各位置的概率相等 ,就可以控制喜好特殊位置定势的影响。(四)喜好较长选项的反应定势测验中,有些被试者认为选项长、内容多,一般是正确答案,在无法确定何者正确时,有偏好长选项的反应定势。在编制测验时,只要我们尽量使选项的长度一致 ,就不难避免这类问题。(五)猜测的反应定势第六单元测验的评分(389)一、原始分数的获得无论哪种测验,为使评分尽可能客观应准确无误地计分、合分。二、原始分数的转换第七单元测验结果的报告(390)一、测验分数的综合分析测验分数一般应是一个范围而不是一个确定的点。如在韦氏智力测验中,通常是用测得的IQ 值加减5(85 90的可信限水平)的方法判断IQ 值的波动范围。不能把分数 绝对化 ,更不能仅仅根据一次测验的结果轻易下结论。一个人在任何一个测验上的分数,都是他的遗传特征、测验前的学习与经验以及测验情境的函数。不能把分数绝对化,更不能仅仅根据一次测验的结果轻易下结论,要做到:考虑个人在测验前的经历;考虑测验情境;有常模和信度、效度资料;不直接比较来自不同测验的分数。对测验分数做出确切的解释,只有常模资料是不够的,还必须有测验的信度和效度资料,在解释测验分数时,一定要依据从如下获得的资料:最匹配的情境;最相近的团体。为了使不同测验分数可以相互比较,在经典测验理论的指导下,测验等值的计算方法主要有两大类:一类叫等百分位等值法;另一类叫线性等值法。线性等值法计算就是用相同的标准分数 作等值的基础。二、报告分数的具体建议为了使被试者本人以及与被试者有关的人,如家人、老师、雇主等,能更好地理解分数的意义,在报告分数时要注意:应告诉分数的解释和建议,避免使用专业术语;保证当事人知道该测验测量或预测什么,与什么团体比较,如何运用他的分数;考虑给当事人带来的心理影响;让当事人积极参与测验分数的解释。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 18 页,共 18 页
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号