资源预览内容
第1页 / 共112页
第2页 / 共112页
第3页 / 共112页
第4页 / 共112页
第5页 / 共112页
第6页 / 共112页
第7页 / 共112页
第8页 / 共112页
第9页 / 共112页
第10页 / 共112页
亲,该文档总共112页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
测验的信度第三节陈 蕾信 度p 信度的概念信度的概念p 信度评估的方法信度评估的方法p 信度与测验分数的解释信度与测验分数的解释p 影响信度的因素影响信度的因素p 信度的特殊问题信度的特殊问题第一单元 信度的概念v 信度:指测量结果的一致性程度。v 信度:指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致性程度。v 误差:在测量中与目的无关的变因所产生的不准确或不一致的效应;随机误差:产生的效应是随机的;系统误差:产生的效应是恒定的;第一单元 信度的概念v 信度只受随机误差的影响。X = T + E测量实际 所得分数测量中不存在随机误差时的分数误差分数第一单元 信度的概念集中趋势的度量:平均数 7 7 8 8 8 9 9 4 5 7 8 9 11 121 4 7 8 9 12 15离中趋势的度量:方差、标准差第一单元 信度的概念信度的定义:第一单元 信度的概念信度系数信度指数信度指数的平方就是信度系数。信 度p 信度的概念信度的概念p 信度的评估方法信度的评估方法p 信度与测验分数的解释信度与测验分数的解释p 影响信度的因素影响信度的因素p 信度的特殊问题信度的特殊问题第二单元 信度评估的方法v 重测信度(稳定性系数)重测信度(稳定性系数) 使用同一测验,在同样条件下对同一组被试者前后施两次,求两次得分间的相关系数。测验再测验一段时距时距:两到四周,最好不超过六个月;第二单元 信度评估的方法v 复本信度(等值性系数)复本信度(等值性系数) 以两个等值但题目不同的测验来测量同一群体,然后求得被试者在两个测验上得分的相关系数。测验A测验B最短时距v 重测复本信度(稳定与等值性系数)重测复本信度(稳定与等值性系数)测验A一段时距测验B第二单元 信度评估的方法v 内部一致性信度内部一致性信度 反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。 分半信度分半信度 反映了两半测验(奇偶)内容取样的一致性程度。 同质性信度同质性信度 反映了测验内部所有项目间的一致性程度。第二单元 信度评估的方法v 评分者信度评分者信度 由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关。 一般要求在成对的受过训练的评分者之间平均一般要求在成对的受过训练的评分者之间平均一致性达到一致性达到0.90以上,才认为评分是客观的。以上,才认为评分是客观的。v不同的信度反映了测量误差的不同来源。信 度p 信度的概念信度的概念p 信度评估的方法信度评估的方法p 信度与测验分数的解释信度与测验分数的解释p 影响信度的因素影响信度的因素p 信度的特殊问题信度的特殊问题第三单元 信度与测验分数的解释v 解释真分数造成的变异的比例v 确定信度可接受的水平测验不能用于对个人做评价和预测,也不能用于团体间比较;可以用于团体间比较;可以用来对个人做出评价和预测;信 度p 信度的概念信度的概念p 信度评估的方法信度评估的方法p 信度与测验分数的解释信度与测验分数的解释p 影响信度的因素影响信度的因素p 信度的特殊问题信度的特殊问题第四单元 影响信度的因素样本团体的异质性样本团体的平均能力水平v 样本特征 获得信度的取样团体较为异质,会高估测验的信度,相反则会低估测验的信度。第四单元 影响信度的因素测验越长,题目的取样或内容取样就越有代表性;测验越长,被试猜测因素的影响越小;增加测验长度的效果应遵循报酬递减规律;v 测验的长度一个包括一个包括4040个题目的测验信度为个题目的测验信度为0.800.80,欲将,欲将信度提高到信度提高到0.900.90,通过斯皮尔曼布朗公式,通过斯皮尔曼布朗公式的导出公式计算出至少应增加()个题数。的导出公式计算出至少应增加()个题数。 (A A)4040 (B B)6060 (C C)100 100 (D D)5050第四单元 影响信度的因素v时间间隔v 测验难度 五择一题,0.70;四择一题,0.74;三择一题,0.77;是非题,0.85。 以再测法或复本法求信度,两次测验间隔时间越短,其信度系数越大;间隔时间越长,信度系数越小。信 度p 信度的概念信度的概念p 信度评估的方法信度评估的方法p 信度与测验分数的解释信度与测验分数的解释p 影响信度的因素影响信度的因素p 信度的特殊问题信度的特殊问题第五单元 信度的特殊问题v分测验的信度v 速度测验的信度 对答题速度的一致性作出估计; 分测验的分数几乎肯定不如合成分数可靠。在测量理论中,信度被定义为:一组测量分在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差的比率,即()。数的真分数方差与总方差的比率,即()。 (A A) (B B) (C C) (D D)K KN/nN/nX = T + E信度只受()的影响。信度只受()的影响。 (A A)系统误差系统误差 (B B)随机误差随机误差 (C C)恒定效应恒定效应 (D D)概化理论概化理论用重测法估计信度,最适应的时距随测验的用重测法估计信度,最适应的时距随测验的目的、性质和被试者的特点而异,一般是以目的、性质和被试者的特点而异,一般是以()周较宜,间隔时间最好不超过()个月。()周较宜,间隔时间最好不超过()个月。 (A A)1 12 2;4 4 (B B)2 24 4;6 6 (C C)4 46 6;8 8 (D D)6 68 8;1010复本信度又称等值性系数。它是以两个等值复本信度又称等值性系数。它是以两个等值但题目不同的测验来测量同一群体,然后求但题目不同的测验来测量同一群体,然后求得被试在两个测验上得分的相关系数。复本得被试在两个测验上得分的相关系数。复本信度反应的是测验在()上的等值性。信度反应的是测验在()上的等值性。 (A A)时间时间 (B B)题目题目 (C C)评分评分 (D D)内容内容分半信度代表了(分半信度代表了( )内容取样的一致程度。)内容取样的一致程度。 (A A)原测验原测验 (B B)所有条目之间所有条目之间 (C C)题目与分测验之间题目与分测验之间 (D D)两半测验两半测验斯皮尔曼布朗公式斯皮尔曼布朗公式 中中 为为()的相关系数,()的相关系数, 为测验在原长度时的为测验在原长度时的相关系数。相关系数。 (A A)全测验全测验 (B B)原测验原测验 (C C)一半分数一半分数 (D D)全部分数全部分数同质性信度代表测验内部(同质性信度代表测验内部( )间的一致性。)间的一致性。 (A A)两半测验两半测验 (B B)所有题目所有题目 (C C)题目与分测验题目与分测验 (D D)分测验分测验一般要求在成对的受过训练的评分者之间一一般要求在成对的受过训练的评分者之间一致性达到(致性达到( )以上,才认为评分是客观的。)以上,才认为评分是客观的。 (A A)0.700.70 (B B)0.800.80 (C C)0.900.90 (D D)1.001.00确定可以接受的信度水平的一般原则是,当确定可以接受的信度水平的一般原则是,当()时,测验不能用于对个人做出评价或预()时,测验不能用于对个人做出评价或预测,而且不能做团体比较。测,而且不能做团体比较。 (A A) (B B) (C C) (D D)一般而言,若获得信度的取样团体较为异质一般而言,若获得信度的取样团体较为异质的话,往往会()测验的信度。的话,往往会()测验的信度。 (A A)高估高估 (B B)低估低估 (C C)忽略忽略 (D D)不清楚不清楚对于不同平均能力水平的团体,题目的()对于不同平均能力水平的团体,题目的()会影响测验的信度。会影响测验的信度。 (A A)难度难度 (B B)区分度区分度 (C C)信度信度 (D D)效度效度洛德提出在学绩测验中,为了保证其可靠性,洛德提出在学绩测验中,为了保证其可靠性,各类选择题德理想平均难度为:各类选择题德理想平均难度为:五择一题,五择一题,0.70;四择一题,;四择一题,0.74;三择一题,;三择一题,0.77;二;二择一题,()。择一题,()。 (A A)0.780.78 (B B)0.790.79 (C C)0.850.85 (D D)0.900.90以再测法或复本法求信度,两次测验相隔时以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越间越短,其信度系数越()。()。 (A A)大大 (B B)低低 (C C)小小 (D D)不变不变估计信度的方法一般有估计信度的方法一般有()。()。 (A A)重测信度重测信度 (B B)复本信度复本信度 (C C)内部一致性信度内部一致性信度 (D D)评分者信度评分者信度使用同一测验,在同样条件下对同一组被试使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系前后施测两次测验,求两次得分间的相关系数,叫数,叫(),又称()。(),又称()。 (A A)复本信度复本信度 (B B)重测信度重测信度 (C C)稳定性系数稳定性系数 (D D)分半信度分半信度如果复本信度考虑到两个复本实施的时间间如果复本信度考虑到两个复本实施的时间间隔,并且两个复本的施测相隔一段时间,则隔,并且两个复本的施测相隔一段时间,则称()称()。 (A A)重测复本信重测复本信度度 (B B)重测信重测信度度 (C C)复本信度复本信度 (D D)稳定与等值系数稳定与等值系数复本信度的缺点有()复本信度的缺点有()。 (A A)如果测量的行为易受练习的影响,则复本信度如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响只能减少而不能完全消除这种影响 (B B)由于第二个测验只改变了题目的内容,已经掌由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题握的解题原则可以很容易地迁移到同类问题 (C C)能够避免重测信度的一些问题,如记忆效果、能够避免重测信度的一些问题,如记忆效果、学习效应等学习效应等 (D D)对对许多测验来说建立复本是困难许多测验来说建立复本是困难的的下列描述正确的是()下列描述正确的是()。 (A A)随机抽取若干份问卷,由两位评分者按评分标随机抽取若干份问卷,由两位评分者按评分标准给分,然后再根据每份测验卷的两个分数计算相准给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度关,即得评分者信度 (B B)所有题目看起来好像测量同一特质,但相关很所有题目看起来好像测量同一特质,但相关很低或成为负相关时,则测验为异质的低或成为负相关时,则测验为异质的 (C C)人的多数心理特征如智力、性格、兴趣等,具人的多数心理特征如智力、性格、兴趣等,具有相对稳定性,间隔一段时间,不会有太大变化有相对稳定性,间隔一段时间,不会有太大变化 (D D)不同的信度反映了误差的不同来源不同的信度反映了误差的不同来源 为信度系数。下列()情况属于极端情为信度系数。下列()情况属于极端情况况。 (A A) (B B) (C C) (D D)一般来说,在一个测验中增加同质的题目,一般来说,在一个测验中增加同质的题目,可以使信度提高可以使信度提高。下列描述正确的是()。下列描述正确的是()。 (A A)测验越长,测验的测题取样或内容取样越有代测验越长,测验的测题取样或内容取样越有代表性表性 (B B)测验越长,被试者受猜测因素的影响越小测验越长,被试者受猜测因素的影响越小 (C C)测验越长,越遵循报酬递增原则测验越长,越遵循报酬递增原则 (D D)测验太长,有时反而会引起被试者的疲劳和反测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性感而降低可靠性测验的效度第四节陈 蕾第一单元 效度的概念低信度、低效度高信度、低效度高信度、高效度效 度p 效度的概念效度的概念p 效度评估的方法效度评估的方法p 影响效度的因素影响效度的因素第一单元 效度的概念1、测验测量到它所要测量的东西了吗?2、测验对它所测量的东西测量到什么程度?v 效度:对一个测验对其所要测量的特性测量到什么程度的估计。v 效度:指所测量的与所要测量的心理特点之间的符合程度,也就是指一个测验的准确性。第一单元 效度的概念第一单元 效度的概念总方差总方差与测量目的有与测量目的有关的真实方差关的真实方差无关而稳定无关而稳定的方差的方差无关而不稳无关而不稳定的方差定的方差第一单元 效度的概念v效度:在一组测量中,与测量目的有关的真实方差(或有效方差)与总方差的比率。效度系数效度既受随机误差的影响,也受系统误差的影响。效度既受随机误差的影响,也受系统误差的影响。 SX2 SV2 SI2 SE2 ST2第一单元 效度的概念v效度与信度的关系信度是效度的必要非充分条件效度受信度的制约第一单元 效度的概念v 效度的性质:效度是针对测验结果的效度具有连续性效度具有相对性评鉴测验的效度时,必须考虑其目的与功能。效 度p 效度的概念效度的概念p 效度评估的方法效度评估的方法p 影响效度的因素影响效度的因素第二单元 效度评估的方法v 内容效度v 评估方法 是指测验题目对有关内容或行为取样的适应性,从而确定测验是否是所欲测量的行为领域的代表性样本。(逻辑效度)专家判断法统计分析法 评分者一致性 复本法 再测法经验推测法第二单元 效度评估的方法v 内容效度的特性:v 表面效度:受内容范围的定义的影响。由外行对测验作表面上的检查确定的。第二单元 效度评估的方法v 效标效度 反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标效标。(实证效度)第二单元 效度评估的方法v 效标的必备条件 效标必须能真正反应测验的目的; 效标必须有较高的信度,稳定可靠; 效标可以客观地加以测量; 效标测量的方法简单,省时省力,经济实用; 第二单元 效度评估的方法v 效标效度的评估方法相关法 区分法 命中率法 积差相关 点二列相关 贾斯朋多系列相关 二列相关当测验用来 做取舍依据时,用其正确决定的比列作为效度指标的一种方法; v 命中率法临界临界分数分数合格标准合格标准第二单元 效度评估的方法v 构想效度(构思效度、结构效度)构想效度就是测验对某一理论构想或特质测量的程度。涉及心理学的理论概念问题;测验能够测量到理论上构想或特质的程度;测验结果能否正是或解释某一理论的构想,解释的程度如何;第二单元 效度评估的方法v构想效度的评估方法对测验本身的分析(测验内方法) 内容效度内部一致性指标(内部一致性信度)被试对题目的反应特点测验间相互比较(测验间方法) 相容效度区分效度因素分析法第二单元 效度评估的方法v构想效度的评估方法效标效度的研究证明 效标心理特质的发展变化实验法和观察法证实 效 度p 效度的概念效度的概念p 效度评估的方法效度评估的方法p 影响效度的因素影响效度的因素第三单元 影响效度的因素v测验本身的因素测验材料必须对整个内容有代表性;测题设计时应尽量避免引起误差的题型;测题的难度要适中,就有较高的区分度;测题的长度要适当,即要有一定的测题量;测题的排列按先易后难的顺序;v测验实施中的干扰因素主试的影响因素被试的影响因素第三单元 影响效度的因素v样本团体的性质样本团体的异质性 样本团体越同质,分数分布的范围越小,测验的效度就越低;样本团体越异质,分数分布的范围越大,测验效度就越高。第三单元 影响效度的因素v样本团体的性质干涉变量使得测验对于不同团体具有不同的预测能力的特征。 差异分数D 对照组法 分组预测吉赛利(E.E.Ghiselli)()是指在不同时间内用同一测验(或用另()是指在不同时间内用同一测验(或用另一套相等测验)重复测量同一被试,所得的一套相等测验)重复测量同一被试,所得的一致性程度。一致性程度。 (A A)信度信度 (B B)效度效度 (C C)难度难度 (D D)区分区分度度在心理测验中,效度是指测验所测量的与所在心理测验中,效度是指测验所测量的与所要测量的心理特点之间的符合程度,或者简要测量的心理特点之间的符合程度,或者简单地说是指一个测验的()。单地说是指一个测验的()。 (A A)稳定性稳定性 (B B)准确性准确性 (C C)可信度可信度 (D D)区分性区分性在测量理论中,效度被定义为在一组测量中,在测量理论中,效度被定义为在一组测量中,与目标有关的真实方差与()方差的比率。与目标有关的真实方差与()方差的比率。 (A A)误差误差 (B B)系统误差系统误差 (C C)随机误差随机误差 (D D)总总()指的是测验题目对有关内容或行为取样()指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所预测量的的适用性,从而确定测验是否是所预测量的行为领域的代表性取样。行为领域的代表性取样。 (A A)内容效度内容效度 (B B)构想效度构想效度 (C C)效标效度效标效度 (D D)区分效度区分效度专家判断法,就是请有关专家对测验题目与专家判断法,就是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目原定内容的符合性做出判断,看测验的题目是否代表规定的内容。如果专家认为测验题是否代表规定的内容。如果专家认为测验题目恰当地代表了所测内容,则测验具有内容目恰当地代表了所测内容,则测验具有内容效度。因此,内容效度有时又称()。效度。因此,内容效度有时又称()。 (A A)构想效度构想效度 (B B)效标效度效标效度 (C C)区分效度区分效度 (D D)逻辑效逻辑效度度编制测验时,效度是重要的要考虑的特性。编制测验时,效度是重要的要考虑的特性。如果是编制最高行为测验,除了内容效度,如果是编制最高行为测验,除了内容效度,也要求有()。也要求有()。 (A A)较高的表面效度较高的表面效度 (B B)较好的专家判断较好的专家判断 (C C)较好的外行判断较好的外行判断 (D D)主观性主观性计算两种测验之间得分的相关,其中一种测计算两种测验之间得分的相关,其中一种测验是待研究效度的,另一种是已有效度证据验是待研究效度的,另一种是已有效度证据的成熟测验,但两者测量的是同一特质,假的成熟测验,但两者测量的是同一特质,假如相关高,说明新测验所测量的特质确实是如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。这种方法叫()。老测验所反映的特质或行为。这种方法叫()。 (A A)区分效度区分效度 (B B)逻辑效度逻辑效度 (C C)相容效度相容效度 (D D)构想构想效度效度( )是检测测验分数能否有效地区分由效标)是检测测验分数能否有效地区分由效标所定义的团体的一种方法。所定义的团体的一种方法。 (A A)相关法相关法 (B B)区分法区分法 (C C)命中率法命中率法 (D D)失误法失误法如果其他条件相同,样本越同质,分数分布如果其他条件相同,样本越同质,分数分布范围越小,测验效度就越()。范围越小,测验效度就越()。 (A A)高高 (B B)低低 (C C)大大 (D D)接近接近1 1效标测量本身的可靠性如何也是值得考虑的效标测量本身的可靠性如何也是值得考虑的一个问题。效标测量的可靠性即效标测量的一个问题。效标测量的可靠性即效标测量的()。()。 (A A)区分度区分度 (B B)常模常模 (C C)信度信度 (D D)效度效度信度与效度的关系可表述为()。信度与效度的关系可表述为()。 (A A)信度是效度的必要而充分条件信度是效度的必要而充分条件 (B B)信度是效度的充分条件信度是效度的充分条件 (C C)信度是效度的必要而非充分条件信度是效度的必要而非充分条件 (D D)效度受信度的制约效度受信度的制约美国心理学会在美国心理学会在19741974年发行的教育与心理年发行的教育与心理测量之标准一书中将效度分为几个大类:测量之标准一书中将效度分为几个大类:即()即() (A A)内容效度内容效度 (B B)构想效度构想效度 (C C)效标效度效标效度 (D D)区分效度区分效度内容效度的评估方法有()内容效度的评估方法有() (A A)专家判断法专家判断法 (B B)双向细目表法双向细目表法 (C C)统计分析统计分析法法 (D D)经验推测法经验推测法除了描述性语言外,内容效度的确定也可采除了描述性语言外,内容效度的确定也可采取一些统计分析方法,如()。取一些统计分析方法,如()。 (A A)计算两个评分者的一致性计算两个评分者的一致性 (B B)复本相关复本相关 (C C)专家推测专家推测 (D D)再测法再测法构想效度是()。构想效度是()。 (A A)构思效度构思效度 (B B)主要涉及的是心理学的理论概念问题主要涉及的是心理学的理论概念问题 (C C)指指测验能够测量到理论上的构想或特质测验能够测量到理论上的构想或特质的程度的程度 (D D)测验的结果是否能证实或解释某一理论测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何的假设、术语或构想,解释的程度如何构想效度的估计方法包括()。构想效度的估计方法包括()。 (A A)对测验本身的分析对测验本身的分析 (B B)测验间的相互比较测验间的相互比较 (C C)效标效度的研究证明效标效度的研究证明 (D D)实验法和观察法证实实验法和观察法证实可以作为构想效度证据的有()。可以作为构想效度证据的有()。 (A A)测验的内容效度测验的内容效度 (B B)测验的内部一致性指标测验的内部一致性指标 (C C)分析几个测验间的相互关系分析几个测验间的相互关系 (D D)分析被试者对题目的反应特点分析被试者对题目的反应特点可以作为构想效度的测验间比较的有()。可以作为构想效度的测验间比较的有()。 (A A)内容效度内容效度 (B B)相容效度相容效度 (C C)区分效度区分效度 (D D)因素分析法因素分析法效标效度反映的是测验预测个体在某种情境效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。它可以分为()。下行为表现的有效性程度。它可以分为()。 (A A)相容效度相容效度 (B B)区分效度区分效度 (C C)同时效度同时效度 (D D)预测效预测效度度效标效度的主要评估方法有()。效标效度的主要评估方法有()。 (A A)命中率法命中率法 (B B)区分区分法法 (C C)失误法失误法 (D D)相关法相关法相关法求效标效度的计算方法有()。相关法求效标效度的计算方法有()。 (A A)积差相关法积差相关法 (B B)点点二列相关法二列相关法 (C C)二列相关法二列相关法 (D D)贾斯朋多贾斯朋多系列相关系列相关在命中率法中,命中的情况是指()。在命中率法中,命中的情况是指()。 (A A)预测成功实际也成功预测成功实际也成功 (B B)预测成功但实际上失败预测成功但实际上失败 (C C)预测失败而实际上成功预测失败而实际上成功 (D D)预测失败实际也失败预测失败实际也失败测验实施中的干扰因素包括()。测验实施中的干扰因素包括()。 (A A)主试者的影响因素主试者的影响因素 (B B)测验情境测验情境 (C C)其他干扰因素其他干扰因素 (D D)被试者的影响因素被试者的影响因素项目分析第五节陈 蕾项目分析定性分析定量分析难 度区分度第一单元 项目的难度P值越大,难度越低;P值越小,难度越高。项目的项目的难度难度通过或答对该通过或答对该项目的人数项目的人数全体被试全体被试者人数者人数在在200200个学生中,答对某项目的人数为个学生中,答对某项目的人数为120120人,人,则该项目的难度为()。则该项目的难度为()。 (A A)0.10.1 (B B)0.20.2 (C C)0.40.4 (D D)0.60.6第一单元 项目的难度项目的项目的难度难度全体被试者在该全体被试者在该题上的平均分题上的平均分该题的该题的满分满分数学测验的第数学测验的第7 7题满分为题满分为1515分,该题考生的平分,该题考生的平均得分为均得分为9.69.6分,则该题的难度为()。分,则该题的难度为()。 (A A)0.640.64 (B B)0.550.55 (C C)0.430.43 (D D)0.210.21第一单元 项目的难度项目的项目的难度难度高分组的高分组的通过率通过率低分组的低分组的通过率通过率总成绩最高的27为高分组,总成绩最低的27为低分组。在在370370名被试者中,选为高分组和低分组各有名被试者中,选为高分组和低分组各有100100人,其中高分组有人,其中高分组有7070人答对第一题,低分人答对第一题,低分组有组有4040人答对第一题,则第一题的难度为()。人答对第一题,则第一题的难度为()。 (A A)0.350.35 (B B)0.450.45 (C C)0.550.55 (D D)0.650.65第一单元 项目的难度校正后的校正后的通过率通过率实际得到实际得到的通过率的通过率备选答案备选答案数目数目第一单元 项目的难度 项目的难度水平多合适取决于测验的目的、性质以及项目的形式。v项目的难度水平对常模参照测验来讲,P值越接近于0.50越好,试题的平均难度接近0.50,各个题目的难度在0.50 0.20之间;对选拔或诊断测验来讲,应该较多地选择难度接近录取率的项目;对标准参照测验来讲,可以不考虑难度;第一单元 项目的难度 测验的难度水平直接依赖于组成测验项目的难度。v测验的难度水平对常模参照测验来讲,分数分布以常态最好;对选拔测验来讲,正偏态的分数分布比较适合;对标准参照测验来讲,可以允许出现偏态分布;第二单元 项目的区分度 指测验项目对被试的心理特性的区分能力,取值范围在1至+1之间。v项目区分度(鉴别力)高分组的高分组的通过率通过率低分组的低分组的通过率通过率鉴别鉴别指数指数伊贝尔(L.Ebel)鉴别指数与评价标准第二单元 项目的区分度v相关法 以某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标。相关越高,项目区分功能越好。积差相关;二列相关;点二列相关;相关法v区分度与难度的关系 较难的项目对高水平的被试区分度高,较易的项目对低水平的被试区分度高,中等难度的项目对中等水平的被试区分度高。难度难度P P值越接近值越接近0 0或接近或接近1 1,越无法区分被试者,越无法区分被试者之间能力的差异。相反,之间能力的差异。相反,P P值越接近于值越接近于0.500.50,区别力越高。为了使测验具有更大的区别力,区别力越高。为了使测验具有更大的区别力,应选择难度在应选择难度在0.500.50左右的题目比较合适,各左右的题目比较合适,各题的难度应在()之间。题的难度应在()之间。 (A A) (B B) (C C) (D D)项目的()也叫鉴别力,是指测验项目对被项目的()也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。试者的心理特性的区分能力。 (A A)难度难度 (B B)区分度区分度 (C C)信度信度 (D D)效度效度19651965年,美国测验专家伊贝尔根据长期的经年,美国测验专家伊贝尔根据长期的经验提出用鉴别指数评价项目性能的标准,鉴验提出用鉴别指数评价项目性能的标准,鉴别指数别指数D D为(),说明该项目差,必须淘汰。为(),说明该项目差,必须淘汰。 (A A)0.190.19以下以下 (B B)0.200.200.290.29 (C C)0.300.300.390.39 (D D)0.400.40以上以上难度与区分度的关系,一般来说,较难的项难度与区分度的关系,一般来说,较难的项目对高水平的被试区分度(),中等难度的目对高水平的被试区分度(),中等难度的项目对中等水平的被试区分度高。项目对中等水平的被试区分度高。 (A A)中等中等 (B B)一般一般 (C C)高高 (D D)低低难度的分布一般以()分布为好,这样不仅难度的分布一般以()分布为好,这样不仅能保证多数项目具有较高的区分度,而且可能保证多数项目具有较高的区分度,而且可以保证整个测验对被试具有较高的区分能力。以保证整个测验对被试具有较高的区分能力。 (A A)偏态偏态 (B B)负负偏态偏态 (C C)峰态峰态 (D D)常态常态难度代表测验的难易程度。用难度代表测验的难易程度。用P P值代表,值代表,P P值值越(),难度越小。越(),难度越小。 (A A)大大 (B B)小小 (C C)低低 (D D)接近接近0 0一般来说,测验的项目分析包括()分析和一般来说,测验的项目分析包括()分析和()分析。()分析。 (A A)大小大小 (B B)范围范围 (C C)定性定性 (D D)定量定量项目的定性分析包括考虑项目的内容效度,项目的定性分析包括考虑项目的内容效度,题目编写的()和()等。题目编写的()和()等。 (A A)内容内容 (B B)形式形式 (C C)恰当性恰当性 (D D)有效性有效性
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号