测量的概念特征与层次ppt67页PPT课件-

第五章测量一、测量的概念和特征二、测量的层次三、操作化四、量表五、测量质量的评估一、测量的概念和特征1、测量和社会测量2、测量的作用3、测量的要素4、有效测量5、社会测量的特征1、测量和社会测量测量：测量：指按照某种法则给物体或事件分派一定的数字和符号。社会测量：社会测量：指在社会调查研究中，对社会现象之间性质差异和数量差异的度量。也可看作对社会现象进行精确的、有意识的观察。P.s 测量是指对所确定的研究内容或调查指标进行有效的观测与量度。具体地说，是根据一定的规则将数字或符号分派与研究对象的特征（即研究变量）之上，从而使社会现象数量化或类型化。研究变量研究变量：是通过对概念的界定和具体化而转化来的，在研究中，它是分析单位所具有的特征或属性。在一具体研究中，每个变量都有特定的测量指标。数字（符号）数字（符号）：测量时得到的一定数值可作为某一现象或事件特征的代表符号。分派规则分派规则：确定分派数字的规则是测量中最基本、最困难的工作。测量是将各个分析单位与它们的特征或属性用数字分派规则联系起来。所谓规则规则是指操作的方法或索引，它指导研究人员如何实施测量。返回返回2、测量的作用在于作出准确的分类，以便比较研究对象的各种差异，这些差异有些是以等级区分的（定性），有些是以数量区分的（定量）。返回返回3、测量的要素（1）测量对象，主要是各种社会现象的属性或特征；（2）测量工具，主要是调查问卷、各种量表和卡片等；（3）测量规则，即鉴别、测算或度量社会现象的规矩和准则；（4）测量数值，即表示社会测量结果的数字或符号。返回返回4、有效测量准确性准确性：指所分派的数字或符号能真实、可靠、有效地反映调查对象在属性和特征上的差异，用数学概念表述，如果真实状态与符号系统在结构上具有一致的关系，那么两者就具有同构性，同构性越高，所观测的资料就越准确有效；完备性完备性：是指分派规则必须能包括研究变量的各种状态或变异；互斥性互斥性：指每一个观测对象（或分析单位）的属性和特征都能以一个而且只能以一个数字或符号来表示。返回返回5、社会测量的特征测量的主体和客体都是人，具有无法回避的主客观矛盾；测量的内容和测量活动本身都是一种社会现象，两者往往相互影响；测量对象复杂，造成测量的客观性、可重复性、公认性较差，测量误差也较难以发现和计算。返回返回二、测量的层次1、定类测量：也称类别测量或分类测量，它是对测量对象的性质或类型的测量。测量结果只能分类，标以各种类别名称。其数字是人们赋予某类事物的识别标志，它们丝毫不反映这些事物本身的数量状况，不能作加、减、乘、除等数学运算。定类测量的数量化最低，其测量结果只能用数学符号“=”或“”来表示，只能做频率分布、在总体中所占比例等有限的几种数量统计。性别、职业、出生地、宗教信仰等属于定类测量。2、定序测量（ordinal measures）：也叫等级测量或顺序测量，它是对测量对象的等级或顺序的鉴别。定序测量的数量化程度比定类测量高一个层次，它已具有了数量差别的含义，其测量结果可用数字符号“”或“” 来表示，可进行频率分布、比例关系等集中数量统计，但还不能进行加减运算，不能测量出不同等级、顺序社会现象在数量上的具体差距。对社会阶级、保守程度、疏离感以及知识文化水平等的测量，就属于定序测量。3、定距测量（interval measures）：也称区间测量，它是对测量对象之间的数量差别或间隔距离的测量。其测量结果可用具体数字来反映。定距测量不仅能反映社会现象的类别和顺序，而且能反映社会现象的数量状况，计算出它们之间的距离。对人的智商、初婚年龄、人均生活费用、家庭人数等可用某种基本单位表示数量差别或间隔距离的社会现象的测量，就属于定距测量。 4、定比测量:也称比例测量，它是对测量对象之间的比例或比率关系的测量。其测量结果一般用百分比来表示，有时也可用绝对数来表示。定比测量的数量化程度比定距测量又高一个层次，其测量结果不仅能进行加减运算，而且能进行乘除运算，并可作各种统计分析。对出生率、死亡率、劳动力负担系数、工资增长速度等反映两个数值之间比例或比率关系的社会现象的测量，就属于定比测量。总结四种测量中，定类测量是定性测量，而后三种都是定量测量；定距测量和定比测量比定类测量和定序测量层次高，因为前两者包含后两者的特点和功能，定比测量又包含着定距测量的特点和功能，所以它是四种测量中层次最高的。测测量量层层次次区区别别层层次次定类测量只能分类最低定序测量分类和排序稍高定距测量分类、排序和采用固定的间隔更高定比测量分类、排序、采用固定的间隔以及具有绝对零点最高测量层次举例例一：变量(测量等级)如何测量变量宗教(定类变量)不同的宗教派系(犹太教、天主教、路德会)是无法排名的，只是彼此不同 (除非信仰被概念化成哪个比较接近天国)。例二：变量(测量等级)如何测量变量出席状况(定序变量)你多久做一次礼拜？(0)从不；(1)一年一次；(2)一年数次；(3)大约一各月一次；(4)一个星期两、三次；或是(5)一个星期几次？如果问的是个人实际做礼拜的次数，那么这题就是用比例层次的测量。例三：变量(测量等级)如何测量变量智商分数(定距变量)大多数的智力测验是以一百分为平均数、中位数、或正常。分数的高低指出与平均数的距离。得115分的人高于做这个测验的人平均智力，而得90分则稍微低于平均智力。低于65分或高于140分的人较为罕见。例四：变量(测量等级)如何测量变量年龄(定比变量)年龄以岁数加以测量。有个绝对的真正零点(出生)。注意四十岁的人活的岁数是二十岁者的两倍。返回返回三、概念的具体化与操作化1、概念、变量和指标2、概念的具体化过程3、操作定义4、操作化的作用1、概念、变量和指标概念是对现象的抽象，它是一类事物的属性在人们主观上的反映。概念是如何形成的？（概念化）变量：就是指具有一个以上取值的概念，或者说，就是包括一个以上范畴的概念；只有一个固定不变的值的概念，叫做常量；属性：变量的特征或品质。变量都包含两个因素：变量的属性要有完备性；变量的各个属性具有互斥性；指标：表示一个概念或变量含义的一组可观察到的事物，称作这一概念或变量的一组指标。概念是抽象的，而指标是具体的；概念是人们的主观印象，而指标则是客观存在的事物。概念只能想像，而指标可以观察和辨认。返回返回2、概念的具体化过程美国社会学家拉扎斯菲尔德（1）概念的形成：概念是在日常生活中通过感性认识和互相交流形成的。是人们对许多现象的复杂而又具体的感受，并以一个名字对这些感受作出整体的、含混的概括。概念是人们思维的产物，它是抽象的，无法直接观察的，因为它本来并不存在，是人们创造了它。（2）概念的界定概念的界定：是用抽象定义将概念所指的现象与其他现象区分开来。第一步是将概念分解：即从不同角度或维度对概念所表示的现象进行分类，对有些高度抽象的概念要逐步分解；第二步是作出抽象定义：通过分解可大致了解一个概念的基本内容和各种分类，根据分类就可以抽出各种类型的共同属性和特征对概念下定义。（3）选择测量指标：确定如何测量变量，选用哪些指标来测量。（4）编制综合指标：对简单的概念可以用一两个指标来测量，而对复杂的概念，则要用多个指标来测量。（5）概念的具体化过程就是一步步从抽象层次下降到经验层次，使概念具体化为可观测的事物。返回返回3、操作定义就是建立一些具体的程序或指标来说明如何测量一个概念。操作定义的功能：（1）澄清概念在研究中所选用的意义；（2）说明测量变量的操作方法；（3）使一些陈述变量间关系的假说获得验证的机会；（4）使今后同样的研究有所根据，以便比较彼此的结果。抽象定义与操作定义的比较定义方法定义方法抽象定义抽象定义操作定义操作定义定义途径定义途径概念概念具体的事物、现象和方法具体的事物、现象和方法定义特点定义特点逻辑方法（概括）逻辑方法（概括）经验方法（直接感知或度量）经验方法（直接感知或度量）定义重点揭示内涵和本质揭示内涵和本质界定外延或操作过程界定外延或操作过程二者的联系：抽象定义和操作定义都是对同一调查指标所下的定义，只是定义的内容、方法和着重点有所不同。抽象定义决定操作定义的本质内容，操作定义则是抽象定义在调查过程中的进一步具体化。例一：美国著名社会学家英克尔斯及其合作者对“人的现代性”进行测量：首先分解为24个维度：（1）积极参与公共事务 (2)年老者的角色（3）教育期望与职业期望 (4)可依赖性（5）对变革的认识与评价 (6)公民权（7）消费态度 (8)对尊严的评价 (9）效能 (10)家庭大小（11）意见的增多 (12)与国家的认（13）信息 (14)大众传播媒介（15）亲属义务 (16)社会阶级分层（17）新经验 (18)妇女权力（19）宗教 (20)专门技能（21）对时间的评价 (22)计划（23）工作信念 (24)了解生产每一个维度下面，又分解成若干个更为具体的指标。比如：第一个维度“积极参与公共事务”下面，就又分解成下述六个指标： (1)“是否属于某一个组织”； (2)“所参加的组织的数目”； (3)“哪一个组织在政治上持有自己的观点”； (4)“是否用谈话或书信方式向政府官员表明自己的观点”； (5)“参加投票的次数”； (6)“是否曾高度关心某件公共事务”。剥夺肉体剥夺经济剥夺社会剥夺政治剥夺精神剥夺社会孤立社会歧视社会技能丧失其主要内容和表现界定被歧视的类型界定社会技能的范围测量：1、朋友数目2、家庭关系3、社会地位4、参与社会活动的程度测量：1、性别2、种族3、职业4、政治测量：1、社会交往2、教育3、专业技术4、思想练习：将概念“孝道观念”进行操作化概念名称第一层第二层测量题目孝道观念核心孝道观念尊亲敬亲Y1，Y2奉养祭念Y5，Y6變遷孝道观念抑己顺亲Y3，Y4，Y8护亲容亲Y7，Y9Y1：对父母的养育之恩心存感激Y2：无论父母对你如何不好，仍然善待他们Y3：放弃个人的志向，达成父母的心愿Y4：结婚后和父母住在一起Y5：奉养父母使他们生活更为舒适Y6：父母去世，不管住得多远，都亲自奔丧Y7：为了顾及父母的面子，为他们说些好话Y8：为了传宗接代，至少生一个儿子Y9：做些让家族感到光荣的事返回返回4、操作化的作用（1）使不同的调研者对同一个概念或命题有统一而明确的理解。（2）使概念或命题具体化，明确调查对象和调查范围。（3）使概念或命题量化，令调查者对调查对象的具体观察和测量成为可能。返回返回四、量表（一）量表的概念（二）常用量表及其设计总加量表、累积量表、语义差异量表（一）、量表的概念量表是社会科学研究中广泛应用的一种测量工具，其主要作用在于测量复杂的概念。其英文是scales,也常被译成“尺度”。量表通常是由多项测量内容综合而成的。1、量表与维度维度的概念属于理论范畴。它表示现象的某一层次或某一方面，或者说，它在抽象层次上表示从某一角度看待现象时的某种连续统一体。量表和指标都是用来捕获和再现理论维度的经验工具，即对理论维度的一种代表。2、量表和指标指标和量表都是典型的对变量的定序以上的层次测量，通常使用的指标和量表都是变量的复合测量（composite measure of variables），即基于二项以上的测量。指标（Index），往往通过单个属性的分值计算来建立，而量表（scale）则是通过对某一问题的不同反应模式赋予相应的分值，使不同选项反映变量变异程度的强弱。因此，量表利用了任何存在于各种属性之间的强度结构强度结构。量表能通过指标之间的结构，提供更有保证的排序。指标和量表的差异：举例说明假设我们要建立起由管政治参与狂热程度的测量工具，以区别那些积极参与政治活动、完全不参与政治活动的以及介于两者之间的人。建构指标的逻辑这是人们可能采取的几种政治行动的类型。大体来说，不同的行动可以代表相似的政治狂热程度，为了建立一个全面反映政治狂热程度的指标，人们给每个行为赋予一定的分值。给当地政府官员写信在政治请愿书上签名捐资给某项政治活动捐资给某位政治候选人给报纸写具有政治意味的信件说服别人改变投票对象建构量表的逻辑这里的一些政治行动代表了十分不同的狂热程度：如参与竞选公职比简单地参与投票代表了更高的政治狂热程度。而且，政治活动更狂热的人也会参与一般的政治活动。为了建立政治狂热程度的量表，我们可以根据下图中的理想模式近似地描述每个人的政治狂热程度，并给予分值。竞选公职为政治运动出力为政治运动捐款参与投票返回返回1、总加量表总加量表：它由一组反映人们对事物的态度或看法的陈述构成，回答者分别对这些陈述发表意见，根据回答者同意或不同意分别计分，然后将回答者在全部陈述上的得分加起来，就得到了该回答者对这一事物或现象的态度的得分。整个态度量表测量方向要具有一致性。每一个态度陈述都具有同等的效果。李克特量表（Likert Scaling）：它是一种总加量表，一般用在态度、价值取向等测量中。它们建立在这样的观点基础上，一个人对某事的感情强度或价值取向是可以测量的。它是用5分的量表来评估他们的赞同程度：非常不同意不同意不确定同意非常同意 1 2 3 4 5清楚地顺序回答形式分辨力的计算量表的制作和使用过程第一步，根据所要测量的内容或变量收集大量与这一内容有关的问题，然后初步筛选出一组问题作为量表草案。第二步，规定评分标准。对上述每个问题，按正反两个方向和不同程度分为个评分等级。第三步，进行测量试验。第四步，评估测量试验的结果。第五步，制定量表。第六步，进行实际测量。主要优点：使用比较简便；适用比较广泛；通常情况下，利克特量表比同样长度的量表具有更高的信度；利克特量表的五种答案形式使回答者能够很方便的标出自己的位置。缺点：相同的态度得分者具有十分不同的态度形态。例题：您对理想的生活条件满意程度：很不满意不太满意一般还算满意很满意 1 2 3 4 5住房工作婚姻家庭生活政府自然环境社会风气个人经济状况个人基本权益社会地位文化生活朋友、友谊时间分配状况根据以上的回答形式，还可以衍生出其他许多回答形式：1、对“社会调查方法”这门课的教学质量，你的总体评价是：A 优秀 B 良好 C 一般 D 较差 E很差2、总的说来，我经常觉得自己是个失败者。A 总是这样 B 常常这样 C有时这样 D很少这样 E从未这样3、你对飘柔洗发水的感觉是：A 很不喜欢 B 比较不喜欢 C稍有不喜欢 D稍有喜欢 E比较喜欢 F很不喜欢针对不同的陈述内容，答案的用词有所变化，但答案的排列顺序和强度结构并没有变化。答案类别应保持在48个之间，最好能有“不知道”、“未决定”、和“没意见”等中性类别。返回返回2、累积量表它是格特曼（L.Guttman）1944年设计使用的，因而又称为又称格特曼量表格特曼量表。是目前使用较为普遍的一种量表。量表自身结构中存在着某种由强变弱或由弱变强的逻辑。因而它的每一个量表总分，都只有一种特定的回答组合与之对应。社会距离量表：又称鲍格达斯量表鲍格达斯量表，它是美国社会心理学家鲍格达斯于1925年创用的。过去一直广泛用于测量人们对种族群体的态度，现在，它也被用来测量人们对职业、社会阶层、宗教群体等事物的态度。由一组表示不同社会距离或社会交往程度的陈述组成。它要求被调查者根据自己的看法对这些陈述表态。在这一组问题中，实际上蕴含着一种超强的逻辑结构。除了某些例外情况外，量表本身的逻辑结构使我们能够得出这样的结论：即当一个人拒绝了量表中一项关系，那么它也必将拒绝这一关系后面所有更强的关系。累积量表的制作研究人员围绕它所希望测量的某一事物或概念编制一组陈述，这些陈述应该是单维的，即具有某种趋强结构。然后用一个小样本对这些陈述进行检验。将检验的结果，按最赞成的陈述到最不赞成的回答者，从上到下排列然后从中去掉那些不能很好区分赞成的回答者与最不赞成的回答着的陈述。优点：可以直接根据被测者所同意的陈述的数目及他的量表分数，来决定他对这一概念或事物的赞成程度，这也正是格特曼量表的最大优点。缺点：我们对一组陈述具有单维性的假设是有局限性的：这种单维性往往只是某一部分人的态度模式，一组特定的陈述可能在某一群体中表现出单维模式。同样，在一个时期中是单维的模式，但到了另一个时期却不一定还是单维的。单维的领域往往难于找到。返回返回语义差异量表是李克特量表的一种应用。是用一组意义相反的陈述或形容词构成一份评价量表，以用来测量人们对某一特定概念或事物的不同意识和感受。例如：你对于你的同事在大部分时间内的感觉如何？有以下九对形容词来形容。请在以下空格中选取一个最适合的空格做个记号，以说明你对同事整体感觉。我的同事们非常十分有点儿说不好有点儿十分非常合作 _ _ _ _ _ _ _ 不合作愉快 _ _ _ _ _ _ _ 不愉快吵架 _ _ _ _ _ _ _ 情投意合自私 _ _ _ _ _ _ _ 不自私爱挑衅 _ _ _ _ _ _ _ 和蔼可亲精力充沛 _ _ _ _ _ _ _ 无能为力效率高 _ _ _ _ _ _ _ 效率低聪明 _ _ _ _ _ _ _ 笨拙不帮助人 _ _ _ _ _ _ _ 能帮助人还有另外一种形式如：请您在以下坐标图上标出符合您所在部门情况的位置返回返回五、测量质量的评估1、信度2、效度3、信度和效度的关系1、信度信度：是指使用相同研究技术重复测量同一个对象时，得到相同研究结果的可能性。一个可行的测量（reliable measure）是指假定测量的指标不变，重复进行这个测量，得到的将是同一结果。信度只是代表测量结果前后一致性，它不代表准确性。信度通常用信度系数来表示。一般说来，信度系数在0.8以上，就可以认为调查是基本可信的。信度的检测：通常应用三个方法来检验信度。重测信度重测信度用同一份问卷的问题，对同一群被测者前后调查两次，再根据调查的结果，计算其相关系数，就得到重测信度。这种信度能表示两次调查结果有无变动，反映了测量的稳定程度，故又称作稳定系数。它可以检查出被测者是否能正确理解所提的问题，并作出真实稳定的回答。注意两次调查相隔的时间要适当，如果时间太短，被测者还记得上次答案，所以测量的是他的记忆，而不是他此时的真实态度。如果间隔时间太长，可能会发生一些变故，影响到被调查者的态度。复本信度复本信度对一项调查的问题，让被调查者接受问卷测量，并同时接受这份问卷的复本的调查，然后根据调查结果计算其相关系数，就得到复本信度。使用复本求取信度可以避免重测信度的缺点，但使用的复本必须是真正的复本，即在题数、形式、内容、难度及鉴别度等方面都与原本一致，仅只在问法与用词方面与原本不同。复本调查可连续或相距一段时间进行，连续实施的复本信度又称等值系数等值系数；相聚一段时间实施的复本信度又称稳定与等稳定与等值系数值系数。折半信度折半信度将调查来的结果，按题目的单、双数分成两半记分，再根据各个人的这两部分的总分，计算其相关系数，就得到折半信度。影响信度的因素影响信度的因素在结构化标准化程度较高的测量中，信度主要受随机误差的影响，随机误差越大，信度越低。随机误差的来源主要有：被调查者：调查者：测量内容：测量环境和时间：返回返回2、效度效度是指实际测量在多大程度上反映了概念的真实含义，是指测量的准确性。它包含两方面的含义：实际测量对象是否是所要测量的项目；二是实际测量的结果是否接近真实情况。效度的检查：主要有三种类型内容效度（表面效度）内容效度（表面效度）考察内容效度旨在系统的检查测量内容的适当性，并依据我们对所研究的概念（变量）的了解去鉴别测量内容是否反映了这一概念的基本内容。内容效度实质上是个判断问题。准则效度（效标效度）准则效度（效标效度）准则是被假设或被定义为有效的测量标准，符合这种标准的测量工具可以作为测量某一特定现象或概念的效标。对同一概念的测量可以使用各种测量工具，其中每种测量方式与效标的一致性称为准则效度。如果效标或准则是依据将来实际发生的情况而建立的，那么这种准则效度可称为预测效度。如果效标识于某种测量方式同时被证明为有效的，则称之为共变效度。如果效标是以实际经验判断为准的，则称为实用效度。建构效度建构效度是要了解测量工具是否反映了概念和命题的内部结构。它通常在理论性研究中使用。由于它是通过与理论假设相比较来检查的，因此也称为理论效度。测量同一个概念可以用多个指标，当用X和Y的多个指标来测量两个概念之间的关系时，如果不同指标的测量都反映出理论所假设的关系，那么这些测量就具有建构效度。内在效度与外在效度内在效度与外在效度测量都是在具体的时间、地点对具体的调查对象所作的观测。如果在一项具体研究中，对上述三种效度（内容效度、准则效度、建构效度）的检查都没有发现问题的话，就可以认为这一研究具有内在效度，它的资料和结论可以有效的解答所研究的问题。内在效度是指一项研究的资料和结论的有效性。外在效度是指这种研究结论的普遍有效性。对外在效度的检查要考虑样本的代表性和特殊性，以及研究时间、地点、情境和研究内容的普遍意义。影响效度的因素：所有影响信度的因素也必然影响效度；除随机误差外，效度还受到系统偏差和其他变量的影响。对这些影响主要考虑两个方面：（1）测量工具；（2）样本的代表性。返回返回