2022年教育统计学与SPSS名解总结-

. . 第一章导论（阅览前必读：书上每个章节后的名解我全都列出来了，黑色字体的都是书上原文，量多，但有些不重要的名解没必要背，你挑着背不要被吓到。绿色是章节题目，红色的就是我的一些说明、补充、吐槽，一个人打字很无聊啊有木有！一直自言自语啊有木有！并非书上的名词解释，看看就好，可删。这段紫色的也删了哈。接下来正文，走你！）统计学（ statistics）：即研究统计原理与方法的科学。教育统计学（ educational statistics ）：是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料，如何根据这些资料所传递的信息，进行数学推论，找出客观规律的一门学科。简言之，教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。描述统计（ descriptiive statistics）：是实验或调查所获得的数据加以整理（如制表、绘图），并计算其各种代表量数（如集中量数、差异量数、相关量数等），其基本思想是平均。Or：是研究如何整理心理与教育科学实验或调查得来的大量数据，描述一组数据的全貌，表达一件事物的性质的一种统计方法。推断统计（ inferencial statistics ）：又称抽样统计，它是根据对部分个体进行观测所得到的信息，通过概括性的分析、论证，在一定可靠程度上去推测相应的团体。Or：是研究如何通过局部数据所提供的信息，运用概率的理论进行分析论证，在一定可靠程度上推论总体或全局情形的统计方法。这是统计学中的主要内容。实验设计（ experimental statistics ）：是研究如何更加合理、有效的获得观测资料，如何更正确、更经济、更有效的达到实验目的，以揭示实验中各种变量关系的实验计划。Or：实验者为了揭示实验中自变量与因变量的关系，在实验之前所制定的实验计划，称为实验设计。他是研究如何科学地、经济地以及更有效地进行实验。统计常态法则：从总体中随机抽取一部分个体所组成的样本，差不多可以保持总体的特征。小数永存法则：从总体中抽取的第一个样本中所表现的特性，在其他样本中也会存在。大量惰性原则：某一事物的某一性质或状态，在反复观察或试验中是保持不变的。有效数字：是指能影响测量准确性的数字。随机变量（ random variable）：在统计学中把在取值之前不能预料到取什么值的量称为变量（随机变量）。数据（ data）：如果一旦某个数值被取定了，成这个数值为随机变量的一个观察值，即数据。总体（population ）：指客观存在的，并在同一性质的基础上结合起来的许多个别单位的整体，即具有某一特性的一类事物的全体，又叫母体或全域。个体（ individual ）: 构成总体的基本单位或单元，又称元素或个案。样本（ sample）：从总体中抽取的一部分个体。参数（ parameter ）：表示总体特征的量数。统计量（ statistic）：是直接从样本计算出的量数，代表样本的特征。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页，共 10 页. . 名称变量（ nominal variable）：指一事物与其他事物在属性、类别上不同。其数据形式是计数数据。顺序变量（ ordinal variable ）：指事物的某一属性的多少或大小按顺序排列起来的变量。等距变量（ interval variable ）：指只具有相等的单位，而没有绝对的零点的变量。比率变量（ ratio variable ）：是一种既有相等的单位，又有绝对零点的变量，又称等比变量。连续变量（ continuous variable ）：指取值可以是某区间内任一数值的随机变量，它是指测量单位之间可以划分成无限多个细的小单位的，其数字形式多取小数。离散变量（ discrete variable）：指测量单位之间不能再细分的数字资料，其数字形式常取整数。计数数据（ attribute data ）：即计算人或物的个数所获得的数据。度量数据（ quantitative data ）：用一定的测量工具或测量标准测量时所获得的数据。指标（ index）：表明总体数量特征的概念和具体数值，又称统计指标。标志（ mark）：指统计总体中各个个体共同具有的属性和特征，它是说明个体属性和特征的名称。绝对数（ absolute number ）：是用来表明在一定时间、地点条件下某种教育、心理现象的总体规模和发展水平的统计指标，又称总量指标。相对数（ relative number ）：教育与心理现象中两个单位相同的相互联系的指标数值的比率。品质标志：主要是日常工作中的记录和统计报表等。（p17 第四段里）数量标志：是在一定时限内所收集有关问题的资料，来源主要有调查、测量和实验。（p17 第四段里）第二章数据的收集、整理与表达次数（ frequency）：某一事件在某一类别中出现的数目，又叫频数，用f 表示。频率（ relative frequency ）：指每一组的数据个数除以数据的总和，又称相对次数，用 p 表示。百分频率：是频率与百分数的乘积，即p%. 组中值（ class mid-value）：每一组的中点值，常用m 或 xc表示全距（ range Rg）：是全部数据的距离，也称极差，用最大值减去最小值。组距 (interval) ：指每一组所包含的间隔或数据单位，用i 表示。组限（ boundaries of group ）：是每一组的起止点或每一组的界限。统计表（ statistical table ）：以表格的形式表达统计资料数量关系的方式或工具。统计图（ statistical graph）：是以几何图形和形象图形表示统计资料数量关系的工具。次数分布：（搞不清）精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页，共 10 页. . 累积次数（ cumulative frequency ）：以简单次数为基础，从最低组开始逐级累加直至最高组，或从最高组开始逐级累加直至最低组。累积百分频率：（无视）一时性资料：（p24 倒数第二段里）经常性资料：（p24 倒数第一段里）直条图（ thermometer chart ）：用直条（或矩形）的长短表示统计数据多少的图形。直方图（ histogram ）：以矩形面积表示连续变量的统计图。折线图（ line chart ）：以纵轴的高度表示次数，并将各点用线段连接的统计图性。散点图（ scatter diagram）：用于表示事物相互关系的统计图。圆形图（ pie diagram）：用圆的面积表示一组数据的整体，用扇形表示各组成部分所占比重或百分比的统计图。第三章集中量数集中量数（ central measures）：（p42 里）集中趋势（ central tendency ）：（p42 里）（算数）平均数（arithmetic mean ）：是所有观测值（或变量值）的总和除以总数所得的商。简称平均数、均数或均值。中数中位数（ Median）：是位于按一定顺序排列的一组数中央位置的数值，用符号Mdn 或Md表示。众数（ Mode ）：是指一群数据中出现次数最多的那个数值，又称范数，用符号Mo表示。几何平均数（ geometric mean ）：几个变量值乘积的n 次方根。调和平均数（ harmonic mean ）：指一群数据倒数的算术平均数的倒数，又称倒数平均数。百分位数（ Percentile）：（呃任意百分位上的数。）四分位数：即四分之一位置和四分之三位置上的数。第四章差异量数离中趋势（ divergence tendency ）：（p62 最后一段里）差异量数（ divergence measures）：（p62 最后一段里）方差（ variable）：是离均差平方的算术平均数，表示一列数据平均差距的平方，其样本方差用符号 S2表示，总体方差用符号2表示。标准差（ Standard Deviation）：方差的算术平方根，表示一列数据的平均差距。样本标准差用符号 S或 SD表示，总体标准差则用符号表示。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页，共 10 页. . 中心动差：以均数为原点计算的统计动差叫做中心动差。平均差（ Average Deviation ）：是以离差绝对值的和除以总次数所得的商。平均差用符号AD表示。全距（ Range）：一列数据中最大数与最小数的差距，又称极差。用符号Rg表示。偏态量：（p73 只可意会）峰态量：（p73 不可言传）百分位差（ Percentile deviation ）：表示某两个百分位数之间差异程度的指标。常用的百分位差如： P93-P7， P90-P10. 四分位差（ Quartile deviation ）：（p70）统计动差：（ p72 中间）第五章相对量数相对地位量数：（p80 中间）相对差异量数（Coefficient of Variation ）：指差异量数与集中量数的百分比，又称作差异系数，用符号 CV表示。百分等级（ Percentile Rank）：指把一组观测值先按高低次序排列起来，然后计算出某个个体的分数在百分位上超出多少人，或是在此分数下占多少百分比的一种量数，用符号 PR表示。标准分数（ standard scare）：（p84 标准分数有许多变形，其中最典型的标准分数为Z分数或称基分数。没发现ta 的定义） Z标准分数是以标准差为单位所表示的“原始分数” 与平均数的偏差，亦即原始分数与其平均数之差除以标准差所得的商。标准差系数：是标准差与平均数的百分比，用符号CVS表示。第六章相关量数相关量数：（不认得）正相关（ positive correlation ）：指一列变量由大而小或由小而大变化时，另一列变量亦由大而小或由小而大的变化，即两列变量是同方向变化的，属“同增共减”的关系。负相关（ negative correlation ）：指一列变量由大而小或由小而大的变化，另一列变量却反由小而大或由大而小的变化，即两列变量的变化方向是相反的，属“此增彼减”的关系。零相关（ zero correlation ）：又称无相关，是一列变量由大而小或由小而大变化时，另一列变量则或大或小的变化，即两列变量的变化看不出一定的趋势，甚至毫无关系。相关系数（ correlation coefficient ）：表示相关方向和大小的一种数值，用符号r 表示。其取值范围为 -1r+1。直线相关（ line correlation ）：指两列变量中的一列变量在增加时，另一列变量随之而增加；或一列变量在增加，另一列变量却相应地减少，形成一种直线关系。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页，共 10 页. . 曲线相关（ curve correlation ）：指两列相伴随变化的变量，未能形成直线关系。简（单）相关（simple correlation ）：指只有两个变量的相关。复（杂）相关（complex correlation ）：指有三个或三个以上变量的相关。积差相关（ product moment correlation）：又叫均方相关、积矩相关或皮尔逊相关用符号rXY表示。是利用离差乘积的关系来说明事物的关系，是将原始记分转换为离差乘积（即积差），再转换为标准积差后所求得的标准积差的平均数。（ps：极差的平均数称协方差）斯皮尔曼等级相关（Spearmans rank correlation ）：是根据两列变量的成对等级差数计算的相关系数，又叫“等级差数法”，用符号rP或 rS表示。肯德尔W 系数：（ p108 有公式，这个算不上名解吧，和“肯德尔和谐系数”有点差别）用于一般等级评定的资料，一是K 个评分人评价N 个被评价人或N 件作品，以分析和评价K个评分人的评价是否一致，二是同一个人先后K次评价 N 个被评人或N 件作品，以分析其前后评价是否一致。PS ：肯德尔和谐系数由统计学家肯德尔（Kendel ）提出的肯德尔交错系数、相容性系数和一致性系数等三种等级相关系数的总称。肯德尔一致性系数是用于描述多列等级变量相关程度或一致性程度的相关方法，其中又有肯德尔W系数和肯德尔U系数，它分别用于不同的资料形式。点二列相关（ point biserial correlation ）：研究一列等距或比率变量与一列“二分”名称变量之间相关的统计方法。用符号rpb表示。二列相关（ biserial correlation ）：研究一列正态的比率或等距变量和一列人为“二分”名称变量之间相互关系的统计方法，用符号rb或 rbis表示。Phi 系数相关 (phi correlation) ：专门研究二列“二分”名称变量之间相关的统计方法。第七章概率分布及其应用二项分布（ binomial distribution ）：是二项试验（如成功与失败）结果的概率分布。正态分布（ normal distribution ）：中间量数次数分布多，两端量数次数分布少，呈对称型的概率分布，又叫高斯分布。t 分布（ Student distribution ）：由小样本统计量形成的概率分布，也称“学生氏分布”。频率：一种随机事件发生的次数与总试验次数的比值。概率（ probability ）：随机事件在试验中发生可能性的程度或可能性的大小，用符号P表示。中心极限定理（central limit theorem ）：（p139 木有定义，理解）是用极限的方法所求的随机变量分布的一系列定理，其内容主要反映在三个方面。1如果总体呈正态分布，则从总体中抽取容量为n 的一切可能样本时，其样本均数的分布也呈正态分布；无论总体是否服从正态分布，只要样本容量足够大，样本均数的分布也接近正态分布。2从总体中抽取容量为n 的一切可能样本时，所有样本均数的均数（X）等于总体精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页，共 10 页. . 均数（）即：X3从总体中抽取容量为n 的一切可能样本时，所有样本均数的标准差（X）等于总体标准差除以样本容量的算数平方根，即：nX随机抽样：（木有找到）随机样本（ random sample ）：指按照概率的规律抽取的样本。抽样误差（ sampling error）：从总体中抽取容量为n 的 k 个样本时，样本统计量与总体参数之间总会存在一定的差距，而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同，称为抽样误差。标准误（ Standard Error ）：样本统计量分布的标准差或某统计量在抽样分布上的标准差，符号 SE或X表示。自由度（ degree of freedom）：一群数据或观测值可以独立自由变动的数目称为自由度，用符号 df 或 n 表示。确定性事件（ deterministic event ）：指在一定条件下必然会发生或必然不会发生的事件。必然事件（ necessary event）：指在一定条件下必然会发生的事件。不可能事件（ impossible event ）：指在一定条件下必然不会发生的事件。随机事件（ random event ）：指在一定条件下，可能发生，也可能不发生的事件。模糊事件（ fizzy event）：指对象类属边界和性态不确定的事件。概率的统计定义：P123 指通过频率来计算的概率，又称为经验概率（empirical probability ）。概率的古典定义：P123 根据问题本身所具有的“对称性”特点直接计算事件的概率，又称先验概率（ prior probability ）。第八章参数估计参数估计（ parameter estimation ）：就是根据样本统计量去估计相应总体的参数。总体平均数估计：用样本均数去估计总体均数。点估计（ point estimation ）：在参数估计中直接以样本的统计量（数轴上的一个点）作为总体参数的估计值。区间估计（ interval estimation ）：以一个统计量的区间来估计相应的总体，它要求按照一定的概率要求 , 根据样本统计量来估计总体参数可能落入的数值范围。也就是说区间估计是用两个数之间的距离或数轴上的一段距离来表示未知参数可能落入的范围。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页，共 10 页. . 置信系数（ confidence coefficient ）：指被估计的总体参数落在置信区间内的概率D，或以 1-表示。又叫置信水平、置信度、可靠性系数和置信概率。置信区间（ confidence interval）：指在特定的可靠性（即置信系数）要求下，估计总体参数所落的区间范围，亦即进行估计的全距。置信限（ confidence limit ）：被估计的总体参数所落区间的上、下界限。推断统计：指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体，由已知推未知的过程。假设检验 (hypothesis test) ： p147 主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验，又称统计检验（statistical test ）。无偏估计量 (unbiased estimator ）：（p148 最下面，无偏性要求在用各个样本的统计量作为估计值时，其偏差为0，这时的统计量被称为无偏估计量。）第九章参数检验假设检验：（呃， p162 最后一段）错误（ -error ）：指虚无假设本身是正确的，但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域，致使我们作出了拒绝虚无假设的结论，又称I 型错误（ type error）。错误（ -error ）：指虚无假设本身不正确，但由于抽样的随机性而使检验值落入了接受虚无假设的区域，致使我们作出了接受虚无假设的结论，说明事物之间没有显著的差异，又称型错误（ type error）。双侧检验（two-side test ）：是把拒绝性的概率值置于理论分布的两端或两侧，也称双侧检验。单侧检验（ one-side test）：把拒绝性概率值置于理论分布的一尾或一侧，也称单侧检验。虚无假设（ null hypothesis ）：研究人员为了证实研究假设是真的而利用概率论的反证法所进行的假设，即从研究假设的反面进行假设，用符号H0表示。研究假设（ alternative hypothesis ）：就是实验人员希望证实的假设。显著性水平（ level of significance）：指拒绝虚无假设的小概率值。方差齐性： p169 只提到总体方差齐性是指两个总体之间的方差相等或一致。独立样本（ independent sample ）：指从两个无关的总体中随机抽取的两个或多个样本，或者说是独立抽取的，彼此间的数据不存在对应关系的样本。相关样本（correlative sample ）：从具有一定程度相关的总体中抽取的两个或多个样本，亦即彼此的观测值之间存在一一对应关系的样本。第十章方差分析方差分析（ analysis of varianceANOVA）：对多个平均数进行比较的一种统计方法，又称变异数分析。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页，共 10 页. . 变异率：根据方差分析的原理，比较组间变异和组内变异，其比值称变异率。组间变异（ variation between classes ）：组与组之间的差异称组间变异。组内变异（ variation within classes ）：同一组内部被试（个体）之间的差异称组内变异。区组变异：（ p212 第二段，木有具体定义）多重比较（multiple comparisons ）：（P214 第一段，无明确定义。进一步分析各对平均数之间的差异。）因素：（没找到，应该就是“自变量”吧？）水平处理：（一样没看到orz）F分布：由F值构成的概率分布，属单侧检验，即分子是否大于分母的检验。第十一章回归分析回归分析（ regression analysis）：根据一个已知变量来预测另一个变量平均值的统计方法。回归线（ regression line）：（p235 最上方，理解，很简单）回归系数（regression coefficient ）：（p235 下面）即斜率 b，是线性回归方程中自变量的系数，表示自变量变化一个单位时因变量变化的单位数。最小二乘法：这种方法需要我们找到这样一条直线，使所有的点到直线的垂直距离（与X轴垂直）的平方和最小，也称最小平方法（least squares method）或最小二乘估计（least square estimation）。线性方程： p233-p256（表知道，自个理解，回归分析按形状分为线性回归和曲线回归。）一元线性方程：（同不知道， p235 有公式）只有一个自变量的balabala 多元线性方程：（表问我）同时处理多个变量关系baabala 预测标准误：（p246 中间，唉）测定系数：相关系数的平方，用于说明一个变量由另一个变量解释的程度。偏回归系数：（没找到。 Ps：下面四个名解都是阅读材料里的。怨念，可以无视。）偏相关：排除一个（或两个）变量后再求另两个变量的相关称偏相关。多元测定系数：复相关系数的平方。复相关：（这一章木有定义，见第六章，有哦！）第十二章计数数据分析方法 x2检验x2检验（ chi-square test）：检验实测次数与期望次数是否一致的统计方法。适合性检验（ goodness of fit test ）：是检验实际的观察次数与某一理论模型是否相符，又称精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页，共 10 页. . 为 1C表的 x2检验。也称单因素计数资料的检验。独立性检验（ test for independence ）：处理二元分类资料的x2检验方法，即把一组实验对象按两个标准（变量）分类，一个变量列在行内，另一个变量列在列内，形成列联表。x2分布：（没发现定义）正态拟合性检验：（这货的影子都没瞧见）第十三章非参数检验参数检验：（木有p278 第二段如是说：像Z检验、 t 检验、 F检验等均称为参数检验）非参数检验（non-parameteric test ）：不需要假设样本是否为正态分布或方差是否为齐性的检验称非参数统计检验（nonparameteric ）。（这两货差不多，p278 中间）符号检验（ sign test）：指利用正负号为资料检验两个相关样本差异显著性的统计方法。符号等级检验（signed rank order test ）：是利用成对数据的符号及差值大小顺序检验两个相关样本差异显著性的统计方法，也称Wilcoxon 检验法。秩和检验（rank sum test）：是两独立样本t 检验的非参数替代物，又称 M-W 检验或 U 检验。中位数检验（ median test ）：检验两个或两个以上独立样本差数之间有无显著差异的方法。等级方差分析：（没定义， p289）第十四章实验设计实验设计（ design of experiments ）：广义的指包括整个实验程序的设计，即实验程序的全部设计和安排，具体包括确定课题、选择课题、制定实验方案、提出实验方法、实施实验和处理并解释实验结果等。狭义的是制定关于实验进程的计划，即实验方案。（第一章也有这个名解，意思差不多）实验单位（ experiments unit ）：是实验所抽取的实验对象，即被试（subjects）。实验因素因子（ experiments factor ）：对实验结果可能产生影响的自变量。因子水平：简称水平（level），它是给定的因子取值（定量的）或特定因子的配置（定性的）。处理组合：简称处理（treatment ），它是不同因子的相应水平所构成的组合。效应（ effect）：它是因子的某个水平或处理在一个实验单位上所做的测量。单因素实验设计：只有一个实验因素，即一个自变量的实验设计。多因素实验设计：有两个或两个以上因素的设计。单组设计：对随机抽取的一组被试先后进行两种不同水平实验的实验设计。等组设计：在两个或两个以上的等值组分别实施不同处理的实验设计。轮组设计：在两个或两个以上等值组将不同的实验处理轮流进行的实验设计。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页，共 10 页. . 完全随机设计（completely randomized design ）：就是随机地抽取研究对象并随机将其分配至各种实验条件进行实验的设计形式。换言之，就是每一随机组分别接受一种实验处理的设计。也称为独立组设计或被试间设计。随机区组设计（completely randomized block design）：是指每个区组均随机地实施或接受全部实验处理组合或因素水平的实验设计类型，又称相关组设计或被试者设计。简单随机抽样（simple random sampling ）：是按随机原则直接从总体中抽取实验单位作为样本的方法，又称纯随机抽样。系统抽样（ systematic sampling）：以某个随机数字为起点，间隔一定单位抽取的样本。分层抽样（stratified sampling ）：指先按照有关标志把总体划分为若干层次，再根据样本与总体的比率，在每一层进行抽样的方法，又称按比例分层抽样。整群抽样（ cluster sampling）：指以群为抽样单位进行的抽样。抽样框：（木有）交叉分层抽样：（木有）区域抽样：（木有）以上 FIN End. 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页，共 10 页