资源预览内容
第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
第9页 / 共9页
亲,该文档总共9页全部预览完了,如果喜欢就下载吧!
资源描述
统计学简答题及参考答案1.简述描述统计学的概念、研究内容与目的。概念:它是研究数据收集、整理和描述的统计学分支。研究内容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。研究目的:描述数据的特征;找出数据的基本数量规律。2.简述推断统计学的概念、研究内容与目的。概念:它是研究如何利用样本数据来推断总体特征的统计学分支。研究内容:参数估计和假设检验的理论与方法。研究目的:对总体特征作出统计推断。3.什么是总体和样本?总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。可分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的,可数的。无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n 。4.什么是普查?它有哪些特点?普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点:1) 通常是一次性或周期性的2) 一般需要规定统一的标准调查时间3) 数据的规范化程度较高4) 应用范围比较狭窄。5.什么是抽样调查?它有哪些特点?抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。它具有经济性好、时效性强、适应面广、准确性高等特点。6.简述统计调查方案的概念及应包括的基本内容。答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。它应包括的基本内容有:1明确调查目的;2确定调查对象和调查单位;3设计调查项目;4设计调查表格和问卷;5确定调查时间;6组织实施调查计划;7调查报告的撰写,等等。7.简述统计分组的概念、原则和具体方法。答:(1)概念根据统计研究的目的和客观现象的内在特点,按照某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。统计分组标志有两种:品质标志或数量标志。(2)原则穷尽原则;互斥原则。 即“不重复、不遗漏”的原则。(3)具体分组方法 按品质标志分组 按数量标志分组(A)单项式分组与组距式分组;(B)间断组距式分组和连续组距式分组;应遵循“上限不在组内”原则:凡是总体中某一个单位的变量值为相邻两组的界限值,则这一个单位就归入作为下限值的那一组内。(C)等距分组与异距分组。8.简述组距分组的基本步骤。(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的(2)确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即: 组距(最大值 - 最小值) 组数(3)统计出各组的频数,并整理成频数分布表。9.简述算术平均数的概念及其数学性质。答:算术平均数是指一组数据的总和,除以这组数据的项数所得的结果。它是最常用的数值平均数,分为简单算术平均数和加权算术平均数两种。其数学性质是:(1)算术平均数与变量值个数的乘积,等于各个变量值的总和。 (2)各变量值与其算术平均数的离差之总和,等于零。 (3)各变量值与其算术平均数的离差平方之总和,为最小值。10.简述均值的概念和特征。 均值就是算术平均数,它的基本公式为: 算术平均数=总体标志总量/总体单位数=Xi/n 其特征如下:1) 集中趋势的最常用测度值2) 一组数据的均衡点所在3) 体现了数据的必然性特征4) 易受极端值的影响5) 用于数值型数据,不能用于分类数据和顺序数据6) 可根据原始数据或者分组数据来计算,计算公式略有差异。11.简述众数、中位数、均值的特点与应用场合。1) 众数l 不受极端值影响l 具有不唯一性l 数据分布偏斜程度较大时应用2) 中位数l 不受极端值影响l 数据分布偏斜程度较大时应用3) 均值l 易受极端值影响l 数学性质优良l 数据对称分布或接近对称分布时应用。12.简述算术平均数、众数、中位数的概念及数量关系。答:(1)概念 算术平均数是指一组数据的总和除以这组数据的项数所得的结果,也称为均值, 可用表示。它是最常用的数值平均数,分为简单的和加权的算术平均数两种。众数是指一组数据中出现频数最多、频率最高的变量值,可用 MO 表示。它是最常见、最普遍的状况,是对现象集中趋势的度量。 中位数是指将数据由小到大排列后,位置居中的数值,可用 Me 表示。(2)三者的数量关系是: 在对称分布中,三者相等。即:=Me=Mo;在左偏分布中,一般有MeMo; 在右偏分布中,一般有MoMe 。 在轻微偏态时,三者的近似数量关系为:。13.测定离散程度的变异指标有哪些?简述其主要作用。答:常用的变异指标有:异众比率、极差、四分位差、平均差、方差和标准差、离散系数等。 它们的主要作用为:1.说明数据的分散程度,反映变量的稳定性、均衡性;数据之间差异越大,表明变量的稳定性或均衡性越差。 2.衡量平均数的代表性高低;离散程度越大,表明平均数的代表性就越低。3.作为统计推断的重要依据。判别统计推断的前提条件是否成立;衡量推断效果好坏的重要尺度。14.简述方差和标准差的概念及其特征。方差是指各变量值与均值的离差平方的算术平均数,标准差则是方差的正平方根。两者都是标志变异指标,具有以下的特征:l 离散(变异)程度的测度值之一l 最常用的测度值l 反映了数据的分布特征l 反映了各变量值与均值的平均差异l 用于数值型数据,不能用于分类数据和顺序数据l 可根据总体数据或者样本数据来计算,计算公式略有差异。15.什么是离散系数?是变异指标与其相应的均值之比通常是用标准差与均值来对比是对数据相对离散程度的测度消除了数据水平高低和计量单位不同的影响用于对不同组别数据离散程度的比较计算公式为:16.简述概率抽样方式的概念和特点。是指根据一个已知的概率来抽取样本单位,也称为随机抽样。它包括四种基本抽样方式:简单随机抽样、分层抽样、系统抽样和整群抽样等。其特点是: 按一定的概率以随机原则抽取样本;抽取样本时,使每个单位都有一定的机会被抽中。 每个单位被抽中的概率是已知的,或是可以计算出来的; 当用样本对总体参数进行估计时,要考虑到每个样本单位被抽中的概率。17.什么是抽样分布?(1)是指样本统计量的概率分布,是一种理论分布l 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布(2)随机变量是样本统计量l 例如样本均值,样本比例,样本方差等(3)结果来自容量相同的所有可能样本(4)提供了样本统计量长远而稳定的信息,是进行抽样推断的理论基础,也是抽样推断科学性的重要依据。18.什么是中心极限定理?设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,即N(,2/n) 。19.什么是总体参数?1) 它是描述总体数量特征的概括性数字度量2) 是研究者想要了解的总体的某种数字特征值3) 人们所关心的参数主要有总体均值(m)、总体标准差(s)、总体比率()等4) 它是抽样统计推断的对象5) 总体参数通常用希腊字母表示。20.什么是样本统计量?1) 它是用来描述样本数量特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。2) 人们所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等。3) 样本统计量通常用小写英文字母表示。21.怎样正确理解抽样误差?(1)抽样误差是由于抽样的随机性所带来的误差(2)所有可能样本的统计结果与总体真实值之间的平均性差异(3)通常是可以计算和控制的。影响抽样误差大小的因素主要有:l 样本容量的大小l 总体的变异程度l 抽样方式l 抽样方法。22.简述抽样推断的点估计方法。点估计就是用样本统计量直接作为总体参数的估计值的抽样推断方法。例如:用样本均值直接作为总体均值的估计值又如:用两个样本均值之差直接作为总体均值之差的估计值它没有给出估计值接近总体参数程度的信息。点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。23.简述抽样推断的区间估计方法。区间估计就是在点估计的基础上,给出总体参数估计的一个区间范围,该区间是由样本统计量加减抽样误差而得到的。根据样本统计量的抽样分布,能够对样本统计量与总体参数的接近程度给出一个概率度量。比如,某班级的平均分数估计在7585之间,置信水平为95% 。24.影响置信区间宽度的因素有哪些?1) 总体数据的离散程度,用2来测度2) 样本容量(n)的大小3) 置信水平 (1 -),它影响 z 的大小4) 抽样方式5) 抽样方法25.必要的样本容量(n)与哪些影响因素有关?1) 总体标准差()或者方差(s 2)2) 允许误差(E)3) 可靠性系数(z或者t)4) 抽样方式5) 抽样方法26.什么是假设检验?假设检验是指先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计推断过程。有参数检验和非参数检验两类方法。它在逻辑上运用反证法,统计上依据小概率原理。27.简述假设检验的概念及基本步骤。答:所谓假设检验,就是事先对总体的参数或总体分布形式做出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著的系统性差异。所以,假设检验又被称为显著性检验。一个完整的假设检验过程,包括以下基本步骤:(1)针对具体问题,提出假设:原假设H0、备择假设H1;(2)构造适当的检验统计量Z(或者t),并根据样本数据,计算统计量的具体数值;(3)规定显著性水平,建立检验规则;(4)做出判断。临界值规则:如果Z(或者t)值落在拒绝域中,就拒绝H0。否则,就接受H0 。P-值规则:如果P,就接受H0 。28.解释假设检验中的两类错误第类错误(弃真错误)指原假设为真时,拒绝原假设。其发生的概率记为,称为显著性水平。第类错误(取伪错误)指原假设为假时,未拒绝(即接受)原假设。其发生的概率记为。29.简述假设检验中的小概率原理1) 小概率是指在一次试验中,一个几乎不可能发生的事件发生的概率。2) 在一次试验中小概率事件一旦发生,我们就有足够的理由拒绝原假设。3) 小概率由研究者事先确定。30.解释假设检验的决策规则 1. 给定显著性水平,查表得出相应的临界值za或za/2, ta或ta/2 2. 将检验统计量的数值与水平的临界值进行比较 3. 作出决策 双侧检验:|统计量| 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H031.简述假设检验的基本步骤1. 陈述原假设H0和备择假设H12. 从所研究的总体中抽出一个随机样本3. 确定一个适
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号