资源预览内容
第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
第5页 / 共37页
第6页 / 共37页
第7页 / 共37页
第8页 / 共37页
第9页 / 共37页
第10页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
安徽大学安徽大学,第第1章统计和统计数据章统计和统计数据的搜集的搜集第一章第一章 统计和统计数据的搜集统计和统计数据的搜集第一节第一节 统计的涵义和统计学中的统计的涵义和统计学中的 几个基本概念几个基本概念 第二节第二节 数据的类型数据的类型第三节第三节 数据的来源数据的来源第四节第四节 搜集数据的组织方式搜集数据的组织方式综合反映综合反映总体总体数量特征数量特征的的概念概念和和数值数值。指标指标指标体系:具有内在联系的一些指标构成的整体。指标体系:具有内在联系的一些指标构成的整体。构成要素构成要素定性规范(指标名称和指标含义)定性规范(指标名称和指标含义)定量方法(计量单位和计算方法)定量方法(计量单位和计算方法)指标数值(在具体时间和空间上数量表现)指标数值(在具体时间和空间上数量表现)标志标志说明总体单位属性、特征的名称。说明总体单位属性、特征的名称。标志值标志值是标志的具体表现。是标志的具体表现。品质标志:标志值是以用文字表示的属性品质标志:标志值是以用文字表示的属性分类分类数量标志:数量标志:标志值是以标志值是以用数字表示的特征用数字表示的特征姓名姓名性别性别民族民族工种工种年龄年龄工龄工龄工资工资张张月芳月芳女女汉族汉族餐厅服务员餐厅服务员30岁岁10年年1200王云王云龙龙女女回族回族大堂经理大堂经理33岁岁15年年1800标志标志标志值标志值品质标志品质标志数量标志数量标志例例:描述统计学是推断统计学的前提,描述统计学是推断统计学的前提,推断统计学是描述统计学的发展。推断统计学是描述统计学的发展。 (一)描述统计学(一)描述统计学 描述统计学是关于搜集、展示一批数据并反映这批数据特征的描述统计学是关于搜集、展示一批数据并反映这批数据特征的各种方法,用来说明总体的数量特征。各种方法,用来说明总体的数量特征。 (二)推断统计学(二)推断统计学 推断统计学是用样本统计量估计和推断总体参数的技术和方法,推断统计学是用样本统计量估计和推断总体参数的技术和方法,包括参数估计和假设检验。包括参数估计和假设检验。三、统计学的内容三、统计学的内容 一、定性数据和定量数据一、定性数据和定量数据 定性数据:定性数据:用文字描述的数据用文字描述的数据 定量数据:定量数据:用数字描述的数据用数字描述的数据 二、离散型数据和连续型数据二、离散型数据和连续型数据 离散型变量:离散型变量:数据是可列的,通常只能取整,任意两个相邻数数据是可列的,通常只能取整,任意两个相邻数值之间不存在其它数值。值之间不存在其它数值。 连续型变量:连续型变量:数据的取值是连续不断的,可以取介于两个数值数据的取值是连续不断的,可以取介于两个数值之间的任意数值。之间的任意数值。第二节第二节 数据的类型数据的类型若我们所研究现象的属性和特征的具体表现在不同时间、不同空若我们所研究现象的属性和特征的具体表现在不同时间、不同空间或不同单位之间可取不同的数值,则可称这种数据为间或不同单位之间可取不同的数值,则可称这种数据为变量变量。 http:/www.stats.gov.cn/ 三、截面数据和时间序列数据三、截面数据和时间序列数据 截面数据:截面数据:不同单位在同一时间的数据不同单位在同一时间的数据 时间序列数据:时间序列数据:同一总体或单位在不同时间的数据同一总体或单位在不同时间的数据 四、原始数据和次级数据四、原始数据和次级数据 原始数据:原始数据:直接从各个调查单位搜集的、尚未经过整理的统计数直接从各个调查单位搜集的、尚未经过整理的统计数据资料,也称一手数据。据资料,也称一手数据。 次级数据:次级数据:指那些已经经过加工整理的,往往是公开发表的数据,指那些已经经过加工整理的,往往是公开发表的数据,也称二手数据。也称二手数据。 (一)定类数据(定名数据):(一)定类数据(定名数据):只对事物的某种属性和类别进行具只对事物的某种属性和类别进行具体的定性描述体的定性描述 特征:特征:仅仅形成各种类型,排序无关紧要仅仅形成各种类型,排序无关紧要 运算:运算:计数(、计数(、) (二)定序数据(序列数据):(二)定序数据(序列数据):对事物所具有的属性顺序进行描述对事物所具有的属性顺序进行描述 特征:特征:不仅形成各种类型,而且有确定的排序不仅形成各种类型,而且有确定的排序 运算:运算:计数、排序(、计数、排序(、) 五、数据的四个层次五、数据的四个层次(三)定距数据(间距数据):(三)定距数据(间距数据):对现象类别或次序之间间距的测度。对现象类别或次序之间间距的测度。 特征:特征:可分类、排序;有基本的测量单位;可分类、排序;有基本的测量单位;无绝对的无绝对的“零点零点”。 运算:运算:计数、排序、加减。计数、排序、加减。(四)定比数据(比率数据):(四)定比数据(比率数据):可以反映现象数量的比率关系。可以反映现象数量的比率关系。 特征:特征:可分类、排序、有基本的测量单位;而且有绝对的可分类、排序、有基本的测量单位;而且有绝对的“零点零点”。 运算:运算:计数、计数、排序、排序、加减、乘除。加减、乘除。定类数据定类数据(分类)(分类)定序数据定序数据(分类、排序)(分类、排序)定距数据定距数据(分类、排序、加减)(分类、排序、加减)定比数据定比数据(分类、排序、加减、乘除)(分类、排序、加减、乘除)对对定定性性数数据据的的测测定定对对定定量量数数据据的的测测定定 一、数据的来源一、数据的来源 (一)从政府机构、各种行业组织、公司和企业所公布的数(一)从政府机构、各种行业组织、公司和企业所公布的数据中获取据中获取 (二二)设计一次试验以获取必要的数据设计一次试验以获取必要的数据 (三三)从观察研究中获取从观察研究中获取 (四四)进行一次调查进行一次调查第三节第三节 数据的来源数据的来源二、统计调查方案的内容二、统计调查方案的内容 (一)确定调查的目的(一)确定调查的目的确定调查目的,就是要确定调查目的,就是要明确在调查中应解决哪些问题明确在调查中应解决哪些问题,通过调查要获得,通过调查要获得哪些资料,并说明用什么途径取得这些资料等。哪些资料,并说明用什么途径取得这些资料等。要求具体明确、中心突出。要求具体明确、中心突出。调查对象,调查对象,就是本次要进行调查的客观事物就是本次要进行调查的客观事物总体总体。调查单位,调查单位,是指组成所要调查的客观事物总体的个体,即进行登记的是指组成所要调查的客观事物总体的个体,即进行登记的标志承担者标志承担者。(二)确定调查的对象和调查单位(二)确定调查的对象和调查单位调查单位与填报单位是两个不同的概念,有时一致,有时不一致。调查单位与填报单位是两个不同的概念,有时一致,有时不一致。(三)确定调查项目(三)确定调查项目调查项目,是指调查时要登记的调查单位的特征。完全由调查的目调查项目,是指调查时要登记的调查单位的特征。完全由调查的目的任务和调查对象的性质特点所决定,包括由品质标志和数量标志所构的任务和调查对象的性质特点所决定,包括由品质标志和数量标志所构成的成的标志标志体系。体系。所选择的项目必须是能够取得确切资料的。所选择的项目必须是能够取得确切资料的。调查的每调查的每个项目应该有确切的涵义和统个项目应该有确切的涵义和统的解释。的解释。各个调查项目之间尽可能做到互相联系、与以往同类调各个调查项目之间尽可能做到互相联系、与以往同类调查项目彼此衔接、对应。查项目彼此衔接、对应。 要求:要求:(四)设计调查表格和问卷(四)设计调查表格和问卷 调查表:调查表:将各个调查项目按照一定的顺序排列在一定的表格上,就将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。构成了调查表。 问卷:问卷:根据调查目的,在调查对象中随机选择或有意识地确定调查根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以书面文字或表格形式了解被调查者的意见,调查者自愿、自由单位,以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的问题。地回答问卷中所提出的问题。(五)确定调查时间(五)确定调查时间调查时间调查时间(六)统计调查的组织实施工作(六)统计调查的组织实施工作进行调查工作的期限,包括搜集资料和报送资进行调查工作的期限,包括搜集资料和报送资料的整个工作所需要的时间。料的整个工作所需要的时间。调查资料所属的时间调查资料所属的时间时点时点时期时期组织工作计划包括明确调查机构、调查地点、选择调查的组织形式、组织工作计划包括明确调查机构、调查地点、选择调查的组织形式、调查前的准备工作等问题。调查前的准备工作等问题。第四节第四节 搜集数据的组织方式搜集数据的组织方式 统计数据搜集是指根据统计研究预定的目的要求和任务,运用相应统计数据搜集是指根据统计研究预定的目的要求和任务,运用相应的科学的调查方法与手段,的科学的调查方法与手段,有计划、有组织有计划、有组织地向客观实际搜集资料。地向客观实际搜集资料。 从过程的阶段性看,统计数据的搜集处于统计工作过程的从过程的阶段性看,统计数据的搜集处于统计工作过程的基础阶段基础阶段。 社会经济统计数据的搜集通常是通过调查取得。统计调查按组织方社会经济统计数据的搜集通常是通过调查取得。统计调查按组织方式分为:式分为:统计报表制度、普查、重点调查和抽样调查统计报表制度、普查、重点调查和抽样调查等。等。 一、统计报表制度一、统计报表制度 统计报表制度统计报表制度是按照一定的表式和要求,由政府部门自上而下统是按照一定的表式和要求,由政府部门自上而下统一布置,由企事业单位自下而上提供统计资料的一种统计调查方法一布置,由企事业单位自下而上提供统计资料的一种统计调查方法。 这种搜集统计数据方法是伴随着计划经济而产生的,并曾在我国占主这种搜集统计数据方法是伴随着计划经济而产生的,并曾在我国占主导地位。现在,在社会主义市场经济条件下,仍是我国搜集统计数据的组导地位。现在,在社会主义市场经济条件下,仍是我国搜集统计数据的组织方式之一。织方式之一。统计报表的主要特点:统计报表的主要特点:第一,资料的来源是各个基层单位的原始记录。第一,资料的来源是各个基层单位的原始记录。第二,逐级上报和汇总的。第二,逐级上报和汇总的。第三,属于经常性(连续性)调查,调查项目相对稳定。第三,属于经常性(连续性)调查,调查项目相对稳定。二、重点调查二、重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查。是指在调查对象中,只选择一部分重点单位进行的非全面调查。重点单位:重点单位:着眼于现象量的方面而言,尽管这些单位在全部单位中只着眼于现象量的方面而言,尽管这些单位在全部单位中只 是一部分,是一部分,但但其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。调查任务:调查任务:及时了解总体基本情况,为主管部门指导工作服务。及时了解总体基本情况,为主管部门指导工作服务。适用范围:适用范围:当调查目的只要求掌握基本情况,而且总体中存在重点单当调查目的只要求掌握基本情况,而且总体中存在重点单 位。位。为了某种特定的目的而组织的对总体中的为了某种特定的目的而组织的对总体中的全部单位全部单位都进行的调查。都进行的调查。特点:特点:工作量大,时间性强,需要大量人力和财力。工作量大,时间性强,需要大量人力和财力。任务:任务:搜集重要的搜集重要的国情国力和资源状况国情国力和资源状况的全面资料,为政府制的全面资料,为政府制 定规划、方针政策提供依据。定规划、方针政策提供依据。三、普查三、普查 (一)非随机抽样:(一)非随机抽样:不按随机原则来抽取样本单位,也称非概率抽样不按随机原则来抽取样本单位,也称非概率抽样 判断抽样:判断抽样:又称为典型调查,从总体中又称为典型调查,从总体中有意识地有意识地选择若干有代表性的典选择若干有代表性的典型单位组成样本进行调查。型单位组成样本进行调查。 定额抽样:定额抽样:是将总体依某种标准分层(群),然后按照各层样本数与该是将总体依某种标准分层(群),然后按照各层样本数与该层总体数成比例的原则层总体数成比例的原则主观抽取样本主观抽取样本。 方便抽样:方便抽样:样本限于总体中易于抽到的一部分样本限于总体中易于抽到的一部分, ,没有保证总体中的每一没有保证总体中的每一成员都具有同等被抽中的概率。如街头偶遇式抽样成员都具有同等被抽中的概率。如街头偶遇式抽样。四、抽样调查四、抽样调查 1 1、特点、特点(1 1)按随机原则从总体中抽取样本;)按随机原则从总体中抽取样本;(2 2)以样本指标为依据推断总体参数或检验总体的某种假设;)以样本指标为依据推断总体参数或检验总体的某种假设;(3 3)抽样误差可以事先计算并加以控制;)抽样误差可以事先计算并加以控制;(4 4)优点:时效性、经济性、科学性。)优点:时效性、经济性、科学性。(二)随机抽样:(二)随机抽样:根据随机原则来抽取样本单位根据随机原则来抽取样本单位2 2、适用范围、适用范围第一,不可能或不必要进行全面调查的社会现象;第一,不可能或不必要进行全面调查的社会现象;第二,对普查资料进行必要的修正。第二,对普查资料进行必要的修正。 (1 1)简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样) 概念:概念:简单随机抽样对总体单位不作任何分类或排序,完全按简单随机抽样对总体单位不作任何分类或排序,完全按照随机原则逐个抽取样本单位。照随机原则逐个抽取样本单位。 方法:方法: 放回抽样:放回抽样:每次都是从每次都是从N N的总体中抽取一个单位,任意一个单位的总体中抽取一个单位,任意一个单位在某一次被抽中的机会为在某一次被抽中的机会为1/N1/N,那么所有可能的样本数量为,那么所有可能的样本数量为 个。个。 不放回抽样不放回抽样:每次都是从剩下未抽中的单位中抽取,所有可能样:每次都是从剩下未抽中的单位中抽取,所有可能样本有本有 个。个。 适用范围:适用范围:总体规模不大内部差异也不大总体规模不大内部差异也不大 3 3、组织方式、组织方式 概念:概念:系统抽样是将抽样框中的系统抽样是将抽样框中的N N个单位按照一定的顺序编号,并个单位按照一定的顺序编号,并分成分成n n个系统,每个系统中有个系统,每个系统中有 (取整)个单位,从抽样框的第一个系(取整)个单位,从抽样框的第一个系统中的统中的k k个单位中随机抽出第一个样本单位,然后每隔个单位中随机抽出第一个样本单位,然后每隔k k个单位再抽一个。个单位再抽一个。 方法:方法: 一是利用现有的顺序或编号一是利用现有的顺序或编号 ; 二是根据相关变量对抽样框中的单位进行编号。二是根据相关变量对抽样框中的单位进行编号。 适用范围:适用范围:当现象存在某种趋势或周期性时,应避免抽样间隔与当现象存在某种趋势或周期性时,应避免抽样间隔与现象本身的周期性相吻合现象本身的周期性相吻合。 (2 2)系统抽样(等距抽样)系统抽样(等距抽样) (3 3)分层抽样(类型抽样)分层抽样(类型抽样) 概念:概念:首先要根据一些相同的特征将抽样框中的首先要根据一些相同的特征将抽样框中的N N个单位划个单位划分为不同的层或类型,然后从每一层中都采用简单随机抽样,再把分为不同的层或类型,然后从每一层中都采用简单随机抽样,再把每一层的简单随机样本合并起来。每一层的简单随机样本合并起来。 方法:方法:总体总体N样本样本n等额等额等比例等比例最优最优 概念:概念:整群抽样是将抽样框中的整群抽样是将抽样框中的N N个单位划分成若干个群,然个单位划分成若干个群,然后对群进行简单随机抽样,并对抽中的群内所有的单位进行调查研究。后对群进行简单随机抽样,并对抽中的群内所有的单位进行调查研究。 特点:特点:整群抽样比简单随机抽样能节约更多的成本,但抽取的整群抽样比简单随机抽样能节约更多的成本,但抽取的单位比较集中,抽样误差较大。单位比较集中,抽样误差较大。 (4 4)整群抽样)整群抽样 总体群数总体群数R=16 样本群数样本群数r=4 样本容量样本容量ABCDEFGHIJKLMNOPLHPD3 3、统计调查中存在的误差、统计调查中存在的误差随机误差(偶然性误差随机误差(偶然性误差) )代表性误差代表性误差:非全面调查非全面调查产生中对总体认识的结论是根据部分数据产生中对总体认识的结论是根据部分数据 得出的而产生的误差。得出的而产生的误差。登记性误差登记性误差:包括登记、汇总和录入数据时产生的误差以及无回答包括登记、汇总和录入数据时产生的误差以及无回答 误差和测量误差等误差和测量误差等系统性误差(偏差系统性误差(偏差) ):抽样未按随机原则来抽取样本单位而产生的。抽样未按随机原则来抽取样本单位而产生的。抽样调查的代表性误差抽样调查的代表性误差 随机误差(偶然性误差):随机误差(偶然性误差):因样本的随机性而产生的用样本因样本的随机性而产生的用样本指标推断总体指标时产生的误差。是随机抽样所特有的误差,也称指标推断总体指标时产生的误差。是随机抽样所特有的误差,也称抽抽样误差样误差。 抽样实际误差:抽样实际误差:某一实际样本指标与总体指标的误差某一实际样本指标与总体指标的误差 抽样平均误差:抽样平均误差:所有可能的样本指标与总体指标误差的平均值,所有可能的样本指标与总体指标误差的平均值,是对抽样推断精确度的一种量度。是对抽样推断精确度的一种量度。 抽样极限误差:抽样极限误差:一定概率保证下一次抽样的最大误差(精确度)一定概率保证下一次抽样的最大误差(精确度)简单随机放回抽样的样本平均数的抽样误差:简单随机放回抽样的样本平均数的抽样误差:抽样平均误差的含义抽样平均误差的含义实际应用中抽样平均误差的计算实际应用中抽样平均误差的计算4 4、影响抽样误差的因素、影响抽样误差的因素(1 1)总体内部的差异程度(同方向)总体内部的差异程度(同方向)(2 2)样本容量的大小(反方向)样本容量的大小(反方向)(3 3)抽样的组织方式和抽样方法抽样的组织方式和抽样方法第五节第五节 有关数据调查的几个问题有关数据调查的几个问题 一、调查的目的一、调查的目的 二、判断调查误差的大小二、判断调查误差的大小 三、调查中的道三、调查中的道德性德性问题问题 1. 1.调查者别有用意地、有意识地选择导向性的问题,使回答者出调查者别有用意地、有意识地选择导向性的问题,使回答者出现有倾向性的回答。现有倾向性的回答。 2. 2.询问者有意识地通过语气、语调引导被询问者出现有倾向性的询问者有意识地通过语气、语调引导被询问者出现有倾向性的回答。回答。 3. 3.回答者不重视或不愿意回答调查的内容,就很可能提供错误的回答者不重视或不愿意回答调查的内容,就很可能提供错误的信息。信息。结束语结束语谢谢大家聆听!谢谢大家聆听!37
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号