资源预览内容
第1页 / 共48页
第2页 / 共48页
第3页 / 共48页
第4页 / 共48页
第5页 / 共48页
第6页 / 共48页
第7页 / 共48页
第8页 / 共48页
第9页 / 共48页
第10页 / 共48页
亲,该文档总共48页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
统计学导论毛春元 主讲1第二章 统计数据的搜集、整理与显示 n第一节 统计数据的搜集n第二节 统计数据的整理 n第三节 统计数据的显示 2第一节 统计数据的搜集 一、统计数据的搜集方法 1. 统计数据搜集的概念n根据统计研究预定的目的和任务,运用科学的方法与 手段,有计划、有组织地向客观实际采集数据的过程 2. 统计数据搜集的方式n原始资料(第一手资料);次级资料(第二手资料) 3. 统计数据的分类n按其性质不同分为调查数据和试验数据 4. 统计数据的搜集方法n对搜集原始资料而言,常用的方法有:n直接观察法、报告法(通讯法)、采访法、实验调查 设计等。3二、 统计调查方式常用的统计调查方式1普查 2抽样调查 3重点调查4统计报表制度 41.普查n普查:是专门组织的一种全面调查,它主要是用 以搜集某些不能或不宜用定期报表搜集的统计资料 。对国情国力的调查一般采用普查。n普查的特点: 一是一种非经常性的全面调查; 二比任何一种调查形式更能掌握大量、详细、全面的统计资料。 5n第一次53年n目的:为全国人大及地方人大的选举做好选民登记工作;为国家的经 济、社会发展提供准确的人口数字。n项目:六项(与户主的关系,姓名,性别,年龄,民族,本户住址)n第二次64年n目的:为编制国民经济建设的第三个五年计划和长远规划提供依据。n项目:九项(增加三项,文化程度,本人成份,职业,但后两项只登 记不统计)n第三次82年n目的:为进行社会主义现代化建设,统筹安排人民的物质和文化生活 ,制定人口政策和规划,提供人口资料。n项目:19项(又增加了常住人口的户口登记状况,在业人口 的行业, 职业和不在业人口状况,婚姻状况,生育子女数,存活子女数等。n第四次90年n目的:为准备查清我国人口在数量、地区分布、结构和素质方面的变 化;为国家进一步实行改革开放,科学地制定国民经济和社会发展战 略与规划,统筹安排人民的物质和文化生活,检查人口政策的执行情 况,提供可靠的资料。n项目:二十一项(又增加常住地状况,迁移原因)6n第五次2000年n目的:为查清十年来我国人口在数量、结构、分布和 居住环境等方面的变化情况,全面检查“九五”计划 的执行情况,为科学地制定国民经济和社会发展“十 五”计划以及年远景规划提供可靠的依据, 统筹安排人民的物质和文化生活,实现可持续发展战 略。n项目: 49项,其中:按人填报项目为26项,即姓名 、与户主关系、年龄、民族、户口登记状况、户口性 质、出生地、何时来本乡镇街道居住、从何地来本乡 镇街道居住、迁出地类型、迁移原因、5岁及以上的 人五年前常住地、6岁及以上的人填:是否识字、受 教育程度、学业完成情况、15岁及以上的人填:是否 有工作、工作时间、行业、职业、未工作情况、未工 作者主要生活来源、婚姻状况、初婚年月、15-50岁 妇女填:生育子女数、1999.11.1-2000.10.31生育状 况;按户填报的有23项,即户编号、户别、本户普查 登记人数、本户户籍人口中外出不满半年人数、本户 户籍人口中外出半年以上人数等7n中国的人口总量 n大陆2000年第五次人口普查结果现有人口数的 126583万;n 香港特别行政区政府于2000年6月30日公布的香 港现有人口数为678万; n 澳门特别行政区政府于2000年9月30日公布的澳 门现有人口数为44万; n 台湾当局于2000年12月公布的中国台湾省和金 门、马祖等岛屿的人口数为2228万; n所以,2000年年底中国的人口总量应是129533万 人。n性别构成 n中国当前的人口性别比为106.74,男性占总人口 的51.63%;女性占总人口的48.37%。82抽样调查 n抽样调查:是按随机原则从调查对象中抽取一部分 单位作为样本进行观察,然后根据样本数据去推算 调查对象的总体特征。 n概率抽样的特点: 一样本单位按随机原则抽取,排除了主观因素对 选样的影响。 二根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 三抽样误差可以事先计算并加以控制。n抽样调查的适用场合: 一不可能或不必要进行全面调查的社会现象, 二对普查资料进行必要的修正。 93重点调查 n重点调查:在调查对象中,只选择一部分重 点单位进行的非全面调查。n重点单位:它们在所研究现象的标志总量中 却占有绝大的比重,在总体中具有举足轻重 的作用。n特点:可以了解较详细的情况,但无法对现 象总体的数量特征作出准确的推算,也无法 测算调查误差。n适用场合 :当调查任务只要求掌握基本情 况,而部分单位又能比较集中地反映研究的 项目,宜采用重点调查。 104典型调查n1)定义:是根据调查目的,在对总体进行全 面分析的基础上,从中有意识地选择具有代表 性的若干单位进行调查。n2)目的:进行深入细致的研究,以掌握有关 现象的具体情况。n3)典型调查的关键是选择典型单位n二种方式:nA、划类选典式nB、解剖麻雀式n特点:n由点到面,个别到一般;机动灵活,省时省力 ,提高调查效率;是一种深入细致的调查方式 ;可以研究新生事物。115统计报表制度 n统计报表制度:依照国家有关法规,自上而下地统 一布置,以一定的原始记录为依据,按照统一的表 式,统一的指标项目,统一的报送时间和报送程序 ,自下而上地逐级地定期提供统计资料的一种调查 方式。 n统计报表的主要特点: 一报表资料的来源是建立在各个基层单层单 位的原 始记记的基础础上;二由于统计报表是逐级上报和汇总的,各级领 导部门能获得管辖范围内的报表资料; 三是一种经常性的(连续性)调查,调查项目 相对稳定,有利于积累资料,并进行动态对比分析 。12三、统计调查体系 n统计调查体系:一个国家开展统计调查方法和制 度的总称。 n我国的统计调查体系:建立以必要的周期性的普查为基础,经常性 的抽样调查为主体,同时辅之以重点调查、科学推 算和部分全面报表综合运用的统计调查方法体系。13四、统计调查方案的设计 一明确调查目的。 二确定调查对象和调查单位。n调查对象,是指需要调查的现象总体。n调查单位,是指所要调查的具体单位。n报告单位亦称填报单位,它是负责向上报告调 查内容、提交统计资料的单位。报告单位一般 是在行政上、经济上具有一定独立性的单位。 三设计调查项目。 四设计调查表格和问卷14五确定调查时间。n调查时间是指调查资料所属的时间,在统计 调查中,如果所调查的是时期现象,就要明 确规定调查资料所反映的起止日期。如果所 要调查的是时点现象,调查时间就是规定的 统一标准时点。n调查期限是进行调查工作的时限,包括搜集 资料和报送资料的工作所需的时间。 六组织实施调查计划。 七调查报告的撰写。15五、二手资料的主要来源渠道1统计年鉴2有关期刊3有关网站:http:/www.stats.gov.cn/http:/www.8sta.com/16第二节 统计数据的整理一、数据整理概述 n1数据整理的含义:n对统计调查所搜集到的各种数据进行分类和汇 总,又称为汇总性整理。n2统计数据整理的内容:n(1)如何对所要研究的总体进行统计分组;n(2)确定描述总体数量特征的统计指标体系。17二、统计分组基本理论 1.统计分组的概念 根据统计研究的目的和客观现象的内在特点,按某个标 志(或几个标志)把被研究的总体划分为若干个不同 性质的组,称为统计分组。 2.分组的性质n兼有分和合双重含义,对于现象总体,是“分”,对于 单位,是“合”。 3.统计分组的目的:组内同质性,组间差异性 4.统计分组的种类n(1)按分组标志的多少,分为简单分组和复合分组n(2)按分组的标志的性质不同,分为品质分组(或称 属 性分组)和数量分组(或称变量分组)。18三、统计分组的原则和方法 1统计分组的原则: 穷尽原则、互斥原则 2统计分组的方法(1)品质分组:按品质标志分组(2)数量分组:按数量标志分组 (A)单项单项 式分组组与组组距式分组组 (B)间间断组组距式分组组和连续组连续组 距式分组组 “上限不在内”原则则 (C)等距分组组与异距分组组193组距式分组的相关概念(1)组距n连续组距分组的组距=本组上限本组下 限 n间断式组距且等距分组的条件下:组距=本组上限前组上限或=本组下限前组下限或=本组上限本组下限+1 (2)组数 (3)(4)开口组的组距与组中值20四、频数分布1频数分布的基本理论 (1)频数分布的定义 (2)分布数列的两个要素n总体按某标志所分的组,若总体按数量标志分 组,分组标志在各组有不同的数量表现,形成 标志值数列,亦称变量,一般用x 表示;n各组所出现的单位数,即频数,亦称次数,用f 表示。21(3)相关的概念:频率 fi :第i组频数频率的性质(A) ;(B) 。频频数密度与频频率密度: (A)频频数密度=频频数/组组距(B)频率密度=频率/组距22n例:某班36名同学统计学考试成绩 如下:n56,79,86,56,80,86,86,80,64 ,65,81,87,87,82,67,68,83, 88,90,84,71,73,84,92,74,85 ,92,93,85,76,76,85,94,79, 97,86。试编制变量数列。2变量数列的编制方法23n解:1)排队:n 2)求全距R=9756=41n 3)确定组数:nm取整为6。n 4)求组距:nh取整为10(实际情况是分数的档次是10 分)n5)确定上、下限和次数:2425n例:某班组40名工人日产量资料如下:n54,85,83,79,78,92,80,95,62 ,68,72,83,85,64,73,60,84, 108,81,78,99,74,81,70,77, 66,71,83,75,34,78,83,88,86 ,83,74,89,68,74,87。n试编制变量数列。26n1)排队: 2)求全距R=10834=74n3)确定组数:m取整为7n4)求组距: nh取整为10n5)确定组限及次数(最终结果)27合并成一组60以下, 次数为2 可合并也可不合并, 视具体情况定,若 合并,则为90以上, 次数为4 28n(最终结果)日产量(件)人数(人)f 60以下 6070 7080 8090 90100 100以上2 6 13 15 3 1合计4029【例例】某电脑公司某电脑公司20072007年前四个月各天的销售量数据年前四个月各天的销售量数据( (单位:台单位:台) )。 试对数据进行分组试对数据进行分组30等距分组表等距分组表( (上下组限重叠上下组限重叠) )31等距分组表等距分组表( (上下组限间断上下组限间断) )32等距分组表等距分组表( (使用开口组使用开口组) )33书上P31案例34五、累计频数与累计频率n1向上累计频数(或频率)分布n2向下累计频数(或频率)分布35日产量(件)人数(人)f向上累 计向下累 计 60以下 2240 6070 6838 7080 132132 8090 153619 90100 3394 100以上1401 合计4036第三节 统计数据的显示一、统计表 1统计表的定义和结构(1)统计表的定义(2
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号