资源预览内容
第1页 / 共17页
第2页 / 共17页
第3页 / 共17页
第4页 / 共17页
第5页 / 共17页
第6页 / 共17页
第7页 / 共17页
第8页 / 共17页
第9页 / 共17页
第10页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
选择和判断:统计学含义:统计学是一门认识方法论科学 ,它是研究如何收集数据、整理数据、分析数据,以便从中作出正确推断的认识方法论科学 。描述统计学与推断统计学的区别:描述统计学是研究如何反映客观现象的数据资料,对所收集的数据进行加工整理,通过图、表等读者易于理解的形式汇总显示。推断统计学是研究如何根据样本数据推断总体数量特征的理论和方法,具体包括:抽样调查、假设检验、相关回归分析等。描述统计是整个统计学的基础,推断统计则是现代统计学的核心和主要内容。选择:统计学的基本概念:总体:指客观存在的、在同一性质的基础上结合起来的许多个别单位的整体。总体单位: 构成总体的每个个别单位称为总体单位。标志:说明总体单位的属性和特征的名称。标志分为: 品质标志 (只能用文字来说明总体属性,eg:文化程度) 数量标志(说明总体单位数量的特征,eg:职工人数,销售额,工资额等) 不变标志(某个标志上的答案都相同) 可变标志(一定有一个标志是可变的)数量标志的答案叫数量标志表现,也叫标志值指标:说明总体数量特征(分为指标名称和指标数量两部分)eg:男性比重,英语平均成绩,学生人数。按计算方法不同分: 数量指标:说明总体规模大小和数量多少的指标。(总量指标) 质量指标:说明总体内部数量对比关系和一般水平的指标。(相对指标,平均指标)按其数值的表现形式分: 总量指标:也就是数量指标,数值是绝对数形式 相对指标:数值是相对形式。 平均指标:数值是平均数形式。标志与指标的区别:名 称 说明对象表示方式 标 志总体单位的属性特征或数量特征文字或数值 指 标总体的数量特征数值四个数据的区别:定性数据:品质变量的答案就是定性数据,定性数据本身是文字。eg:性别为品质变量,它的答案“男”“女”就是定性数据。 名义级数据:品质变量的一种答案,仅是一种代码来表示品质变量的不同类型。不能比较大小四则运算eg:“性别”是品质变量,用变量值“1”表示男性,“2”表示女性,这是“1”“2”或“男”“女”就是名义级数据。 次序级数据:品质变量的一种答案。次序级数据可以比较大小判断优劣。eg:产品等级“1”为合格“0”为不合格。定量数据:数值变量的答案是定量数据,定量数据的本身是数值。 间距及数据:本身可以为0,0有意义。可以进行加减运算,但不能乘除,eg:今天的气温比昨天高了多少度,不能说今天的气温是昨天的几倍。 比率级数据: 本身不能为0,0没有意义,可以进行加减乘除运算。eg:100米比50米长50米,100米事50米的两倍。 数据的来源:1、直接来源:实验、统计调查;2、间接来源:公开出版或报道的数据、网络、别人调查过实验后已经加工整理过的第二手数据。统计报表:按照国务院或国家统计局颁发的表格,由各级调查单位按照一定日期和程序向上级提交统计报告的一种制度。全面统计报表:全面调查(选择)专门调查;普查、重点调查、典型调查、抽样调查普查特点;一次性调查、全面调查。通过组个调查属于一定时点或一定时期内的社会经济现象的情况,全面、系统地收集真理和提供反映国情国力基本情况的统计数据。抽样调查:非全面调查,既可以一次性也可以经常性。是根据概率理论,从调查对象总体中应用随机原则抽取一部分调查单位构成样本,由样本指标值(统计量)推断总体相应指标值(参数)的一种调查方法。重点调查:非全面调查,既可以一次性也可以经常性。它是从调查对象的全面调查单位中选择一部分重点单位进行调查的一种调查方法。典型调查:非全面调查,既可以一次性也可以经常性。是根据研究目的,在对总体进行初步的全面分析基础上从调查总体中有意识地选择一个或几个有代表性的单位而进行的调查,代表性的单位也叫典型单位。调查对象与调查单位的区分: 调查对象:是所要研究的现象总体,即统计总体,它是若干个性质相同的调查单位组成的。 调查单位:是构成总体的每一个个体单位,在某项调查中登记其具体特征的单位,是调查项目的承担者。调查时间与调查期限划分:调查时间:是指调查资料所属的时间。调查期限:是具体进行调查工作的时间期限,包括收集资料和报送资料的整个工作所需要的时间。统计调查的误差:什么情况下的。分为登记性调查误差、代表性调查误差。登记性误差:调查过程中各个环节的工作不准确而造成的。不能说非全面调查的误差一定比全面调查的大。代表性误差:用部分调查单位的统计资料计算出指标值(样本统计量)来估计总体指标值(总体参数)所产生的误差。统计分组的含义:“分”:就是把同一总体中性质不同的总体单位分配到不同的组里,突出组与组之间的差异性。“组”:就是把同一总体中性质相同的总体单位归并到同一组里,突出组内的同质性。统计分组:就是根据统计研究的目的,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。分组的原则:穷尽原则:就是使总体中的每一个单位都应有组可归。(两个数据重叠时,上限不在该组上而是作为下限在下一组上)互斥原则:就是使总体中的任何一个单位只能归属于某一个组,而不能同时或可能归属于几个组。统计表的构成:构成要素上看:总标题、横行标题、纵行标题、指标数值从内容上看,分为两部分:主词(统计表所要说明的总体,他可以是各个总体单位的名称、总体各个组)、宾词(说明总体的统计指标,包括指标名称和指标数值)统计图:茎叶图,帕拉图统计分组的种类: 按分组标志的多少,可分为简单分组和复合分组。按分组标志性质的不同,分为品质分组和数量分组。按分组的作用和任务不同,分为类型分组、结构分组和分析分组。如何选择分组标志:1、根据研究问题的目的和任务;2、选择最能反映现象本质特征的标志;3、要结合现象所处的具体历史条件或经济条件来选择。 品质标志分组的方法:按品质标志分组,有的比较简单,分组的标志一经确定,组的名称和组数也随之确定了。如:人口按性别分组,就分为“男”与“女”两组。有的就比较复杂。如:国民经济的部门划分,就有三次产业分类、行业分类、机构部门分类 。这种比较复杂的分类,一般会有国家统计局和国家标准局统一制定分类标志,代码等。数量标志分组的方法:分组时各组数量界限的确定必须能反映事物质的差别。根据被研究的现象总体的数量特征,采用适当的分组形式,确定相应的组距、组限。分组的形式:单项式分组:一个变量值代表一组。一般适用于离散变量且变异范围较小。eg:工人按日产量分组:日产量(件)人数20 821102225233024 725 2组距式分组:用一段距离代表一组。一般适用于连续变量 或变异范围较大的离散变量。按 成 绩 分 组 人 数 60分以下2 60707 708011 809012 90分以上8 合 计40 eg:学生按学习成绩分组: (1)等距分组:各组的组距都相等。适用于标志值的变动比较均匀的情况下。(2)异距分组:各组的组距不完全相同。适用: a、标志值分布很不均匀 b、标志值相等的量具有不同意义 c、标志值按一定比例发展变化组距分组的组限确定:间断组距分组:如:儿童按年龄分组:未满周岁,12岁,34岁,59岁,1014岁。连续组距分组:如:工厂按完成任务的程度分组:100%以下,100%110%,110%120%,120%以上。注:在连续组距的分组时,相邻两组的上、下限是重叠的,如110%。统计中按“上限不在内”原则处理。即,110%统计到作为下限的第三组而不是统计到作为上限的第二组。 统计分组品质标志分组数量标志分组单项式分组组距式分组等距式分组异距式分组 分组中的几个基本概念:全距(R)= 数列中的最大值-最小值 组距(R)=一组中的较大值-较小值或 上限-下限 n = 1 + 3 . 3 lg N(不必记住) n:组数 N:总体单位数 在实际操作中数组在510之间组限:组距两端的变量值 上限:一组中的最大值。 下限:一组中的最小值组中值:上、下限之间的中点数值 开口组:缺少上限或下限的组。如:60分以下;6070 ;8090; 90分以上。闭口组:上、下限都齐备的组。如:7080分; 500600公斤; 90100岁开口组的组中值计算:缺少上限: 1、计算假定上限:假定上限=下限+相邻组的组距如:假定上限=90+10=100(分); 2、计算组中值:组中值=(90+100)2 = 95(分)缺少下限: 1、计算假定下限:假定下限=上限相邻组的组距如:假定下限=6010=50(分); 2、计算组中值:组中值=(50+60)2 = 55(分)分配数列的概念;在统计分组的基础上,将总体所有的单位按某一标志进行归类排列。可分为:品质数列和变量数列。分布数列的两个要素:一是总体按某标志所分的组; 二是各组所出现的单位数,即频数,亦称次数(一般用 f 来表示)。频数:分布在各组的总体单位数叫次数,又叫频数。频数的表现形式:绝对数形式:即次数(f) 相对数形式:即频率,各组次数与总次数之比(f/f)。在加权算术平均数的计算中,次数亦称为权数。 分配数列的种类:品质分配数列:品质分配数列是按品质标志分组成为品质数列。编制品质数列时,只要分组标志一旦确定,组数和各组的界限也就随之确定了。品质数列一般比较稳定,能准确地反映总体的分布特征。变量分配数列:变量分配数列是按数量标志分组形成为变量数列。编制变量数列与编制品质数列相比较,其编制就要复杂些。 等距数列的编制步骤: 第一步:将考试分数按大小顺序排列。第二步:根据数列的数量特征确定分组的形式。考试成绩是连续变量且分布比较均匀,确定采用等距分组的形式。第三步:找出数列中的最大值和最小值,再计算全距。第四步:确定组数。在实际操作中数组在510之间第五步:确定组距。为了方便计算和绘制统计图,组距一般取5或10的
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号