资源预览内容
第1页 / 共49页
第2页 / 共49页
第3页 / 共49页
第4页 / 共49页
第5页 / 共49页
第6页 / 共49页
第7页 / 共49页
第8页 / 共49页
第9页 / 共49页
第10页 / 共49页
亲,该文档总共49页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第3章 统计数据的整理与展示,主要内容,统计数据的预处理 非数值型数据的整理与显示 数值型数据的展示与显示 Excel的应用,3.1 统计数据的预处理,数据的筛选 数据的审核 数据排序,3.1.1 统计数据的审核,审核数据的完整性和准确性。 完整性:调查单位是否有遗漏 调查项目是否填写齐全 准确性: 数据是否有错误 是否存在异常值 (方法:逻辑检查、计算检查),3.1.2 数据的筛选,筛选内容: 1.将某些不符合要求的或有明显错误的数据予以剔除; 2.将符合某种特殊条件的数据筛选出来。 筛选方法: 计算机:“数据”“筛选”,3.1.3 数据排序,作用: 1.便于通过浏览数据发现一些明显的特征或趋势,为分类(组)提供方便 2.检查纠错; 排序标志: 字母、汉字、数值;升序或降序 Excel的应用:,3.2 非数值型数据的整理与显示,3.2.1 分类数据整理(基本过程),1.列出各类别 2.计算各类别数据的频数(个数) 3.制作频数分布表 4.用图形显示数据,1) 频数分布,将统计数据分成几类(组),汇总计算各类(组)的数据个数,并用表格的形式表现出来,这种形式称为频数分布或次数分布。 各类(组)数据的个数称为频数或次数,它与全部数据个数之比称为频率。 频数分布的特点:各类(组)的频率大于或等于0;各类(组)的频率之和为1或100%。,频数分布的作用: 揭示现象的类型 反映现象的内部构成,2)例题分析,一家市场调查公司为研究 不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的名称记录一次。以下是记录的原始数据。.,旭日升冰茶可口可乐 旭日升冰茶 汇源果汁 露露 露露旭日升冰茶 可口可乐 露露 可口可乐 旭日升冰茶可口可乐 可口可乐 百事可乐 旭日升冰茶 可口可乐百事可乐 旭日升冰茶 可口可乐 百事可乐 百事可乐露露 露露 百事可乐 露露 可口可乐旭日升冰茶 旭日升冰茶 汇源果汁 汇源果汁 汇源果汁旭日升冰茶 可口可乐 可口可乐 可口可乐 可口可乐百事可乐 露露 汇源果汁 百事可乐 露露可口可乐 百事可乐 可口可乐 露露 可口可乐旭日升冰茶 百事可乐 汇源果汁 旭日升冰茶,不同饮料销售分布表,频数分布由两部分组成: 分组形成的组别; 与各组对应的总体单位数(频数或次数)。 当以频率表示各组在整体中的相对地位时,即为频率分布。,3) 分类数据频数分布 的图示,条形图(直方图) 饼图(圆形图),分类数据的图示柱形图,柱形图,用宽度相同的条形的高度或长短来表示各类别数据个数多少的图形 有单式条形图、复式条形图等形式 各类别可以放在纵轴,称为柱形图,也可以放在横轴,称为条形图,分类数据的图示饼图,饼图,也称圆形图,是用圆形及圆内扇形面积来表示数值大小的图形 主要用于表示总体的内部结构 绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的,4) 用Excel编制频数分布的步骤,在同一列输入分类数据资料; 给每类分别赋值,并输入在第二列; 点击“工具”“数据分析”“直方图”填写对话框“图表输出”“确定”; 将输出结果转化为易于阅读的表格形式。,5)用Excel制作统计图的步骤,输入分类数据频数分布; 点击“图表向导”的图标,选择需要的图形; 填写对话框; 对输出结果进行个性化的修饰。,3.2.2 顺序数据的分类整理与图示,与分类数据不同的是: 1.给每一类别赋值时必须考虑顺序 2.可以计算频数或频率的累计数 向上累计:由较低水平的次数开始累计; 向上累计:由较高水平的次数开始累计。,例题分析,在一项城市住房问题的研究中,研究人员在某城市抽样调查50户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?” 1非常不满意;2不满意;3一般; 4满意; 5非常满意。 将调查的资料分类整理。,顺序数据的频数分布,想一想:向上累计、向上累计次数的意义是什么?,3.3 数值型数据的整理与显示,3.3.1 数值型数据频数分布的种类,频数分布(分布数列),品 质 数 列,单 项 式 数 列,组 距 式 数 列,等距式频数分布,异距式频数分布,某印染厂职工家庭人口分组统计(单项式),某印染厂职工工资分组统计(等距式),各类频数分布的适用情况,若数据是离散型变量且变化范围不大单项式; 连续型变量、离散型变量且变化范围较大组距式; 若变动比较均匀等距式; 若变动不均匀异距式。,3.3.2 关于组距式频数分布,1)概念 组限:上限、下限 组距=上限-下限 组中值=(上限+下限)/2 全距=总体最大值-最小值 开口组:无上限或无下限的组 开口组的组中值如何计算?,2)常见的组限表现形式: 重叠组限 非重叠组限 (适合连续型变量) (适合离散型变量) 3040 3039 4050 4049 5060 5059 ,3)编制的原则 下闭上开原则,即上组限不在内。 不重不漏的原则。 组限取整的原则。,4)编制步骤:,1.确定组数。参考公式: 2.确定组距:组距=全距/组数; 3.根据分组,汇总各组的数据个数(频数),必要时计算各组的频率; 4.将以上结果绘制成统计表。,2,lg,n,lg,1,k,+,=,5)用Excel编制数值型数据频数分布的 操作步骤:,1.在同一列输入数据资料; 2. 在另一列输入各组的上限减1的数; 3.点击“工具”“数据分析”“直方图”填写对话框“图表输出”“确定”; 4.将输出结果转化为易于阅读的表格形式。,各类数据整理的基本问题,弄清数据的类型,因为不同类型的数据处理方法有差异; 顺序型数据可在整理的基础上计算累计频数和累计频率; 对数值型数据可以编制单项式或组距式频数分布; 适合低层次数据的整理方法同样适合高层次数据,但适合高层次数据的方法不适合低层次数据处理。,3.3.3 关于统计图,常用的图形及主要作用,直方图 :总体的分布、内部结构、数量多少的比较; 饼图:总体的分布、内部结构; 环行图:多个总体内部结构的比较; 线形图(折线图):现象的发展变化趋势、现 象的依存关系; 雷达图:多个总体内部结构的比较;,关于线形图,反映现象的发展变化趋势时应注意: 时间一般绘在横轴,指标数值绘在纵轴; 图形的长宽比例要适当; 一般情况下,纵横轴的起点值视情况而定;指标数值太大时可以采取“断条”的方式。,例题分析,已知19912000年我国城乡居民家庭的人均收入数据如表。试绘制线形图,时间序列的线形图,绘制统计图应注意的问题,1.应根据具体情况选择最合适的图形; 2.图形布局合理,统计图的要素齐备,即应该有:标题、图例、计量单位、主要的统计数字。,用Excel制作统计图的步骤,1.输入资料; 2.“图表向导”; 3.填写对话框; 4.对图形进行一定的修饰。,3.3.4 关于统计表,统计表的构成,统计表的名称 统计表的行标题、列标题 数据资料 表格线 附注,某印染厂职工工资分组统计(等距式),设计统计表应注意的问题,统计表的要素齐备 指标排列有序:逻辑顺序、合计与分项; 开口表:左右不封口;或三线表; 计量单位列在恰当的位置; 统计数字的数位保持一致,且数位对齐; 统计表的规模不宜太大,必要时可以编号。,主要内容,1.数据的预处理:审核、筛选、排序 2.分类数据和顺序数据的频数分布及显示 3. 数值型数据的频数分布及显示 4.统计表和统计图的制作 5.用Excel编制频数分布 6.用Excel绘制统计图和统计表,结 束,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号