资源预览内容
第1页 / 共50页
第2页 / 共50页
第3页 / 共50页
第4页 / 共50页
第5页 / 共50页
第6页 / 共50页
第7页 / 共50页
第8页 / 共50页
第9页 / 共50页
第10页 / 共50页
亲,该文档总共50页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Excel在统计学中应用,第一节 用Excel做统计图,一、 用Excel做频率分布表和直方图 一般统计数据有两大类,即定性数据和定量数据。我们这里就不讨论把定性数据转换成定量数据了,而是主要学习定量数据的作图。下面的例子说明如何利用Excel进行分组,并作频率分布表和直方图。 案例 2010年1月四十个大中城市房屋销售价格指数如下:110.2、109.6、102.6、102.6、105.9、102.7、105、104.5、105.9、108.8、110.4、112.7、108、105.2、103.2、108.9、107.1、105.7、106、104.9、103.9、108.8、110.6、120.6、105.5、131.8、108.8、105.3、109.6、110.3、110、105.1、105.9、113、106.2、99.5、104.8、103.1、105.9、103.8 (1)据此编制分布数列(提示:价格指数是连续变量); (2)计算向上累计频数(率); (3)画出次数分布直方图。,步骤 第一步:在Excel界面中输入40个企业的数据,从上到下输入A列(也可以分组排列)。 第二步:选择“工具”下拉菜单,如图1所示。,第三步:选择“数据分析”选项,如果没有该功能则要先行安装。“数据分析”的具体安装方法,选择“工具”下拉菜单中“加载宏”,在出现的选项中选择“分析工具库”,“确定”就可自动安装。 第四步:在分析工具中选择“直方图”,如图2所示。,第五步:当出现“直方图”对话框时,在“输入区域”方框内键入A2:A41或A2:A41(“”符号表示的是绝对地址起,到固定单元格的作用),40个数据已输入该区域内,如果是分组排列的,就应该选择整个分组区域。在“接收区域”方框内键入C2:C9或C2: C9,所有数据分成8组(主要根据资料的特点,决定组数、组距和组限),把各组的上限输入该区域内。在“输出区域”方框内键入E2或E2,也可以在其他位置重新建表。对话框中,还选择“累积百分率”、“图表输出”如图所示。然后点击“确定”。 对话框内主要选项的含义如下: 输入区域:在此输入待分析区域的单元格范围。,接收区域(可选):在此输入接收区域的单元格范围,该区域包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在,Excel将统计在各个相邻边界值之间的数据出现的次数。如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间建立一组平滑分布的接收区间。,标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此复选框,Excel将在输出表中生成适宜的数据标志。 输出区域:在此输入计算结果显示的单元格地址。如果不输入具体位置将覆盖已有的数据,Excel会自动确定输出区域的大小并显示信息。 柏拉图:选中此复选框,可以在输出表中同时显示升序、将序排列频率数据。如果此复选框被清除,Excel将只按升序来排列数据。 累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。 图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。,结果 操作得到的结果如图所示。通常包括三列和一个频数分布图,第一列是数值的区域范围,第二列是数值分布的频数(不是频率),第三列是频数分布的累积百分比。 直方图是用矩形高度来表示频数分布的图形。绘制直方图时,将所研究的变量放在横轴上,频数、频率放在纵轴上。每组的频数、频率在图上就是一个长方形,长方形的底在横轴上,宽度是组距,长方形的高就是对应的频数或频率。图13-4中是一个条形图,而不是直方图,若要把它变成直方图,可按如下操作: 用鼠标左键单击图中任一直条形,然后右键单击,在弹出的快捷菜单中选取“数据系列”格式,弹出数据系列格式对话框。在对话框中选择“选项”标签,把“分类间距”宽度改为零,按确定后即可得到直方图,如图所示。,二、 用Excel做常用统计图 Excel提供的统计图有多种,包括柱形图、条形图、折线图、饼图、散点图、面积图、环形图、雷达图、曲面图、气泡图、股价图、圆柱图、圆锥图等,各种图的作法大同小异,可根据需要的类型进行适当选择。 (一) 饼图的绘制 饼图是用圆形以及园内扇形的面积来表示数值大小的图形,主要用于表示总体中各组成部分所占的比例,常用于研究结构性问题。 案例 某地区年因违法被捕的男性情况如下所示,根据资料利用Excel绘制饼图。,步骤 先把数据输入到工作表中,如图所示,然后按下面的步骤操作:,第一步:选择“插入”下拉菜单中的“图表”选项。 第二步:在图表类型中选择“饼图”,然后在子图表类型中选择一种类型,这里我们选用系统默认的方式。然后单击下一步按钮,打开源数据对话框。如图7所示。,第三步:在图标源数据对话框中填入数据所在区域,单击下一步,在图表选项中,对“标题”、“图例”和“数据标志”适当处理。如果要对图形修改,可以用鼠标双击图表,然后用鼠标双击需要修改的部分,并进行修改。 结果 即可得如图所示的饼图。,(二)折线图的绘制 折线图主要用于比较数据变动的方向和趋势,表现数据在不同时期发展变化的不同趋势。 案例 根据福建省2005年到2009年间三大产业的总产出情况绘制折线图,描述这几年来三大产业总产值的变化趋势。,步骤 第一步:资料输入工作表后,选择“插入”下拉菜单,再选择“图表”选项。 第二步:在图表类型中选择“折线图”,然后在子图表类型中选择一种类型,这里我们选用如图所示的方式。然后单击“下一步”按钮,打开源数据对话框。,第三步:在源数据对话框中,“数据区域”中输入相关资料(可用鼠标点击并框定数据区域)。再在“系列”的“分类(X)轴标志”区域输入年份区域,如图所示 第四步:资料输入后的下一步,进入“图表选项”。分别对“标题”、“坐标轴”、“网格线”、“图例”、“数据标志”和“数据表”等选项进行设置,当然设置各选项时根据需要进行取舍。最后点击“完成”,就在工作表中得到折线图。 结果 经过上述各步骤,在工作表中得到折线图:,第二节 用Excel计算描述统计量,一、利用“数据分析”功能 案例根据某县的一项关于乡镇企业工资的调查,下面是40名雇员的月工资按升幂排列的一个样本,对该企业雇员工资进行描述统计分析。(单位:元) 274 279 290 326 329 341 378 405 436 500 515 541 558 566 618 708 760 867 868 869 888 915 932 942 960 975 976 1014 1025 1096 1118 1166 1193 1194 1243 1277 1304 1327 1343 1398 步骤 第一步:在Excel的区域“A1:A40”的单元格中输入数据,从上到下排成4列。 第二步:选择“工具”下拉菜单,再选择“数据分析”选项 第三步:在分析工具中选择“描述统计”,如图11所示,第四步:当出现对话框时,在“输入区域”方框内键入A1:A40(或用鼠标选择这区域),在“输出选项”中选择输出区域(在此选择C4),再选择“汇总统计”(该选项给出全部描述统计量)。 第五步:点击“确定”键。 其计算结果如图所示。,二、 利用“统计函数”工具计算 我们可以用两种方法来得到描述统计量,除上述“数据分析”功能计算外,还可采用Excel的函数工具计算。仍以该企业40名雇员工资为例进行计算。 第一步:与上面操作相同,在Excel中输入数据。 第二步:选择“插入”下拉菜单中的“函数”选项,如图所示。 第三步:出现的“插入函数”界面中,在“或选择类别”选项中,选“统计”。再在“选择函数”中,选“AVERAGE”(算术平均数),点击“确定”如图14所示。,13-13,13-14,第四步:出现“AVERAGE函数参数”界面中,在“Number1”中键入A1:A40(或用鼠标选择这区域),然后点击“确定”,就能得出“算术平均数=817.85”。 重复上述各步骤,还可计算“调和平均数”、“几何平均数”、“样本标准差”和“总体标准差”等统计量,只要分别选择相应的函数。常用描述统计量函数如表A-4所示,第三节 用Excel进行抽样,一、用Excel进行随机抽样 当总体数量太大,不可能进行全面调查或者在某些情况下不需要进行全面调查又需要了解总体的情况时必须采用抽样。使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原则,也可以按有关标志或无关标志,编号后,将编号输入工作表。 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择“工具” “加载宏”,在安装光盘的支持下加载“数据分析库”。加载成功后,才可以在工具的下拉菜单中看到“数据分析”选项。,案例 假定有100个总体单位,每个总体给一个编号,一共有100个编号,输入工作表后,如图所示,步骤 先输入各总体单位的编号,再按照下面的步骤操作: 第一步: 单击菜单栏中的“工具”选项,在下拉列表框中选择“数据分析”选项,此时弹出“数据分析”对话框,分析工具选择“抽样”。如图所示,第二步:单击“确定”,弹出“抽样”对话框,如图所示,第三步:在输入区域框中输入总体单位编号所在单元格区域,在本例是$A$1:$J$10,实际操作中一般是用鼠标将编号所在区域选中即可。系统将从A列开始抽取样本,然后按顺序抽取B列至J列。如果输入区域的第一行或第一列为标志项(横行标题或纵行标题),可单击“标志”复选框。 第四步:抽样方法有周期和随机两种模式。 “周期模式”即所谓的等距抽样,采用这种抽样方法,需将总体单位数除以要抽取的样本单位数,可得到取样的周期间隔。这里我们假设要在100个总体单位中抽取10个,则在“间隔”框中输入“10”。,“随机模式”适用于纯随机抽样、分类抽样、整群抽样和阶段抽样。采用纯随机抽样,只需在“样本数”中直接输入要抽取的样本数即可;若用分类抽样,必须先将总体按某一标志分类编号,然后再每一类中随机抽取若干单位i,这种抽样方法实际上是分组法和随机抽样方法的结合;整群抽样也要将总体单位分类编号,然后按随机原则抽取若干类作为样本,对抽中的所有单位全部进行调查。 第五步:制定输出区域,这里我们键入“F12:F22”,然后单击“确定”按钮即可。 结果 10个随机抽样的样本编号显示在工作表的“F12:F22”区域,二、用Excel进行抽样估计求置信区间 调用Excel中一些常用的“统计函数”可以直接进行抽样推断中的区间估计计算。下面结合案例来说明具体的操作步骤。 案例 为了解学校某班的统计学成绩情况,对该班的全体同学随机抽取13名作为调查样本,统计抽取得到的样本如 A列所示。假设该班学生的统计学成绩总体上服从正态分布,用95%的置信水平估计该班学生统计学成绩的置信区间。 为构造区间估计的工作表,在工作表中先输入以下内容:A列中输入样本数据,B列输入各统计指标名称,C列中输入计算公式,D列输入计算的结果。,自由度为样本数 -1(n-1),上式有误,步骤 第一步:把样本数据输入A2:A14单元格。 第二步:在D2中输入公式“COUNT(A2:A14)”,得到计算结果“13”。“COUNT”是计数函数,得到样本含量(n=13)。 第三步:在D3中输入“=AVERAGE(A2:A14)”,在D4中输入“=STDEV(A2:A14)” 在D5中输入“=D4/SQRT(D2)”,在D6中输入0.95,在D7中输入“=D2-1”,在D8中输入“=TINV(1-D6,D7)”,在C9中输入“=D8*D5”,在D10中输入“=D3-D9”,在D11中输入“=D3+D9”。 再输入每一个公式回车后,即可得到如表的结果。,自由度为n-1,有误,结果 从上面的结果我们可以知道,该班学生的统计学成绩的置信上限是84.0039804,置信下限是61.5344
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号