资源预览内容
第1页 / 共20页
第2页 / 共20页
第3页 / 共20页
第4页 / 共20页
第5页 / 共20页
第6页 / 共20页
第7页 / 共20页
第8页 / 共20页
第9页 / 共20页
第10页 / 共20页
亲,该文档总共20页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
统计学实验报告姓名 学号 班级 成绩一、实验步骤 (一)数据的搜集与整理实验目的:培养学生处理数据的基本能力。通过本实验,学生应开始了解Excel 2003的操作界面,在有效搜集数据资源的基础上,利用软件完成数据的输入、导入、保存、编码、分类(组)、筛选、排序等数据整理工作。实验要求1、熟悉Excel 2003的基本操作界面;2、熟悉间接数据的搜集方法、搜集途径,能熟练通过网络搜集间接数据;3、了解直接数据的搜集;4、掌握不同类型的数据的处理方法,尤其是注意Excel 2003在数据输入、导入等方面的区别,掌握数据文件的建立和保存方法。5、掌握数据的编码、分类(组)、筛选、排序等整理操作的方法 以获取四川省成都市2008年的经济数据为例A,直接进入网站查询数据 B,使用搜索引擎 由该案例可以知道直接统计数据可以通过两种途径获得:一是统计调查或观察,二是实验。统计调查是取得社会经济数据的最主要来源,它主要包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式。下面进行分析:(一)数据的搜集1、间接数据的搜集(1)直接进入网站查询数据重要的网站有:中华人民共和国国际统计局、各地方统计局及国外统计网站、中国人口信息网、中国经济信息网、中宏数据库(2)使用搜索引擎例如使用百度搜索,但是可靠性不及直接进入网站查询2、直接数据的搜集(1)统计调查或观察(社会经济数据最主要来源)包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式二)数据的整理1、数据的编码编码是对数据进行初步分组和确定数字代码的过程,可以把复杂的文字用简单的代码代替,有利于简化数据输入和处理。2、数据的录入数据的录入是将搜集到的数据直接输入到数据库文件中。数据录入既要讲究效率,又要保证质量。Excel的数据录入操作比较简单,一般只要在工作表中,单击激活一个单元格就可以录入数据了。录入重复数据,使用复制功能(Ctrl+C)时,Excel在简单复制数据时不能保证格式的完整性,需要单击鼠标右键,使用“选择性粘贴”,进行设置来实现复制的格式要求。3、数据的导入Excel数据文件的导入是将别的软件形成的数据或数据库文件,转换到Excel工作表中。导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。 4、数据的筛选数据的筛选是从大数据表单中选出分析所要用的数据。Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。5、数据的排序Excel的排序功能主要靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。在选中需排序区域数据后,点击“升序排列”(“降序排列”)工具按钮,数据将按升序(或降序)快速排列。Excel分析工具库宏中的“排位与百分比排位”工具,也能部分实现显示排序结果的功能。6、数据文件的保存 保存经过初步处理的Excel数据文件。可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。(二)描述数据的图表方法实验目的:应用软件将数据转化成为直观的统计表和生动形象的统计图。实验要求:1.熟练掌握Excel 2003的统计制表功能2.熟练掌握Excel 2003的统计制图功能3.掌握各种统计图、表的功能,并能准确的根据不同对象的特点加以应用 1,频数频率表Frequency函数用途:以一列垂直数组返回某个区域中数据的频率分布。它可以计算出在给定的值域和接收区间内,每个区间包含的数据个数。语法:FREQUENCY(data_array,bins_array)参数:data_array是用来计算频率一个数组,或对数组单元区域的引用。bins_array 是数据接收区间,为一数组或对数组区域的引用,设定对data_array 进行频率计算的分段点。2、直方图分析工具“工具”“数据分析”“直方图”(二)统计图1、直方图:不支持手工输入,用来看分布状况2、折线图:用来同时分析比较两组计量组以上的数据3、散点图:用来看两组数据之间是否有共同变化的趋势三)统计数据的描述一:实验目的1.熟练掌握Excel 2003中描述统计指标对应的函数,包括算数平均数、调和平均数、几何平均数、众数、中位数、标准差、方差、偏度、峰度等2.熟练掌握Excel 2003“描述统计”工具进行描述统计,注意其结果解释。 3.注意比较函数方法和“描述统计”工具所得结果二:实验步骤1使用函数描述a.了解函数名称:函数名称函数功能Average计算指定序列算数平均数Geomean计算数据区域的几何平均数Harmean计算数据区域的调和平均数Median计算给定数据集合的中位数Mode计算给定数据集合的众数Max计算最大值Min计算最小值Quartile计算四分位点Stdev计算样本的标准差Stdevp计算总体的标准差Var计算样本的方差Varp计算总体的方差2均值:算术平均数a.激活一空白单元格,输入公式回车:几何平均数a.使用Geomean函数来计算几何平均数b.使用语法geomean(number1,number2,.)求目标的几何平均数中位数a.使用函数median(number1,number2,).计算目标中位数。众数a.使用MODE(number1,number2,)函数来计算目标的众数3:离散程度度量极差a.使用MAX(number1,number2,)计算组中最大值b.使用MIN(number1,number2,)计算组中最小值c.利用极差定义,构建函数组合MAX-MIN,算出极差方差和标准差a.使用VARP(number1,number2,)计算总体的方差b,使用VAR(number1,number2,)估算样本方差c.使用STDEVP(number1,number2,)返回整个总体的标准偏差d.使用STDEV(number1,number2,)估算样本的标准偏差:变异系数a. 在另一空白单元格中输入“XXX变异系数=”字样,b.在另一空白单元格中输入公式“=STDEV()/AVERAGE()”回车,4“描述统计”分析工具扩展函数a.使用“工具-数据分析-描述统计”进入“撕碎统计”对话框b.输入相应数据点击确定按钮,得到结果四)参数估计A,抽样“抽样”分析工具将输入区域视为总体,并使用总体来建立样本。当总体过大而无法处理或制成图表时,就可以使用代表样本。如果输入数据是周期性的,也可以建立只包含某个周期特定部分数值的样本。例如若输入区域包含了每季的销售量,就可以在输入区域的同一季4个地点数值中以周期性比率来抽样。B,参数估计点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。例如,设一批产品的废品率为。为估计,从这批产品中随机地抽出n个作检查,以X记其中的废品个数,用X/n估计,这就是一个点估计。区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。TINV用途:返回作为概率和自由度函数的t 分布的t值。语法:TINV(probability,degrees_freedom)参数:probability 为对应于双尾t分布的概率,degrees_freedom为分布的自由度。NORMSINV用途:返回标准正态分布累积函数的逆函数。该分布的平均值为0,标准偏差为1。语法:NORMSINV(probability)参数:probability 是正态分布的概率值。ABS 用途:求出相应数字的绝对值。 语法:ABS(number) 参数:number代表需要求绝对值的数值或引用的单元格。Chiinv用途:返回卡方分布单尾概率的逆函数。语法:CHIINV(probability,degrees_freedom)参数:Probability 为卡方分布的单尾概率,Degrees_freedom 为自由度。FINV用途:返回F 概率分布的逆函数值,即F 分布的临界值。语法:FINV(probability,degrees_freedom1,degrees_freedom2)参数:Probability 是累积F 分布的概率值,Degrees_freedom1 是分子自由度,Degrees_freedom2 是分母自由度。CONFIDENCE用途:返回总体平均值的置信区间,它是样本平均值任意一侧的区域。语法:CONFIDENCE(alpha,standard_dev,size)。参数:Alpha 是显著水平参数,Standard_dev 是数据区域的总体标准偏差,Size 为样本容量。实验五) 假设检验实验目的:应用统计软件,在抽样数据获取的基础上,对总体参数进行假设检验。实验要求:了解不同假设检验内容要求的不同检验统计量和检验方法;掌握利用函数表单进行假设检验的方法和步骤;掌握Excel 2003中应用分析工具库进行假设检验的方法和步骤。 实验内容:假设检验的函数表单函数表单构建的基本思路是:1.确定需进行假设检验的总体参数2.确定抽样样本统计量及其服从的分布3.进行假设设计(单侧,双侧)4.确定置信水平5.计算检验统计量6.计算置信水平下的检验区间(或检验临界值)7.比较检验统计量与检验区间(或检验临界值) ,得出结论总体方差已知,总体均值检验,不论样本大小都用正态分布处理总体均值u的双尾检验假设检验H0总体均值=总体均值假设值H1总体均值总体均值假设值样本统计量样本个数=Count(样本数据)样本均值=Average(样本数据)用户输入总体标准差总体均值假设值置信水平计算结果抽样平均误差=总体标准差/Sqrt(样本个数)检验统计量=(样本均值-总体均值假设值)/抽样平均误差检验区间下限=Normsinv(1-置信水平)/2)检验区间上限=Normsinv(1-(1-置信水平)/2)检验结果=If(And(检验区间上限检验统计量,检验统计量检验区间下限),“接受H0”,“拒绝H0”)总体均值u的左单侧检验假设检验H0总体均值总体均值假设值H1总体均值总体均值假设值样本统计量样本个数=Count(样本数据)样本均值=Average(样本数据)用户输入总体标准差总体均值假设值置信水平计算结果抽样平均误差=总体标准差/Sqrt(样本个数)检验统计量=(样本均值-总体均值
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号