资源预览内容
第1页 / 共42页
第2页 / 共42页
第3页 / 共42页
第4页 / 共42页
第5页 / 共42页
第6页 / 共42页
第7页 / 共42页
第8页 / 共42页
第9页 / 共42页
第10页 / 共42页
亲,该文档总共42页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第四章第四章 综合指标与数据分布特征综合指标与数据分布特征第一节第一节 总量指标总量指标 第二节第二节 相对指标相对指标第三节第三节 数据分布集中趋势的测定数据分布集中趋势的测定第四节第四节 数据分布离散程度的测定数据分布离散程度的测定第五节第五节 分布的偏度与峰度分布的偏度与峰度第一节第一节 总量指标总量指标一、总量指标的概念、作用和种类1、总量指标:是反映社会经济现象在一定时间、地点、条件下的总体规模或水平的统计指标。也称绝对数指标,其表现形式是绝对数。2、总量指标的作用3、总量指标的种类v按反映总体内容不同:总体单位总量和总体标志总量v按反映时间状态不同:时期指标和时点指标 时期指标和时点指标的区别:是否连续登记、是否具有累加性、指标数值大小是否受时间长短制约。第一节第一节 总量指标总量指标二、总量指标的计量单位1、实物单位v自然单位v度量衡单位v标准实物单位2、货币单位3、劳动单位指标类型登记方式累加性时间制约时期指标连续登记具备受时间长短制约时点指标间断登记不具备 与时间间隔长短无关第二节第二节 相对指标相对指标一、相对指标的概念和作用1、相对指标:是两个有联系的指标对比计算的比率,反映事物在时间、空间、事物本身内部及不同事物之间的联系程度和对比关系,也称相对数。2、相对指标的作用二、相对指标的种类及计算方法1、结构相对指标 结构相对数结构相对数=(总体部分数值(总体部分数值总体全部数值)总体全部数值)100%2、比例相对指标 比例相对数比例相对数=总体中某部分数值总体中某部分数值总体中另一部分数值总体中另一部分数值第二节第二节 相对指标相对指标3、比较相对指标:同类事物不同空间的静态比较比较相对数比较相对数=甲地区某一现象的水平甲地区某一现象的水平乙地区同类现象的水平乙地区同类现象的水平4、计划完成程度相对指标计划完成相对数计划完成相对数=(实际完成数(实际完成数计划任务数)计划任务数)100%5、强度相对指标:性质不同但有联系的指标对比强度相对数强度相对数=某一总量指标数值某一总量指标数值另一有联系而性质不同的另一有联系而性质不同的总量指标数值总量指标数值6、动态相对指标动态相对数动态相对数=报告期指标数值报告期指标数值基期指标数值基期指标数值第二节第二节 相对指标相对指标三、计算和运用相对指标的原则1、可比原则 要求分子、分母在:内容、范围、计算方法、计算价格、计量单位等可比。2、相对指标和总量指标结合运用的原则3、相对指标和多个指标结合运用原则第三节第三节 数据分布集中趋势的测定数据分布集中趋势的测定平均指标平均指标一、平均指标的概念及特点一、平均指标的概念及特点1、平均指标:又称平均数,指同类现象在一定时间、地点、条件下达到的一般水平。2、平均指标的特点v将数量差异抽象化v只能就同类现象计算v能反映总体变量的集中趋势3、平均数有数值平均数和位置平均数两种v数值平均数是根据数据分布中的全部标志值计算得到的,有算术平均数、调和平均数、几何平均数。v位置平均数是根据数据分布中的某些标志值在总体中所处的位置来确定的,有众数、中位数。二、算术平均数二、算术平均数 算术平均数也称均值,是全部数据的算术平均。1、简单算术平均数 (适用于未分组情况) 例:某企业的一个生产班组有5名工人,其月工资分别为700元、750元、800元、850元、900元。则这5名工人的月平均工资为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度 2.加权算术平均数(适用于已分组情况)例:某车间有50名工人,日生产某种零件如表1所示,试求工人平均日产零件数。解:工人平均日产零件数:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度表1: 日产零件加权平均数计算表 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度v 权数除用次数(频数)表示外,还可以用比重(频率)表示。公式如下:例: 仍以表1资料为例,采用比重计算加权算术平均数,平均每个工人日产零件数为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度三、调和平均数三、调和平均数 调和平均数是总体各单位变量值倒数的算术平均数的倒数,又称倒数平均数。 1.简单调和平均数 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度 例:设某组5个学生的考试分数为70、80、85、90、92,则5个学生成绩的调和平均数为: 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度 2.加权调和平均数例: 某厂工人工资资料如表2所示,据此资料工人平均工资为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度表2 某工厂工人工资情况及平均工资计算表第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度例: 已知某公司各企业产值计划完成程度及实际完成数如表3所示,则全公司计划完成程度(即各企业平均计划完成程度)为: 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度表3 某公司所属企业产值计划完成情况及平均数计算表第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度四、几何平均数四、几何平均数1.简单几何平均数 例: 某地区20022006年国内生产总值环比发展速度分别为108.0%、107.5%、108.3%、109.3%、109.5%,则其平均发展速度为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度2.加权几何平均数例:某银行对企业的一笔十年期的投资年利率是:第1至3年是7%,第4至6年是8,第7至9年是9,第10年是10。则平均年利率是:即平均年利率为 8.2。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度五、众数五、众数 众数指总体或分布数列中,出现频数最多或出现频率最高的那个标志值。如下图:v单项式数列和组距式数列的众数计算方法不同。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度1.单项式数列的众数确定:统计分组以后找出出现次数最多的标志值即可。 某村农民按家庭儿童人数分组 家庭按儿童数分组(个/户)家庭数(户)0123440 65125 90 40合 计360 l在这个 例子中,众数就是两个儿童。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度2.组距式数列众数的确定:先确定众数所在的组(标志值出现最多的组),然后计算以求得近似的众数值。 或为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度 例:某县农民家庭按人均纯收入分组资料如表4所示,求众数。 解:表4表明,人均纯收入30004000元组户数最多,故该组为众数组。其中,XL=3000、XU=4000、d=1000, 260-236=24, 260-223=37。按下限公式计算:按上限公式计算:即农民家庭人均收入众数为3393.44元。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度 按人均纯收入额分组(元) 农 户 数累 计 次 数向 上 累 计向 下 累 计1000以下100020002000300030004000400050005000以上44792362602231584412335961984210001000956877641381158合 计1000表4 某县农民家庭人均纯收入中位数计算表第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度3、众数的特点:不受极端值的影响一组数据可能没有众数或有几个众数无众数原始数据:10 5 9 12 6 8一个众数原始数据: 6 5 5 9 8 5 55 5多于一个众数原始数据: 25 28 28 28 28 36 42 4242 42第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度六、中位数六、中位数 把总体各单位的标志值按大小顺序排列后,处于中点位置的标志值就是中位数。如:v未分组数列和分组数列中位数的求法不同第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度 1.未分组数列的中位数l把总体各单位的标志值从小到大顺序排列。l若数列有奇数项,中位数就是数列中间位次上的那个标志值。l若数列有偶数项,中位数就是数列中间两个位次上标志值的平均数。例:某组有5名工人,年龄(岁)分别为34、35、36、37、38,则中点位置为 ,中位数为第三个工人的年龄36(岁)。如果有6名工人,年龄(岁)分别为34、35、36、37、38、39,则中点位置为 ,中位数为第三个工人和第四个工人年龄的简单算术平均数36.5(岁)。 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度2.分组数列的中位数l单项式分组:首先确定中位数所在的组,即累计频数达到f/2,然后确定中位数的具体值。 某村农民按家庭儿童人数分组f/2=360/2=180和 f/2+1=360/2+1=181中位数的位置是在第180和181家庭之间。从第一组家庭户数开始向后累加至180181户,即中位数是两个儿童。家庭按儿童数分组(个/户)家庭数(户)0123440 65125 90 40 合 计 360第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度l组距式分组数列的中位数求法(1)先确定中位数所在的组: 求f/2,从第一组的总体单位数开始向后累加至f/2止(2)计算中位数的近似值: 下限公式: 上限公式:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度例:根据表4的资料确定中位数。解:据表中资料计算: ,第四组为中位数组。XL=3000 XU=4000 d=10 359 381按上限公式计算中位数: 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度众数、中位数、均值的关系众数、中位数、均值的关系1、对称分布:众数、对称分布:众数=中位数中位数=均值均值2、右偏分布、右偏分布: 众数众数中位数中位数中位数中位数均值均值 左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值 = = = 中位数中位数中位数中位数中位数中位数 = = 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第四节第四节 数据分布离散程度的测定数据分布离散程度的测定标志变异指标标志变异指标一、标志变异指标一、标志变异指标1、概念:是反映同质总体各单位标志值的差异程度,即数列的离散趋势的指标,又称标志变动度。2、作用:v衡量平均指标的代表性v反映社会经济活动过程的均衡性v标志变异指标是统计分析的一个基本指标3、种类:全距、四分位差、平均差、标准差、离散系数二、全距二、全距R1、定义: 全距也称极差,是一组数据的最大值与最小值之差,是离散程度的最简单测度值。2、计算:v未分组数据:R=最大值-最小值v分组数据:R=最大组上限-最小组下限3、特点:v计算方便,便于理解v易受极端值影响v未考虑数据的分布第四节第四节 数据分布离散程度的测定数据分布离散程度的测定三、三、四分位差四分位差IQR1、定义: 四分位差也称内距或修正极差,是上四分位数与下四分位数之差。2、计算:内距内距= 上四分位数上四分位数 下四分位数下四分位数=Q3 Q13、特点:v反映了中间50%数据的离散程度v不值受极端的影响,v可以衡量中位数的代表性高低第四节第四节 数据分布离散程度的测定数据分布离散程度的测定第四节第四节 数据分布离散程度的测定数据分布离散程度的测定四、平均差四、平均差A.D.1、定义: 平均差是数列中各单位标志值与平均数之差绝对值的平均数。2、计算:v未分组数据:v分组数据:3、特点:v全面反映标志值的差异程度v不适合代数方法的演算使其使用受到限制五、方差和标准差五、方差和标准差1、定义: 方差是总体各单位某一数量标志的标志值与其算术平均数的离差平方的平均数。 方差的平方根为标准差,又称均方差。2、计算:v总体方差与标准差v样本方差与标准差3、特点:v离散程度的最常用的测度值之一v反映了各变量值与均值的平均差异第四节第四节 数据分布离散程度的测定数据分布离散程度的测定总体方差和标准差 (Population variance and Standard deviation)未分组数据:分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式样本方差和标准差 (simple variance and standard deviation)未分组数据:分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n nn-1-1-1去除去除去除! !六、六、离散系数离散系数1、定义: 离散系数也称标准差系数,是一组数据的标准差与其相应的均值之比2、计算:3、特点:v对数据相对离散程度的测度v消除了数据水平高低和计量单位的影响v用于对不同组别数据离散程度的比较第四节第四节 数据分布离散程度的测定数据分布离散程度的测定七、属性总体的概念及特征值的计算七、属性总体的概念及特征值的计算1、概念: 属性总体属性总体就是将可以将总体单位分为具有某种标志的单位和不具有某种标志的单位的总体。 可以用“是”或“否”来表示的标志称为是非标志是非标志,一般用“1”表示具有某种标志,“0”表示不具有某种标志。 总体中两部分单位占全部单位的比重称为成数成数,用p或q 表示。2、属性总体的特征值第四节第四节 数据分布离散程度的测定数据分布离散程度的测定一、偏态及其测度:一、偏态及其测度:v偏态是对分布偏斜方向及程度的测度。v偏态系数SKv判别:1、SK=0,对称分布 2、SK0,正偏或右偏分布 3、SK0,尖峰分布 3、K0,平峰分布第五节第五节 分布偏态与峰度分布偏态与峰度
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号