资源预览内容
第1页 / 共91页
第2页 / 共91页
第3页 / 共91页
第4页 / 共91页
第5页 / 共91页
第6页 / 共91页
第7页 / 共91页
第8页 / 共91页
第9页 / 共91页
第10页 / 共91页
亲,该文档总共91页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1统 计 学StatisticsStatistics2第二章 统计数据的收集与整理第四节 统计数据特征描述3综合指标的分类指标可以分为五类: 第一类总量指标 第二类相对指标 第三类平均指标 第四类变异指标 第五类形状指标反映集中趋势反映集中趋势反映离中趋势反映离中趋势反映数据形态反映数据形态4一、总量指标总量指标的含义总量指标又称统计绝对数,是反映社会经济现象发展的总规模、总水平的综合指标。总量指标是最基本的综合指标。总量指标不仅反映现象的总规模或总水平,而且也表现为总量之间的绝对差数。如:某镇上年粮食总产量为42万吨、总人口数为56000人、地区生产总值为67200万元等,这些指标都是总量指标。如:某市地区生产总值今年比上年增加3200万元, 这一指标也是总量指标。5总量指标的分类(课外)1、按照反映现象总体内容的不同总体单位总量:是指总体内所有单位的总数。总体标志总量:是指总体中各单位标志值之和。例如:要对某公司的全体职工进行调查,则:例如:要对某公司的全体职工进行调查,则:该公司的职工总人数该公司的职工总人数 总体单位总量总体单位总量工资总额工资总额 总体标志总量总体标志总量 归纳总结:对一个特定的统计总体而言,总体单位归纳总结:对一个特定的统计总体而言,总体单位总量只有一个,而总体标志总量可以有若干个;总量只有一个,而总体标志总量可以有若干个;总体单位总量一般是离散变量,而总体标志总量可总体单位总量一般是离散变量,而总体标志总量可以是离散变量,也可以是连续变量。以是离散变量,也可以是连续变量。62、按照反映时间状况的不同时期指标时点指标指反映某种社会经济现象在一段时间发展变指反映某种社会经济现象在一段时间发展变化结果的总量指标,它反映的是一段时间连化结果的总量指标,它反映的是一段时间连续发生的变化过程。如产品产量、商品销售续发生的变化过程。如产品产量、商品销售量、工业增加值等均属时期指标。量、工业增加值等均属时期指标。指反映社会经济现象在某一时间点上状况的指反映社会经济现象在某一时间点上状况的总量指标。如年末人口数、月末商品库存量、总量指标。如年末人口数、月末商品库存量、年末大牲畜存栏头数等均属时点指标。年末大牲畜存栏头数等均属时点指标。 时期指标和时点指标分别具有哪些特点?7 归纳总结:归纳总结: 1、时期指标具有可加性,连续的各个时期的、时期指标具有可加性,连续的各个时期的数量相加的结果表明现象在更长时期内的累计总量。数量相加的结果表明现象在更长时期内的累计总量。如:如:产量。产量。而时点指标相加无实际意义,而时点指标相加无实际意义,如:全国人口数、出如:全国人口数、出勤率。勤率。2、时期指标数值的大小与时期的长短有直接关系,对同一、时期指标数值的大小与时期的长短有直接关系,对同一现象,时期越长,指标数值越大,现象,时期越长,指标数值越大,如,一年的产品生产量如,一年的产品生产量肯定大于一个月的生产量。肯定大于一个月的生产量。而时点指标的数值大小与时间而时点指标的数值大小与时间间隔长短无直接关系间隔长短无直接关系,如年末人口数不一定大于年初人口,如年末人口数不一定大于年初人口数。数。3、时期指标数值一般是通过经常性调查取得,即进行连续、时期指标数值一般是通过经常性调查取得,即进行连续不断登记、汇总而得到的。而时点指标的数值一般是通过不断登记、汇总而得到的。而时点指标的数值一般是通过一次性调查取得。即对某一时刻的数据进行登记、汇总而一次性调查取得。即对某一时刻的数据进行登记、汇总而得到。得到。时期指标和时点指标的特点时期指标和时点指标的特点8(一) 社会总产品社会总产品也称总产出。它是指一个国家或地区在一定时期(如一年)内全部生产活动的总成果,当以货币表现时,即为全部生产活动成果的价值总量。 (二) 增加值增加值是企业或部门在一定时期(如一年)内从事生产经营活动所增加的价值。它是总产出减去中间投入后的余额,因此,从价值构成看,它包括全部新创造的价值和物质消耗中本期固定资产折旧。9(三)国内生产总值(GDP)指指一一定定时时期期内内在在一一个个国国家家(或或地地区区)境境内内生生产产的的最终产品与服务的市场价值总和。最终产品与服务的市场价值总和。是一个市场价值概念是一个市场价值概念衡量的是最终产品和服务的价值衡量的是最终产品和服务的价值是在一国(或地区)范围内生产的是在一国(或地区)范围内生产的是在一定时间内生产的是在一定时间内生产的理解理解理解理解GDPGDP10(1 1)GDPGDP是一个市场价值概念是一个市场价值概念 现实经济中不同种类产品和服务的实物量不能直接加总现实经济中不同种类产品和服务的实物量不能直接加总现实经济中不同种类产品和服务的实物量不能直接加总现实经济中不同种类产品和服务的实物量不能直接加总; 不经过市场交易的价值就不构成不经过市场交易的价值就不构成不经过市场交易的价值就不构成不经过市场交易的价值就不构成GDPGDPGDPGDP的组成部分。的组成部分。的组成部分。的组成部分。(2 2)GDPGDP衡量的是最终产品和服务的价值衡量的是最终产品和服务的价值最终产品和服务:直接出售给最终消费者;最终产品和服务:直接出售给最终消费者;最终产品和服务:直接出售给最终消费者;最终产品和服务:直接出售给最终消费者;中间产品和服务:被企业当做投入品继续生产。中间产品和服务:被企业当做投入品继续生产。中间产品和服务:被企业当做投入品继续生产。中间产品和服务:被企业当做投入品继续生产。11(3 3)GDPGDP是在一国(或地区)范围内生产的是在一国(或地区)范围内生产的指定范围内的产品和服务的价值才能计入某国或某地指定范围内的产品和服务的价值才能计入某国或某地 区的区的GDPGDP。GNPGNP:国民生产总值,是一国(或地区)的成员在一:国民生产总值,是一国(或地区)的成员在一 定时期内生产的最终产品和服务的市场价值总和。定时期内生产的最终产品和服务的市场价值总和。外国人外国人中国人中国人中中国国全球全球中国人中国人中国人中国人12(4 4)GDPGDP是在一定时间内积累的是在一定时间内积累的 流量:在一定时期内发生的某种经济变量变动的数值;流量:在一定时期内发生的某种经济变量变动的数值;流量:在一定时期内发生的某种经济变量变动的数值;流量:在一定时期内发生的某种经济变量变动的数值; 存量:在一定时点上存在的某种经济变量的数值。存量:在一定时点上存在的某种经济变量的数值。存量:在一定时点上存在的某种经济变量的数值。存量:在一定时点上存在的某种经济变量的数值。13(5 5)国内生产总值的计算方法)国内生产总值的计算方法生产法:增加值生产法:增加值= =总产出总产出- -中间投入中间投入 国内生产总值国内生产总值= =国民经济各部门增加值之和国民经济各部门增加值之和收入法:国民各部门增加值收入法:国民各部门增加值= =劳动者报酬劳动者报酬+ +固定资产折旧固定资产折旧 + +生产税净额生产税净额+ +营业盈余营业盈余支出法:国内生产总值支出法:国内生产总值= =总消费总消费+ +总投资总投资+ +净出口净出口 例例4.14.1:课本第:课本第7171页页14二、相对指标(一)相对指标的含义 相对指标也称相对数,它是用两个有联系的指标进行对比的比值来反映现象数量特征和数量关系的综合指标。相对指标的计量形式: 无名数(系数、倍数、百分数、千分数等) 有名数(强度、密度和普遍程度)15(二) 相对指标的种类及其计算方法 计划完成程度相对指标(%)结构相对指标(%)(课外)比例相对指标 比较相对指标(%)强度相对指标 动态相对指标 相相对对指指标标的的种种类类16 1 1、计划完成程度相对指标、计划完成程度相对指标= 分子项分子项数值减分母项数值的差额则表明执行计划的绝数值减分母项数值的差额则表明执行计划的绝对效果。对效果。(1)(1) 计划数为绝对数时计划数为绝对数时 可直接用上述计算公式可直接用上述计算公式,如如42页例题页例题 17例某企业某产品产量计划要求增长1010,同时该种产品单位成本计划要求下降5 5,而实际产量增长了1212,实际单位成本下降了8 8,则计划完成程度指标为: 计算结果表明,产量计划完成程度大于100100,说明超额完成计划。而单位成本计划完成程度小于100100,说明实际成本比计划成本有所降低,也超额完成了成本降低计划。(2)(2)计划数为相对数计划数为相对数182 2、结构相对指标、结构相对指标= = 结构相对指标是在资料分组的基础上,以总体结构相对指标是在资料分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,总量作为比较标准,求出各组总量占总体总量的比重,以反映总体内部组成情况的综合指标。以反映总体内部组成情况的综合指标。 全国全国农林牧林牧渔业总产值构成(按当年价格构成(按当年价格计算)算)(%)(%)年份年份农业农业林业林业牧业牧业渔业渔业199858.03.528.69.9199957.53.628.510.4200055.73.829.710.8200155.23.630.410.8193 3、比例相对指标、比例相对指标= = 比例相对指标是总体中不同部分数量对比的相对比例相对指标是总体中不同部分数量对比的相对指标,用以分析总体范围内各个局部、各个分组之间指标,用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况。的比例关系和协调平衡状况。例如:我国第四次人口普例如:我国第四次人口普查结果果为:男性男性584,949,922584,949,922人,女性人,女性548,732,579548,732,579人,人,则男女比例男女比例=:1我国第六次人口普我国第六次人口普查结果果为:1.05:11.05:1204 4、比较相对指标、比较相对指标= = 比较相对指标是不同空间(国家、地区、企业比较相对指标是不同空间(国家、地区、企业等)的同类现象数量对比而确定的相对指标,用以说等)的同类现象数量对比而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡程明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类事物在不同条件下的数量对比关系。度,以表明同类事物在不同条件下的数量对比关系。可以是两个总量指标对比,也可以是两个相对指标对比,可以是两个总量指标对比,也可以是两个相对指标对比,还可以是两个平均指标对比;可以是不同国家对比,也可还可以是两个平均指标对比;可以是不同国家对比,也可以是不同地区不同单位对比,还可以是与标准水平或平均以是不同地区不同单位对比,还可以是与标准水平或平均水平的对比。水平的对比。如如43页例题页例题215 5、强度相对指标、强度相对指标= = 强度相对指标是由两个性质不同而又有联系的现强度相对指标是由两个性质不同而又有联系的现象的总量指标对比的比值,用来反映现象的强度、密象的总量指标对比的比值,用来反映现象的强度、密度或普遍程度。如:人口密度、人均国民生产总值等度或普遍程度。如:人口密度、人均国民生产总值等强度相对指标可以用来反映国民经济及社会发展基本情况;强度相对指标可以用来反映国民经济及社会发展基本情况;强度相对指标可以用来反映经济效益情况;强度相对指标可以用来反映经济效益情况;强度相对指标可以用来反映生产条件和公共设施的配备情况;强度相对指标可以用来反映生产条件和公共设施的配备情况;在计算强度相对指标时,可有正指标和逆指标之分,其实质是在计算强度相对指标时,可有正指标和逆指标之分,其实质是分子、分母互换位置。正指标是指数值大小与现象的强度、密度分子、分母互换位置。正指标是指数值大小与现象的强度、密度和普遍程度成正比例,逆指标是指数值大小与现象的强度、密度和普遍程度成正比例,逆指标是指数值大小与现象的强度、密度和普遍程度成反比例。和普遍程度成反比例。强度相对指标中的人均指标不是平均指标,平均指标是总体的强度相对指标中的人均指标不是平均指标,平均指标是总体的标志总量和总体单位总量的对比。标志总量和总体单位总量的对比。如如65页题页题7226 6、动态相对指标、动态相对指标= = 动态相对数又称发展速度,表示同类事物的水平动态相对数又称发展速度,表示同类事物的水平报告期与基期对比发展变化的程度。一般用百分数表报告期与基期对比发展变化的程度。一般用百分数表示。通常将作为比较标准的时期称为基期,与基期相示。通常将作为比较标准的时期称为基期,与基期相比较的时期称为报告期,也叫计算期。比较的时期称为报告期,也叫计算期。23不同时期不同时期比比 较较动动 态态相对指标相对指标强强 度度相对指标相对指标不同现象不同现象比较比较不同总体不同总体比较比较比比 较较相对指标相对指标同一总体中同一总体中部分与部分部分与部分比比 较较部分与总体部分与总体比比 较较实际与计划实际与计划比比 较较比比 例例相对指标相对指标结结 构构相对指标相对指标计划完成计划完成相对指标相对指标同一时期比较同一时期比较同类现象比较同类现象比较24平均指标的含义平均指标的含义 1 1、概念:、概念: 平均指标反映同类现象的一般水平,是总体内各单平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。势的测定。 可以从三方面理解:可以从三方面理解: 计算平均指标的各个单位是同质的;计算平均指标的各个单位是同质的; 将总体各单位之间量的差异抽象化;将总体各单位之间量的差异抽象化; 用一个指标表示总体各单位一般水平用一个指标表示总体各单位一般水平三、三、平均指标平均指标25平均数的概念平均数的概念数据集中区数据集中区变量变量x262、平均指标的种类、平均指标的种类 数值平均数数值平均数 位置平均数位置平均数 算术平均数算术平均数 众众 数数 调和平均数调和平均数 中位数中位数 几何平均数几何平均数 27习题:1.计算下列数据的平均数:154 133 116 128 85 100 105 146 118 97 110 131 119 103 93 1082.计算右表 中工人的 平均日产量。日产量(件)工人数(人)202122232425102030504030合计180某车间工人按日产量分组表28设一组数据为:设一组数据为:X X1 1 ,X X2 2 , ,X XN N 简单算数平均数简单算数平均数简单算数平均数简单算数平均数计算公式为计算公式为(1) (1) 简单算术平均数的计算方法简单算术平均数的计算方法(一)算术平均数(一)算术平均数29 原始数据原始数据:10:105 59 913136 6 8 8简单算术平均数的计算方法简单算术平均数的计算方法30设分组后的数据为:设分组后的数据为:X X1 1 ,X X2 2 , ,X XK K 相应的频数为:相应的频数为: F F1 1 ,F F2 2 , ,F FK K加权均值加权均值加权均值加权均值的计算公式为的计算公式为(2) (2) 加权算术平均数的计算方法加权算术平均数的计算方法31权权数数(WeightedWeighted),是是分分布布数数列列中中的的频频数数或或频频率率。对对求求平平均均数数具具有有权权衡衡轻轻重重的的作作用用,是是影影响响平平均均数数变动的两个因素之一(另一因素是变量值)。变动的两个因素之一(另一因素是变量值)。权权 数数例例(1) (2)(3)X456合计合计频数频数 频率频率(%)10201025.050.025.040100.0X456合计合计频数频数 频率频率(%)20402025.050.025.080100.0X456合计合计频数频数 频率频率(%)20101050.025.025.040100.0 平均数平均数=5 平均数平均数=5 平均数平均数=4.75 频数变、频数变、频率不变频率不变频数变、频数变、频率变频率变32 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:甲组: 考试成绩(考试成绩(X X ): : 0 20 100 0 20 100 人数分布(人数分布(F F ):): 1 1 8 1 1 8 乙组:乙组: 考试成绩(考试成绩(X X ): : 0 20 100 0 20 100 人数分布(人数分布(F F ):): 8 1 1 8 1 1X X X甲甲甲01+201+100801+201+100801+201+1008n n n 101010iii=1=1=1 X X Xiii 828282828282(分)(分)(分)(分)(分)(分)X X X乙乙乙08+201+100108+201+100108+201+1001n n n 101010iii=1=1=1 X X Xiii 121212121212(分)(分)(分)(分)(分)(分)单项式分组数据的单项式分组数据的加权平均数计算加权平均数计算33 某车间某车间5050名工人日加工零件均值计算表名工人日加工零件均值计算表按零件数分组按零件数分组组中值(组中值(Xi)频数(频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计合计506160.0【例例例例】根据下表中的数据,计算根据下表中的数据,计算根据下表中的数据,计算根据下表中的数据,计算50 50 名工人日加工零件数的均值名工人日加工零件数的均值名工人日加工零件数的均值名工人日加工零件数的均值组距式分组数据的组距式分组数据的加权平均数计算加权平均数计算如如46页例题页例题34(3)(3)算术平均数的数学性质算术平均数的数学性质1 1)各变量值与均值的离差之和等于零2 2 2 2)各变量值与均值的离差平方和最小)各变量值与均值的离差平方和最小)各变量值与均值的离差平方和最小)各变量值与均值的离差平方和最小35例:市场上有三种等级的某种蔬菜,一级为例:市场上有三种等级的某种蔬菜,一级为 1元元/斤(斤( ),二级为),二级为1.5元元/斤(斤( ),), 三三 级为级为2元元/斤(斤( )。 若每种分别买若每种分别买1元,平均价格为多少?元,平均价格为多少?(每种的购买金额相同的情况每种的购买金额相同的情况) 若每种分别买若每种分别买10、20、30元,平均价格为多少?元,平均价格为多少?36 若每种分别买若每种分别买1元,平均价格为多少?元,平均价格为多少?(每种的购买金额相同的情况每种的购买金额相同的情况) 若每种分别买若每种分别买10、20、30元,平均价格为多少?元,平均价格为多少?37调和平均数是各个标志值倒数的算数平均数的倒数。 集中趋势的测度值之一均值的另一种表现形式易受极端值的影响如果组距数列有开口组,则平均值的代表性差(二)调和(倒数)平均数(二)调和(倒数)平均数 是算术平均数的变形形式是算术平均数的变形形式 3839表表 某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜名称蔬菜名称批发价格批发价格( (元元) ) Xi成交额成交额( (元元) ) XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合计3690048000【例例例例】某蔬菜批发市场三种蔬菜的日成交数据如下表所示,某蔬菜批发市场三种蔬菜的日成交数据如下表所示,某蔬菜批发市场三种蔬菜的日成交数据如下表所示,某蔬菜批发市场三种蔬菜的日成交数据如下表所示,计算三种蔬菜该日的平均批发价格计算三种蔬菜该日的平均批发价格计算三种蔬菜该日的平均批发价格计算三种蔬菜该日的平均批发价格40例题:某集团公司下属甲、乙、丙三个子公司计划完成程度资料及实际增加值资料如表所示,计算平均计划完成程度。计划完成程度(%)实际增加值(万元)甲乙丙110 98106132 127.4 149.8 409.2表表 某集团计划完成程度资料表某集团计划完成程度资料表104.57%41(三)几何平均数当当几几个个变变量量值值的的连连乘乘积积等等于于总总比比率率或或总总速速度度时时,必必须须用用几几何何平平均均数数的的形形式式来来计计算算平平均均比比率率和和平平均均速度。速度。它是几个变量值连乘积的它是几个变量值连乘积的n n次方根。次方根。如如47页例题页例题42例:设有一组数据:例:设有一组数据:110%,110%,120%,120%, 120%,125%,计算几何平均数。,计算几何平均数。43 例 某工商银行某项投资年利率是按复利计算的,20年的利率分配如表所示,计算20年的平均年利率。投投资年利率分年利率分组表表年限年限年利率(年利率(%)本利率(本利率(%)xi年数(个)年数(个)fi第第1年年51051第第2年至第年至第4年年81083第第5年至第年至第15年年1511511第第16年至第年至第20年年181185合合 计计2020年的平均年利率:年的平均年利率:即即20年的平均年利率年的平均年利率为114.14%1=14.14%44例题:某批产品的生产要经过四道工序,且要经过四次检验,第一次检验合格率为95%,第二次检验合格率为96%,第三次检验合格率为98%,第四次检验合格率为98%,求平均合格率。45例:某批产品的生产要经过四道工序,且要经过四次检验,四次检验次品率分别为5%、2%、4%、2%,求平均次品率。1 1)先计算合格率)先计算合格率2 2)计算合格率的连乘积)计算合格率的连乘积3 3)开)开4 4次方根,计算平均合格品率次方根,计算平均合格品率4 4)平均次品率)平均次品率=1-=1-平均合格品率平均合格品率46调和平均数与算术平均数的区别调和平均数与算术平均数的区别凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标平均指标分子:标志总量分子:标志总量分母:总体单位总数分母:总体单位总数47价格(元)价格(元)3.32.52.0合计合计销售量(斤)销售量(斤)34512算术平均算术平均求某种商品三种零售价格的平均价格求某种商品三种零售价格的平均价格调和平均调和平均价格(元)价格(元)3.32.52.0合计合计销售额(元)销售额(元)1010103048例例: 求求95%、93%、90%的几何平均数的几何平均数几何平均数等于对数的算术平均几何平均数等于对数的算术平均49MMe e50%50%(四)中位数(四)中位数(MEDIANMEDIAN) 中位数的概念中位数的概念 把总体单位的某一数量标志的各个数值,把总体单位的某一数量标志的各个数值,按大小排列,处于中点位置的标志值,就是中按大小排列,处于中点位置的标志值,就是中位数。位数。50未分组数据:未分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:组距分组数据:组距分组数据:( (1 1) ) 中位数位置的确定中位数位置的确定51( (2 2) ) 未分组数据的中位数的计算未分组数据的中位数的计算52原始数据原始数据: : 24 22 21 26 2024 22 21 26 20排排 序序: : 20 21 22 24 26 20 21 22 24 26位位 置置: 1 2 3: 1 2 3 4 5 4 5中位数中位数 22例未分组数据的中位数例未分组数据的中位数53原始数据原始数据: 10 5: 10 5 9 12 6 8 9 12 6 8排排 序序: : 5 6 8 9 10 12 5 6 8 9 10 12位位 置置: : 1 2 3 1 2 3 4 5 6 4 5 6位位 置置N+126+123.5中位数中位数 8 + 928.5例未分组数据的中位数例未分组数据的中位数54【例例例例】根根据据下下表表数数据据,计计算算甲甲城城市市家家庭庭对对住住房房满满意意状状况况评评价价的中位数的中位数解:解:解:解:中位数的位置为:中位数的位置为: 300/2300/2150150从从累累计计频频数数看看,中中位位数数的的在在“ “一一般般” ”这这一一组组别别中。因此中。因此 MMe e一般一般一般一般表 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 ( (户户) )累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300(3) (3) 分组数据的中位数分组数据的中位数) ) 单项式单项式单项式单项式分组数据的中位数分组数据的中位数分组数据的中位数分组数据的中位数如如50页例题页例题55 A A 根据位置公式确定中位数所在的组 B B 采用下列近似公式计算: 2)2) 组距式组距式组距式组距式分组数据的中位数分组数据的中位数分组数据的中位数分组数据的中位数56表表 某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计50【 例例例例 】 根根据据 右右 表表 数数据据 , 计计 算算50 50 名名工工人人日日 加加 工工 零零件件 数数 的的 中中位数位数例分组数例分组数例分组数例分组数据的中位数据的中位数据的中位数据的中位数如如51页例题页例题57(五)众数(MODE)(1) (1) (1) (1) 众数的概念众数的概念众数的概念众数的概念:总体中出现次数最多的标志值总体中出现次数最多的标志值无众数无众数原始数据原始数据: 10 5 9 12 6 8: 10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据: : : : 6 6 6 6 5 5 5 5 9 8 9 8 9 8 9 8 5 55 55 55 5多于一个众数多于一个众数多于一个众数多于一个众数原始数据原始数据原始数据原始数据: : : : 25 25 25 25 28 28 28 28 28 28 28 28 36 36 36 36 42 4242 4242 4242 42(2) (2) (2) (2) 众数的性质众数的性质众数的性质众数的性质:不唯一性:不唯一性:不唯一性:不唯一性58众数对描述衣物尺码数据中心位置尤为有用 虽然虽然9.6259.625是样本平均数,但是样本平均数,但是号码为是号码为1010的鞋穿的人最多,的鞋穿的人最多,1010是众数。在购买决策中是众数。在购买决策中, ,应该购买应该购买更多号码为众数的鞋,平均值在更多号码为众数的鞋,平均值在这种情况下没有意义了。这种情况下没有意义了。59表表 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数( (人人) )比例比例频率频率(%)(%) 商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100【例例例例】根据下表数据,计算众数。根据下表数据,计算众数。根据下表数据,计算众数。根据下表数据,计算众数。解:解:解:解: MMo o商品广告商品广告商品广告商品广告60【例例例例】根据下表数据,计算众数。根据下表数据,计算众数。解:解:解:解: MMo o不满意不满意不满意不满意表表 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 ( (户户) )百分比百分比 (%)(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.061M MMoooM MMoooM MMooo(3)(3)分组数据的众数分组数据的众数6263表表 某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计50【例例例例】计算计算计算计算5050名工人日加工零件数的众数名工人日加工零件数的众数名工人日加工零件数的众数名工人日加工零件数的众数64(六)各种平均数的适用范围及其相互关系(六)各种平均数的适用范围及其相互关系无论是自然现象还是社会现象,很多变量的分布都表现为接近平均数的标志值居多,远离平均数的标志值较少,也即多数标志值以平均数为中心密集地分布在它的两侧,呈现出向心力作用下的集中趋势。65几种数值平均数的比较算术平均数 优点:容易理解,便于计算; 算术平均数的性质 缺点:易受极值影响;在偏斜分布和U U形分布中,不 具有代表性。调和平均数 优点: 不能直接计算算术平均数情况下代替办法。 缺点: 易受极值影响;有“ “ 0”0”值时不能计算几何平均数 优点:受极端值的影响较算术平均数小 。 缺点: : 有“0”0”或负值时,计算出的几何平均数就会成为负数或虚数 ;仅适用于具有等比或近似等比关系的数据66位置平均数位置平均数的应用范围及代表性都较差67算术平均数、众数、中位数的关系算术平均数、众数、中位数的关系正态分布正态分布68正偏分布正偏分布(右偏分布右偏分布)负偏分布负偏分布( (左偏分布左偏分布) )据据经验,在分布偏斜程度不大的情况下,不,在分布偏斜程度不大的情况下,不论右偏或左偏,右偏或左偏,三者存在一定的比例关系,即众数与中位数的距离三者存在一定的比例关系,即众数与中位数的距离约为算算术平均数与中位数的距离平均数与中位数的距离2倍,用公式表示倍,用公式表示为:, 左左偏偏分分布布是是尾尾巴巴在在左左的的,受受极极值值影影响响,均均值值会会被被拉拉到到最最左左边边,而而众众数数和和中中位位数位置平均数不受影响。数位置平均数不受影响。当均值大于中位数时,为右偏分布当均值大于中位数时,为右偏分布当均值小于中位数时,为左偏分布当均值小于中位数时,为左偏分布69平均指标的计算运用原则1.必须在同质总体中计算或应用平均指标;2.用组平均数补充说明总平均数;3.用变量数列补充说明总平均水平;4.将平均指标与离散指标结合起来分析。70四、变异指标四、变异指标(极差、平均差、标准差、方差和离散系数极差、平均差、标准差、方差和离散系数)标志变异指标的含义和种类标志变异指标的含义和种类 标志变异指标的含义标志变异指标的含义 标志变异指标是反映变量分布离散趋势、反映总体标志变异指标是反映变量分布离散趋势、反映总体的差异性,即总体中各单位标志值差别大小的程度的差异性,即总体中各单位标志值差别大小的程度。 作用:作用: 是平均数代表性大小的评价尺度;是平均数代表性大小的评价尺度; 测量经济活动的均匀性或节奏性;测量经济活动的均匀性或节奏性; 揭示总体变量分布的离中程度。揭示总体变量分布的离中程度。71极差极差平均差平均差方差和标准差方差和标准差变异系数变异系数( (离散系数离散系数) ):标准差系数:标准差系数 变异指标的种类:变异指标的种类:721 1.概念:即全距 R R2.2.特点(1)(1)易受极端值影响 (2)(2)未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010未分组数据未分组数据未分组数据未分组数据 R R = max(= max(x xi i) - min(x) - min(xi i) )组距分组数据组距分组数据组距分组数据组距分组数据 R R R R = = 最高组上限最高组上限最高组上限最高组上限 - - - - 最低组下限最低组下限最低组下限最低组下限3. 3. 3. 3. 计算公式为计算公式为计算公式为计算公式为(一)极差(一)极差(Range) 73 所谓标准差就是总体各单位的标志值与平均数离差平方的算术平均数的平方根。 标准差的平方称为方差。(1 1)最常用离散程度的测度值之一(2 2)反映了各变量值与均值的平均差异(3 3)根据总体数据计算的,称为总体方差或标准差;根据样 本数据计算的,称为样本方差或标准差(二)方差和标准差(二)方差和标准差(Variance & Standard deviation) 含义及计算方法含义及计算方法74简单计算:加权计算:加权计算:简单计算:简单计算:加权计算:加权计算:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式方差和标准差方差和标准差 总体总体方差与标准差的计算方差与标准差的计算75简单计算:加权计算:简单计算:加权计算:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式方差和标准差方差和标准差 样本样本方差与标准差的计算方差与标准差的计算如如55页例题页例题76表表 某车间某车间5050名工人日加工零件标准差计算表名工人日加工零件标准差计算表按零件数分组按零件数分组组中值组中值( (X Xi i) )频数频数( (F Fi i) )(Xi- X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计503100.5【例例例例】根据下表中的数据,计算工人日加工零件数的标准差根据下表中的数据,计算工人日加工零件数的标准差如如56页例题和页例题和77(四)变异系数是指消除平均数影响后的标志变异指标,其形式是相对数,包括极差系数、平均差系数和标准差系数。 1.极差系数78标准差与其相应的均值之比消除了数据水平高低和计量单位的影响测度了数据的相对离散程度用于对不同组别数据离散程度的比较计算公式为2.2.标准差系数标准差系数 79表表 某管理局所属某管理局所属8 8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)X X1 1销售利润(万元)销售利润(万元)X X2 21 12 23 34 45 56 67 78 8170170220220390390430430480480650650950950100010008.18.112.512.518.018.022.022.026.526.540.040.064.064.069.069.0【例例例例】某某某某管管管管理理理理局局局局抽抽抽抽查查查查了了了了所所所所属属属属的的的的8 8 8 8家家家家企企企企业业业业,其其其其产产产产品品品品销销销销售售售售数数数数据据据据如如如如下下下下表所示。试比较产品销售额与销售利润的离散程度表所示。试比较产品销售额与销售利润的离散程度表所示。试比较产品销售额与销售利润的离散程度表所示。试比较产品销售额与销售利润的离散程度80X X1 1= =536.25536.25(万元)(万元)S S1 1= =309.19309.19(万元)(万元)V V1 1= =536.25536.25309.19309.19= =0.5770.577S S2 2= =23.0923.09(万元)(万元)V V2 2= =32.521532.521523.0923.09= =0.7100.710X X2 2= =32.521532.5215(万元)(万元)结结论论: 计计算算结结果果表表明明,V V1 1 V V2 2,说说明明产产品品销销售售额额的的离散程度小于销售利润的离散程度离散程度小于销售利润的离散程度 相对离散程度:标准差系数相对离散程度:标准差系数 如如58页例题页例题81概概 念念 计计 算算 特特 点点数列中最数列中最大值与最大值与最小值之差小值之差1.极差极差 (R)R=最大值最大值- -最小值最小值优点:容易理解优点:容易理解 计算方便;计算方便; 缺点:不能反映全缺点:不能反映全部数据分布状况。部数据分布状况。82概概 念念 计计 算算 特特 点点各各标标志志值值与与均均值值离离差差平平方的平均。方的平均。方方差差的的平平方方根(取正根)根(取正根)2.方差方差(2) 和和标标准准差差()优优点点:反反映映全全部部数数据据分分布布状状况况,数字上合理。数字上合理。缺缺点点:受受计计量量单单位位和和平平均均水水平平影影响,不便于比较响,不便于比较3标准标准差系数差系数 (V)标准差与标准差与均值之商,均值之商,是无量是无量纲的系数纲的系数简简单单加加权权优优点点:适适宜宜不不同同数据集的比较。数据集的比较。缺缺点点:对对数数据据结结构构变变化化反反应应不不灵灵敏。敏。方差(方差(2)和标准差()和标准差()是应用最广的标志变异指标)是应用最广的标志变异指标831.算数平均数 与众数比较数据分布偏斜程度的测度偏态系数=0=0为对称分布偏态系数000为右偏分布(一)偏度(一)偏度左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布五、偏度与峰度五、偏度与峰度842.动差法动差法是用标准差的三次方除三阶中心距的方法计算偏度系数。数据分布偏斜程度的测度偏态系数=0=0为对称分布偏态系数000为右偏分布K阶中心动差85数据分布扁平程度的测度峰度系数=3=3峰态程度适中偏态系数333为尖峰分布计算公式为二、峰度二、峰度平峰分布平峰分布平峰分布平峰分布尖峰分布尖峰分布尖峰分布尖峰分布峰态通常是与标准正态分布相比较峰态通常是与标准正态分布相比较而言的而言的. .86【 例例例例 】 已已 知知20022002年年我我国国农农村村居居民民家家庭庭按按纯纯收收入入分分组组的的有有关关数数据据如如右右表表所所示示。试试计计算偏态系数算偏态系数表表 20022002年农村居民家庭纯收入数据年农村居民家庭纯收入数据按纯收入分组(元)按纯收入分组(元)户数比重(户数比重(%)500以下以下500100010001500150020002000250025003000300035003500400040004500450050005000以上以上2.169.8516.3016.7814.3110.457.795.613.832.8410.08三、例子三、例子Data source:httpData source:http87表表 农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组按纯收入分组(百元)(百元)组中值组中值X Xi i户数比重户数比重(%)(%)F Fi i(Xi- X )3 Fi(Xi- X )4 Fi5510101515202025253030353540404545502.57.512.517.522.527.532.537.542.547.552.52.169.8516.3016.7814.3110.457.795.613.832.8410.08合计100174279.019103631.7488根据上表数据计算得根据上表数据计算得根据上表数据计算得根据上表数据计算得结论:结论:结论:结论:农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数据多数,而收入较高的家庭则占少数; ;农村居民家庭纯收入的分布为农村居民家庭纯收入的分布为平峰分布。平峰分布。 三、例子三、例子89户户户户户户数数数数数数比比比比比比重重重重重重(%)(%)(%)25252020151510105 5100010005005001500150020002000250025003000300035003500400040004500450050005000结论:结论:结论:结论:1. 1. 为右偏分布为右偏分布 2. 2. 峰度适中峰度适中农村居民家庭纯收入直方图农村居民家庭纯收入直方图农村居民家庭纯收入直方图农村居民家庭纯收入直方图元元元元三、例子三、例子90数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度平均数平均数平均数平均数平均数平均数众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数离散系数离散系数离散系数离散系数离散系数离散系数标准差标准差标准差标准差标准差标准差峰峰峰峰峰峰 度度度度度度方差方差方差方差方差方差极差极差极差偏偏偏偏偏偏 度度度度度度91谢 谢!
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号