资源预览内容
第1页 / 共40页
第2页 / 共40页
第3页 / 共40页
第4页 / 共40页
第5页 / 共40页
第6页 / 共40页
第7页 / 共40页
第8页 / 共40页
第9页 / 共40页
第10页 / 共40页
亲,该文档总共40页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第一小节 变异指标的基本理论第二小节 全距、分位差和平均差第三小节 标准差和标准差系数 【学习目标】通过本节的学习和习题演算,掌握变异指标的意义和作用;标准差和标准差系数的计算和应用。了解变异指标的分布特性;极差、平均差和四分位差的概念、计算公式和特点;分布的偏度与峰度。第五节离散趋势 一、离散趋势的涵义第五节离散趋势第一小节 变异指标的基本理论指总体中各单位标志值背离指总体中各单位标志值背离指总体中各单位标志值背离指总体中各单位标志值背离分布中心的规模或程度,用分布中心的规模或程度,用分布中心的规模或程度,用分布中心的规模或程度,用标志变异指标标志变异指标标志变异指标标志变异指标来反映。来反映。来反映。来反映。离散趋势离散趋势离散趋势离散趋势反映统计数据差异程度的综反映统计数据差异程度的综反映统计数据差异程度的综反映统计数据差异程度的综合指标,也称为合指标,也称为合指标,也称为合指标,也称为标志变动度标志变动度标志变动度标志变动度变异指标值越大,平均指标的代表性越小;变异指标值越大,平均指标的代表性越小;变异指标值越大,平均指标的代表性越小;变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大反之,平均指标的代表性越大反之,平均指标的代表性越大反之,平均指标的代表性越大 二、变异指标的作用第一小节 变异指标的基本理论q衡量和比较衡量和比较平均数平均数代表性的大小;代表性的大小;q是进行是进行质量控制质量控制的基础;的基础;q是衡量风险程度的尺度。是衡量风险程度的尺度。 例如:某车间有两个生产小组,各有例如:某车间有两个生产小组,各有7名名工人,各人日产量如下工人,各人日产量如下:甲组:甲组:20,40,60,70,80,100,120乙组:乙组:67,68,69,70,71,72,73第一小节 变异指标的基本理论第一小节 变异指标的基本理论供货计划完成百分比供货计划完成百分比(%)季度总供季度总供货计划执货计划执行结果行结果1月月2月月3月月钢钢厂厂甲甲厂厂100323434乙乙厂厂100203050第一小节 变异指标的基本理论二、变异指标的种类以标志值之间相互比较说明变异情况以标志值之间相互比较说明变异情况 以平均数为比较标准来说明标志的变异情况以平均数为比较标准来说明标志的变异情况 以正态分布为标准说明分配数列偏离情况的指标以正态分布为标准说明分配数列偏离情况的指标 平均差平均差平均差平均差标准差标准差标准差标准差平均差系数平均差系数平均差系数平均差系数标准差系数标准差系数标准差系数标准差系数方差方差方差方差峰度峰度峰度峰度偏度偏度偏度偏度全距全距全距全距分位差分位差分位差分位差第二小节 全距、分位差和平均差 指所研究的数据中,最大值与最小值之差,又指所研究的数据中,最大值与最小值之差,又称称极差极差。一、全距一、全距最大变量值或最最大变量值或最高组上限或开口高组上限或开口组假定上限组假定上限最小变量值或最最小变量值或最低组下限或开口低组下限或开口组假定下限组假定下限第二小节 全距、分位差和平均差 【例例A A】某售货小组某售货小组5 5人某天的销售额分别为人某天的销售额分别为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则一、全距一、全距第二小节 全距、分位差和平均差 一、全距一、全距一、全距一、全距【例例例例B B B B】某季度某工业公司某季度某工业公司某季度某工业公司某季度某工业公司18181818个工业企业产值计划完成情况如下:个工业企业产值计划完成情况如下:个工业企业产值计划完成情况如下:个工业企业产值计划完成情况如下:计划完成程度计划完成程度计划完成程度计划完成程度()组中值组中值组中值组中值()企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)9090以下以下以下以下9090100100100100110110110110以上以上以上以上 85 85 95 95105105115115 2 2 3 31010 3 3 800 800 2 500 2 500 17 200 17 200 4 400 4 400合计合计合计合计181824 90024 900第二小节 全距、分位差和平均差 第四节第四节 变异指标变异指标一、全距一、全距qq缺点缺点缺点缺点: :仅取决于两个极端值的水平,不能反映其仅取决于两个极端值的水平,不能反映其仅取决于两个极端值的水平,不能反映其仅取决于两个极端值的水平,不能反映其间的变量分布情况;间的变量分布情况;间的变量分布情况;间的变量分布情况;受个别极端值的影响过于显著,不符合稳受个别极端值的影响过于显著,不符合稳受个别极端值的影响过于显著,不符合稳受个别极端值的影响过于显著,不符合稳健性和耐抗性的要求。健性和耐抗性的要求。健性和耐抗性的要求。健性和耐抗性的要求。全距的特点全距的特点全距的特点全距的特点qq优点优点优点优点: : : :计算方法简单、易懂;计算方法简单、易懂;计算方法简单、易懂;计算方法简单、易懂;第二小节 全距、分位差和平均差 二、分位差二、分位差二、分位差二、分位差从变量数列中,剔除了一部分极端值后从变量数列中,剔除了一部分极端值后计算的类似于极差的指标计算的类似于极差的指标。四分位差四分位差四分位差四分位差十六分位差十六分位差十六分位差十六分位差十分位差十分位差十分位差十分位差八分位差八分位差八分位差八分位差三十二分位差三十二分位差三十二分位差三十二分位差百分位差百分位差百分位差百分位差上四上四分位分位数数下下四四分分位位数数 四分位差是上四分位数与下四分位数之差,也称为内距或四分间距。它主要四分位差是上四分位数与下四分位数之差,也称为内距或四分间距。它主要用于测度顺序数据的离散程度。当然对于数值型数据也可以计算四分位差,但它不用于测度顺序数据的离散程度。当然对于数值型数据也可以计算四分位差,但它不适合于分类数据。适合于分类数据。 假设有数组:假设有数组:假设有数组:假设有数组:0 0,1010,2020,3030,4040,5050,6060,7070,8080,9090,100100,110. 110. 元素共元素共1212个,个,由小到大排列。由小到大排列。 则第一四分位为第三位和第四位的中位数,即:则第一四分位为第三位和第四位的中位数,即:Q1=Q1=(20+3020+30)/2=25/2=25;同理,第三四分位为第九位和第十位的中位数,即:同理,第三四分位为第九位和第十位的中位数,即:Q3=Q3=(80+9080+90)/2=85/2=85。 四分位差四分位差Q=Q3-Q1=(85-25)=Q=Q3-Q1=(85-25)=6060 如果上面的数组表示如果上面的数组表示1212个学生的成绩,个学生的成绩,Q Q表示学生得分的分散情形,若表示学生得分的分散情形,若Q Q值越大,表示学生得分越参差不齐。值越大,表示学生得分越参差不齐。例例1:1: 1,2,3,4,5, 6,7,8,9,101,2,3,4,5, 6,7,8,9,10 10 10个数从中间切开个数从中间切开, ,右边中央数右边中央数8=Q3,8=Q3,左边中间左边中间数数3=Q1 3=Q1 例例2:2: 1,2,3,4,5,6 ,7,8,9,10,111,2,3,4,5,6 ,7,8,9,10,11 1111个数从中间个数从中间6 6切开切开, ,右边中间数右边中间数9=Q3,9=Q3,左边中左边中间数间数3=Q1 3=Q1 例例3:3: 1,2,3,4,5,6, 7,8,9,10,11,121,2,3,4,5,6, 7,8,9,10,11,12 12 12个数从中间个数从中间( (空白部份空白部份) )切开切开, ,右边中间两右边中间两数数9,109,10平均平均9.5=Q3,9.5=Q3,左边中间两数左边中间两数3,43,4平均平均3.5=Q1 3.5=Q1 例例4:4: 1,2,3,4,5,6, 7 ,8,9,10,11,12,131,2,3,4,5,6, 7 ,8,9,10,11,12,13 13 13个数从中间个数从中间7 7切开切开, ,右边中间两数右边中间两数10,1110,11平均平均10.5=Q3,10.5=Q3,左边中间两数左边中间两数3,43,4平均平均3.5=Q13.5=Q1 了解四分位差了解四分位差了解四分位差了解四分位差第二小节 全距、分位差和平均差 第四节第四节 变异指标变异指标三、平均差三、平均差三、平均差三、平均差 简单平均差简单平均差简单平均差简单平均差适用于未分组资料适用于未分组资料适用于未分组资料适用于未分组资料是各个数据与其算术平均数的离差绝对是各个数据与其算术平均数的离差绝对值的算术平均数,用值的算术平均数,用 表示。表示。计算公式:计算公式:计算公式:计算公式:总体算术总体算术平均数平均数总体单总体单位总数位总数第第 个单位个单位的变量值的变量值第二小节 全距、分位差和平均差 三、平均差三、平均差三、平均差三、平均差【例例A A】某售货小组某售货小组5 5个人,某天的销售额分别为个人,某天的销售额分别为440440元、元、480480元、元、520520元、元、600600元、元、750750元,求该售货小组销售额的平均差。元,求该售货小组销售额的平均差。解:解:解:解:即该售货小组即该售货小组即该售货小组即该售货小组5 5 5 5个人销售额的平均差为个人销售额的平均差为个人销售额的平均差为个人销售额的平均差为93.693.693.693.6元。元。元。元。第二小节 全距、分位差和平均差 三、平均差三、平均差三、平均差三、平均差 加权平均差加权平均差加权平均差加权平均差适用于分组资料适用于分组资料适用于分组资料适用于分组资料总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数第第 组的变量组的变量值或组中值值或组中值第二小节 全距、分位差和平均差 三、平均差三、平均差三、平均差三、平均差【例例例例B B】计算下表中某公司职工月工资的平均差。计算下表中某公司职工月工资的平均差。计算下表中某公司职工月工资的平均差。计算下表中某公司职工月工资的平均差。月工资月工资(元)(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上250350450550650750850950208314382456305237 78 20合计合计2 000第二小节 全距、分位差和平均差 三、平均差三、平均差三、平均差三、平均差解:解:解:解:即该公司职工月工资的平均差为即该公司职工月工资的平均差为即该公司职工月工资的平均差为即该公司职工月工资的平均差为138.95138.95138.95138.95元。元。元。元。第二小节 全距、分位差和平均差 三、平均差三、平均差q优点优点:不易受极端数值的影响,能综合反映不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;全部单位标志值的实际差异程度;q缺点缺点:用绝对值的形式消除各标志值与算术用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。和参与统计分析运算。平均差的特点平均差的特点第二小节 全距、分位差和平均差 第四节第四节 变异指标变异指标三、平均差三、平均差平均差系数平均差系数第三小节 标准差和标准差系数 简单标准差简单标准差适用于未分组资料适用于未分组资料适用于未分组资料适用于未分组资料是各个数据与其算术平均数的离差平方的是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用算术平均数的开平方根,用 来表示;标来表示;标准差的平方又叫作方差,用准差的平方又叫作方差,用 来表示。来表示。标准差标准差标准差标准差计算公式:计算公式:计算公式:计算公式:总体单总体单位总数位总数第第 个单位个单位的变量值的变量值总体算术总体算术平均数平均数第三小节 标准差和标准差系数第四节第四节 变异指标变异指标【例例例例A A】某售货小组某售货小组某售货小组某售货小组5 5个人,某天的销售额分别为个人,某天的销售额分别为个人,某天的销售额分别为个人,某天的销售额分别为440440元、元、元、元、480480元、元、元、元、520520元、元、元、元、600600元、元、元、元、750750元,求该售货小组销元,求该售货小组销元,求该售货小组销元,求该售货小组销售额的标准差。售额的标准差。售额的标准差。售额的标准差。解:解:解:解:第三小节 标准差和标准差系数标准差标准差标准差标准差 加权标准差加权标准差加权标准差加权标准差适用于分组资料适用于分组资料适用于分组资料适用于分组资料总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数第第 组的变量组的变量值或组中值值或组中值第三小节 标准差和标准差系数【例例例例B B】计算下表中某公司职工月工资的标准差。计算下表中某公司职工月工资的标准差。计算下表中某公司职工月工资的标准差。计算下表中某公司职工月工资的标准差。月工资(元)月工资(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上250350450550650750850950 208 314 382 456 305 237 78 20合计合计2 000第三小节 标准差和标准差系数解:解:解:解:即该公司职工月工资的标准差为即该公司职工月工资的标准差为即该公司职工月工资的标准差为即该公司职工月工资的标准差为167.9167.9元。元。元。元。第三小节 标准差和标准差系数标准差的特点标准差的特点q不易受极端数值的影响,能综合反映全部单不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;位标志值的实际差异程度;qq用平方的方法消除各标志值与算术平均数离用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统差的正负值问题,可方便地用于数学处理和统计分析运算计分析运算.第三小节 标准差和标准差系数简单标准差简单标准差简单标准差简单标准差加权标准差加权标准差加权标准差加权标准差标准差的简捷计算标准差的简捷计算标准差的简捷计算标准差的简捷计算避免离差平方和计算过程的出现避免离差平方和计算过程的出现避免离差平方和计算过程的出现避免离差平方和计算过程的出现目的目的目的目的: :变量值平方变量值平方的平均数的平均数变量值平均数变量值平均数的平方的平方可比可比变异系数指标变异系数指标身高的差异水平:身高的差异水平:cmcm体重的差异水平:体重的差异水平:kgkg用用变异系数变异系数可以相互比较可以相互比较可可比比第三小节 标准差和标准差系数标准差系数标准差系数用来对比不同水平的同类现象,特别是不同用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小类现象总体平均数代表性的大小标准差系数小的总体,其平均数的代表标准差系数小的总体,其平均数的代表性大;反之,亦然。性大;反之,亦然。应用应用应用应用: :第三小节 标准差和标准差系数【例例例例】某年级一、二两班某门课的平均成绩分别为某年级一、二两班某门课的平均成绩分别为某年级一、二两班某门课的平均成绩分别为某年级一、二两班某门课的平均成绩分别为8282分和分和分和分和7676分,其成绩的标准差分别为分,其成绩的标准差分别为分,其成绩的标准差分别为分,其成绩的标准差分别为15.615.6分和分和分和分和14.814.8分,比分,比分,比分,比较两班平均成绩代表性的大小。较两班平均成绩代表性的大小。较两班平均成绩代表性的大小。较两班平均成绩代表性的大小。解:解:解:解:二班成绩的标准差系数为:二班成绩的标准差系数为:二班成绩的标准差系数为:二班成绩的标准差系数为:因为因为因为因为 ,所以一班平均成绩的代表性比二班大。,所以一班平均成绩的代表性比二班大。,所以一班平均成绩的代表性比二班大。,所以一班平均成绩的代表性比二班大。概概 念念 计计 算算 特特 点点数列中最大值数列中最大值与最小值之差与最小值之差1极差极差 (R)R=最大值最大值-最小值最小值优点:容易理解,优点:容易理解, 计算方便计算方便缺点:不能反映全缺点:不能反映全部数据分布状况部数据分布状况2平均差平均差 (A.D)各标志值与各标志值与均值离差绝均值离差绝对值的算术对值的算术平均平均简单:简单:加权:加权:优点:反映全部优点:反映全部数据分布状况数据分布状况缺点:取绝对值缺点:取绝对值 ,数字上数字上 不尽合理不尽合理概概 念念 计计 算算 特特 点点各标志值与均各标志值与均值离差平方的值离差平方的平均。平均。方差的平方根方差的平方根(取正根)(取正根)3方差方差(2) 和和 标准差标准差()优优点点:反反映映全全部部数数据据分分布布状状况况,数字上合理。数字上合理。缺缺点点:受受计计量量单单位位和和平平均均水水平平影影响,不便于比较响,不便于比较4标准标准差系差系 数数 (V)标准差与均值标准差与均值之商,是无量之商,是无量纲的系数纲的系数简单:简单:加权:加权:优优点点:适适宜宜不不同同数据集的比较数据集的比较缺缺点点:对对数数据据结结构构变变化化反反应应不不灵灵敏敏本节小结:(1)平均指标描述的是总体的集中趋势,而标志变异指标描述的是总体的离散趋势。它们从两方面来反映总体的分布特征。其作用首先是衡量平均指标代表性大小的一种尺度,其次还可以反映社会经济活动过程的均衡性与协调性。 (2)全距、四分位差、平均差与标准差在反映标志变异程度方面各有优缺点。方差和标准差是应用最广的标志变异指标。标准差与标准差系数是反映标志差异程度的主要指标。它比前面介绍的其它指标都科学。标准差就是标志值与其算术平均数离差的平方的算术平均数的平方根。 第四节第四节 变异指标变异指标本节小结:(3)为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。标准差系数是标准差与其算术平均数之比,它既消除了变量数列水平的影响,是反映标志差异程度方面目前最科学的统计指标之一。 复习思考题1. 如何理解标志变异指标是衡量平均数代表性大小的尺度?2. 全距、平均差和标准差各有什么特点?3. 为什么说标准差是各种标志变异指标中最常用的指标?4. 什么是标准差系数,计算标准差系数有何意义?5. 标志变异指标与平均数有何关系?6. 在何种情况下,只需计算标准差而不必计算标志变异系数,就可以比较出不同资料的平均数代表性的大小,为什么? 7. 某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元。试计算全距。 复习思考题 8. 已知某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。9. 某车间有两个小组,每组都是6个工人,各人日产量件数如下:第一组:20,40,60,80,100,120第二组:67,68,69,71,72,73试计算其平均差。复习思考题 10. 某校统计学专业统计学成绩如下表,计算其平均差。成绩分组学生人数(人) f组中值(元) x60以下6070708080909010041224645565758595合计50-复习思考题 第四节第四节 变异指标变异指标11. 某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。计算下表中某公司职工月工资的标准差。月工资(元)组中值(元)X职工人数(人)f300以下25020830040035031440050045038250060055045660070065030570080075023780090085078900以上95020复习思考题 12. 甲、乙两单位人数及月工资资料如下:月工资(元)甲单位人数(人)乙单位人数比重()400以下40060060080060010001000以上425841262828304218合 计267100根据上表资料:(1)比较甲乙两单位哪个单位工资水平高;(2)说明哪个单位工资更具有代表性。复习思考题 13. 根据平均数和标准差的关系。,则标准差为多少?,则标准差系数为多少?,则平均数为多少?,则平均数为多少?1. 设2. 设3. 设4. 设
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号