资源预览内容
第1页 / 共56页
第2页 / 共56页
第3页 / 共56页
第4页 / 共56页
第5页 / 共56页
第6页 / 共56页
第7页 / 共56页
第8页 / 共56页
第9页 / 共56页
第10页 / 共56页
亲,该文档总共56页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
用用SPSS作作统统计计量量描描述述统计量统计量描描述述引例引例3食品加工厂新上一条可以自动装填袋装食品的生产线。每袋食品的规格重食品加工厂新上一条可以自动装填袋装食品的生产线。每袋食品的规格重量是量是50克,过于偏离这个标准,会产生不合格品。为检验生产线的运转状况,克,过于偏离这个标准,会产生不合格品。为检验生产线的运转状况,质检人员随机从生产线上抽取了质检人员随机从生产线上抽取了100袋食品,测得重量数据如下表所示:袋食品,测得重量数据如下表所示: 100 100袋食品的重量(克)袋食品的重量(克)464648484747404047474545464644444444444453535151555554545353515150505353494952525555525249495353595951516060555553534848535357575656545457575555565649495353515152525050575754544949525252525252494952525454616152525353575753535151535357574949474750505757484849494747525251514646494948484141585849494848585857574646595945454747474748486060535348485656434347474646474747474848434345454747424245455050464660.060.057.557.555.055.052.552.550.050.047.547.545.045.042.542.540.040.0303010100 02020食品重量食品重量100100袋食品重量频数分布袋食品重量频数分布频频数数1.离散状态离散状态2.集中趋势集中趋势3.偏斜状态偏斜状态4.陡峭状态陡峭状态集中趋势描述性统计量集中趋势描述性统计量离散程度描述性统计量离散程度描述性统计量分布形态描述性统计量分布形态描述性统计量均值均值中位数中位数众数众数均值、中位数、众数的比较均值、中位数、众数的比较 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646 将数据中全体观测值求和将数据中全体观测值求和再除以观测值的个数即可得到再除以观测值的个数即可得到该数据的均值,记作该数据的均值,记作 。小时数小时数灯泡数灯泡数f组中值组中值x43-48245.548-53150.553-58255.258-632160.563-682865.568-732870.573-783375.578-832680.583-882185.588-931990.593-981095.598-1036100.5103-1082105.5108-1130110.5113-1181115.5二百只灯泡使用寿命二百只灯泡使用寿命均值的性质均值的性质1.所有观测值与其均值的离差之和等于所有观测值与其均值的离差之和等于0。2.所有观测值与其均值的离差平方和最小。所有观测值与其均值的离差平方和最小。+-性质性质1性质性质2 将全体观测值按照从小到将全体观测值按照从小到大的顺序排成一列,处于中间大的顺序排成一列,处于中间位置上的观测值即是该数据的位置上的观测值即是该数据的中位数,记作中位数,记作 。 9 9个家庭人均月收入原始数据(元)个家庭人均月收入原始数据(元)1550155076076080080011801180880880980980210021001260126016401640 9 9个家庭人均月收入排序(元)个家庭人均月收入排序(元)7607608008008808809809801180118012601260155015501640164021002100中位数中位数位位置置 10 10名球名球员身高排序(厘米)身高排序(厘米)170170172172175175178178178178180180183183185185188188188188 10 10名球名球员身高排序(厘米)身高排序(厘米)175172172170178178185188183183178180188188观测值个数个数为偶数偶数时中位数的确定中位数的确定 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646 300 300个采个采样点空气点空气质量量评价数据价数据空气空气质量等量等级采采样点点个个 数数向上累向上累积向下累向下累积累累积频数数累累积频率(率(% %)累累积频数数累累积频率(率(% %)优1931931931936464300300100100良良676726026087871071073636轻度度污染染2828288288969640401313中度中度污染染7 7295295989812124 4重度重度污染染5 53003001001005 51 1合合计300300- - - - -由由单项式式频数分布表确定中位数数分布表确定中位数二百只灯泡使用寿命二百只灯泡使用寿命小时数小时数灯泡数灯泡数f累积累积43-482248-531353-582558-63212663-68285468-73288273-783311578-832614183-882116288-931918193-981019198-1036197103-1082199108-1130199113-1181200 260 260名名毕业生就生就业意向意向频数分布表数分布表就就业意向意向频数(人)数(人)频率(率(% %)会会计金融金融管理管理营销其它其它7676545433336868292929.229.220.820.812.712.726.226.211.211.2合合计26026010010080806060404020200 0会计会计 金融金融 管理管理 营销营销 其它其它频频数数1010202030300 0频频率率% % 众数是出现众数是出现次数最多的观测次数最多的观测值,记作值,记作 。 300 300个采个采样点空气点空气质量量评价数据价数据空气空气质量等量等级采采样点个数点个数优良良轻度度污染染中度中度污染染重度重度污染染193193676728287 75 5合合计300300重度重度中度中度轻度轻度良良优优3003002002001001000 0 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646二百只灯泡使用寿命二百只灯泡使用寿命小时数小时数灯泡数灯泡数f43-48248-53153-58258-632163-682868-732873-783378-832683-882188-931993-981098-1036103-1082108-1130113-1181众数是观测值的众数是观测值的重点重点中位数是观测值的中位数是观测值的中心中心均值是观测值的均值是观测值的重心重心左偏左偏右偏右偏对称对称三者的近似关系三者的近似关系 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646303010100 02020食品重量食品重量频频数数左偏左偏100100袋食品重量的均值、中位数与众数袋食品重量的均值、中位数与众数二百只灯泡使用寿命二百只灯泡使用寿命的均值、中位数与众数的均值、中位数与众数右偏右偏使用寿命使用寿命不同类型变量适用的集中趋势描述性统计量不同类型变量适用的集中趋势描述性统计量变量类型变量类型定类型定类型定序型定序型数值型数值型集中趋势描集中趋势描述性统计量述性统计量众数众数-中位数中位数众数众数-均值均值中位数中位数众数众数为该类变量最适用的集中趋势描述性统计量为该类变量最适用的集中趋势描述性统计量统计描述的收益与损失统计描述的收益与损失27.023.941.633.140.618.812.728.913.214.527.034.828.93.250.16028.815.07.25.116.713.719.111.115.610.05.61.533.98.3直直方方图图原始数据原始数据均值均值=19.2 数据被图示或计算出统计量时,其总体水平和结数据被图示或计算出统计量时,其总体水平和结构状况显示出来了。但数据中的某些细节却丢失了。构状况显示出来了。但数据中的某些细节却丢失了。102030405060501015Mo=可口可乐可口可乐甲商店甲商店乙商店乙商店Mo=可口可乐可口可乐 两商店软饮料购买频数两商店软饮料购买频数的众数都是可口可乐,但数的众数都是可口可乐,但数据的离散程度不同。据的离散程度不同。01020可可口口可可乐乐雪雪碧碧杏杏仁仁露露新新 骑骑士士 醒醒目目01020可可口口可可乐乐雪雪碧碧杏杏仁仁露露新新 骑骑士士 醒醒目目Me=一般一般甲城市甲城市乙城市乙城市非非常常不不满满意意一一般般满满意意非非常常满满意意Me=一般一般非非常常不不满满意意一一般般满满意意非非常常满满意意 两城市对住房条件评价的中位数两城市对住房条件评价的中位数都是一般,但数据的离散程度不同。都是一般,但数据的离散程度不同。不不满满意意不不满满意意两组数据趋于集中的位置完全相同,但离散程度不同。两组数据趋于集中的位置完全相同,但离散程度不同。极差极差四分位差四分位差平均差平均差方差与标准差方差与标准差离散系数离散系数 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646数据中最大观测值与最小观测数据中最大观测值与最小观测值之差称为极差,记作值之差称为极差,记作 。极差给出了全体观测值的变极差给出了全体观测值的变动范围。一般情况下,极差动范围。一般情况下,极差越大,离散程度越大。但其越大,离散程度越大。但其值易受极端值影响。值易受极端值影响。100袋食品重量的最小观测值为袋食品重量的最小观测值为40克,最大克,最大观测值为观测值为61克。克。25%分位数分位数50%分位数分位数75%分位数分位数最大观测值最大观测值最小观测值最小观测值中位数中位数上四分位数上四分位数下四分位数下四分位数50%的观测值小于中位数的观测值小于中位数50%的观测值位于上下四分位数之间的观测值位于上下四分位数之间50%的观测值大于中位数的观测值大于中位数数据中的上四分位数与下四分位数之差称为四分位差,记作数据中的上四分位数与下四分位数之差称为四分位差,记作。 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646100袋食品重量的下四分位数为袋食品重量的下四分位数为47克,上四分位数为克,上四分位数为54克,因此该数据的四分位差克,因此该数据的四分位差=54克克-47克克=7克。克。四分位差给出了全体四分位差给出了全体观测值中处于中间位观测值中处于中间位置的置的50%观测值的变观测值的变动范围,一般情况下,动范围,一般情况下,四分差越大表明中间四分差越大表明中间50%观测值的离散程观测值的离散程度越大,从而间接地度越大,从而间接地反映出数据整体的离反映出数据整体的离散程度也就越大。散程度也就越大。二百只灯泡使用寿命二百只灯泡使用寿命小时数小时数灯泡数灯泡数f累积累积43-482248-531353-582558-63212663-68285468-73288273-783311578-832614183-882116288-931918193-981019198-1036197103-1082199108-1130199113-1181200Me=75.5QU=85QL=67中间中间50% 灯泡的寿灯泡的寿命在命在67-85小时之间小时之间18四分位差与盒形图四分位差与盒形图中间中间50% 的观的观测值集中于盒子测值集中于盒子之内。盒子越窄,之内。盒子越窄,表明集中程度越表明集中程度越高,即离散程度高,即离散程度越低。越低。QU=85QL=67二百只灯泡使用寿命二百只灯泡使用寿命小时数小时数灯泡数灯泡数f累积累积43-482248-531353-582558-63212663-68285468-73288273-783311578-832614183-882116288-931918193-981019198-1036197103-1082199108-1130199113-1181200极差及四分位极差及四分位差均相等,但差均相等,但离散程度不同。离散程度不同。平均差50名工人日产零件数平均差计算表名工人日产零件数平均差计算表按零件分组按零件分组组中值组中值x频数频数f105-110110-115115-120120-125125-130130-135135-140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合合计计-50-312所有观测值与其均值离所有观测值与其均值离差的绝对值的均值。差的绝对值的均值。方差公式方差公式自由度是指样本数据中可以自由取值自由度是指样本数据中可以自由取值的个数。譬如:的个数。譬如:样本容量为样本容量为n,均值确定后,观测数,均值确定后,观测数据中只有据中只有n-1个可以自由取值,其中个可以自由取值,其中必有一个不能自由取值,因此自由度必有一个不能自由取值,因此自由度为样本容量减为样本容量减1。均方差公式均方差公式方差的含义不易理解,它的计量单位方差的含义不易理解,它的计量单位是观测值计量单位的平方。标准差的是观测值计量单位的平方。标准差的计量单位与观测值计量单位是一致的。计量单位与观测值计量单位是一致的。 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646按零件分组按零件分组组中值组中值x频数频数f105-110110-115115-120120-125125-130130-135135-140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合合计计-50-3100.550名工人日产零件数方差计算表名工人日产零件数方差计算表计算样本方差或样本标准差,有时是出于估计总体方差或总体标准差的计算样本方差或样本标准差,有时是出于估计总体方差或总体标准差的目的,总体方差是用以描述总体数据离散程度的参数。其计算公式为:目的,总体方差是用以描述总体数据离散程度的参数。其计算公式为: 总体标准差是总体方差的平方根。其计算公式为:总体标准差是总体方差的平方根。其计算公式为:S=3.00S=2.71S=0.82S=0.00理解标准差理解标准差在均值上加减标准差在均值上加减标准差34.4-2s=20.634.434.4-=27.534.4+2s=48.227名学生每名学生每30秒心跳次数秒心跳次数均值均值=34.4标准差标准差=6.9观测值的大小大致不超过观测值的大小大致不超过均值加减均值加减4个标准差的范个标准差的范围。围。本例中均值加减本例中均值加减2个标准个标准差就几乎包含了所有的观差就几乎包含了所有的观测值。测值。34.4+s=41.3学学生生数数86422124273033363942454851心跳数心跳数标准得分(标准得分(standard score)100对新娘和新郎,新娘的平均年龄为对新娘和新郎,新娘的平均年龄为30.0岁,标准差为岁,标准差为9.0岁;新郎岁;新郎的平均年龄为的平均年龄为32.4岁,标准差为岁,标准差为10.0岁。其中年龄最小的新娘为岁。其中年龄最小的新娘为19岁,岁,年龄最小的新郎为年龄最小的新郎为19岁。问:作为新娘和新郎,俩人哪个更年轻?岁。问:作为新娘和新郎,俩人哪个更年轻?标准得分含义的图示标准得分含义的图示xi (年龄)(年龄)1221303948Zi (标准得分)(标准得分)-2.00-1.0001.002.00切贝谢夫(切贝谢夫( Tchebysheff)定理)定理在任意一个数据集中,至少有(在任意一个数据集中,至少有(1-1/z2 )的数据项与平均数的距离在)的数据项与平均数的距离在 z 个标准差之内,其中个标准差之内,其中z是任意大于是任意大于1 的值。的值。(0.75)75% z=2(0.89)89% z=3(0.94)94% z=468%95%约100%如果数据近于钟形分布,则有:约如果数据近于钟形分布,则有:约68%的数据项与均值的距离的数据项与均值的距离在在1个标准差之内;个标准差之内;95%的数据项与均值的距离在的数据项与均值的距离在2个标准差个标准差之内;几乎所有的数据项与均值的距离在之内;几乎所有的数据项与均值的距离在3个标准差之内。个标准差之内。企业编号企业编号产品销售额产品销售额销售利润销售利润1234567817022039043048065095010008.112.518.022.026.540.064.069.08个企业产品销售数据个企业产品销售数据离散系数离散系数偏度偏度峰度峰度频数分布的偏态频数分布的偏态对称对称左偏左偏右偏右偏偏度计算公式偏度计算公式30正偏(右偏);正偏(右偏); 30 负偏(左偏);负偏(左偏);3=0对称对称 ;3 越大,偏态程度越大。越大,偏态程度越大。 100 100袋食品重量样本数据中,均值为袋食品重量样本数据中,均值为50.6750.67克,标准值为克,标准值为4.614.61克,依公式计算克,依公式计算100100袋食品重量的偏度:袋食品重量的偏度: 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646频数分布的峰态频数分布的峰态尖顶峰尖顶峰正态峰正态峰平顶峰平顶峰峰度计算公式峰度计算公式40 尖顶峰;尖顶峰;4 =0 正态峰正态峰 ; 40 平顶峰。平顶峰。100100袋食品重量样本袋食品重量样本数据中,均值为数据中,均值为50.6750.67克,标准值为克,标准值为4.614.61克,依公式计克,依公式计算算100100袋食品重量的袋食品重量的偏度:偏度: 100 100袋食品的重量(克)袋食品的重量(克)4646484847474040474745454646444444444444535351515555545453535151505053534949525255555252494953535959515160605555535348485353575756565454575755555656494953535151525250505757545449495252525252524949525254546161525253535757535351515353575749494747505057574848494947475252515146464949484841415858494948485858575746465959454547474747484860605353484856564343474746464747474748484343454547474242454550504646结束结束
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号