资源预览内容
第1页 / 共77页
第2页 / 共77页
第3页 / 共77页
第4页 / 共77页
第5页 / 共77页
第6页 / 共77页
第7页 / 共77页
第8页 / 共77页
第9页 / 共77页
第10页 / 共77页
亲,该文档总共77页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第2章 单变量描述统计分析 第1节 统计分组 单项式分组 组距式分组 统计分组 按数量标志分组 等距 不等距 重合 不重合 按品质标志分组 1 一 分布 distribution 变量各种可能取值及其出现的次数或频 次 又称频次分布 频数 频次 次数 frequency 2 二 统计表 表2 5 家庭结构的频次分布 家庭结构频次百分比 核心家庭105049 30 直系家庭72033 80 联合家庭1105 16 其他25011 74 总数2130100 00 3 多选项二分法 abcde 样本1 样本2 样本3 样本4 样本5 4 多选项二分法 abcde 样本111101 样本200111 样本310011 样本411001 样本511001 合计43225 5 多选项分类法 P26 例2 P27 例3 6 3 加权平均法 P28 例4 7 二 定序变量 表2 7 单位对武打片的反映统计 喜爱程度频次百分比 很反感37 69 不爱看1025 64 一般1025 64 爱看923 08 非常爱看717 95 总数39100 00 8 三 定距变量 统计分组的步骤 等距 重合 组距式分组 第一 确定组数 经验公式 k 1 lgn lg2 k 1 lg100 lg2 7 64 第二 确定组距 组距 最大值 最小值 组数 1 56 1 27 10 0 029 原则 以5或10的倍数作为组距 本例选择 0 03 第三 确定组限 要求 第一组下限要小于所有数据的最小值 最后一组上限要 大于所有数据的最大值 原则 以5或10的倍数作为组限 9 三 定距变量 统计分组的步骤 等距 重合 组距式分组 第四 计数 以0 03作为组距的分组情况 1 265 1 295 1 295 1 325 1 255 1 285 1 285 1 315 1 245 1 275 1 275 1 305 10 三 定距变量 身高组中 值 人数频率 向上累计向下累计 人数频率人数频率 1 265 1 2951 281111100100 1 295 1 3251 3144559999 1 325 1 3551 347712129595 1 355 1 3851 37222234348888 1 385 1 4151 40242458586666 1 415 1 4451 43242482824242 1 445 1 4751 46101092921818 1 475 1 5051 4966989888 1 505 1 5351 5211999922 1 535 1 5651 551110010011 合计 100100 表2 11 100名儿童身高统计分组表 11 向上累计 由低到高 上限以下 向下累计 由高到低 下限以上 思考 360体 您本次开机共用时1分10秒 击败了全国12 的电脑 12 关于统计分组的个人认识 原则 统计分组没有对错 只有好坏 开口组实际中应用更广 极端值 extreme value 判断依据 发生概率非常小 后果很严重 911事件 2004印度洋海啸 飞机失事 英法核潜艇相撞 美 俄卫星相撞 股灾 亚洲金融危机13 图2 1 家庭结构分布图 饼图 Pie 14 条形图 bar 按年龄和分人口数 2012年 0 83 人口抽样调查 15 100名儿童身高向上累计直方图 16 100名儿童身高向下累计直方图 17 父亲身高 800名 18 母亲身高 800名 19 父亲体重 800名 20 母亲体重 800名 21 分年龄别的死亡率 22 三次产业构成比 23 24 数据描述的数值方法 数据描述的数值方法 分布的形状集中趋势离散程度 众 数 中位数 均 值 离散系数 方差和标准差 峰 度 四分位距 极差 偏 态 第2节第3节 25 一 众数 Mode 概念 出现次数最多的标志值 计算 一 定类数据 表2 5 P24 第二节 集中趋势的测量 26 表2 5 家庭结构的频次分布 家庭结构频次百分比 核心家庭105049 30 直系家庭72033 80 联合家庭1105 16 其他25011 74 总数2130100 00 Mo 核心家庭 27 二 定序 表2 7 P29 表2 7 单位对武打片的反映统计 喜爱程度频次百分比 很反感37 69 不爱看1025 64 一般1025 64 爱看923 08 非常爱看717 95 总数39100 00 Mo 不爱看 Mo 一般 28 三 定距 1 未分组资料 表2 10 2 单项式 表2 14 3 组距式 表2 11 Mo 1 38 1 39 1 40 1 41 1 42 1 43 1 44 Mo 1 2 Mo 1 40 1 43 29 二 中位数Median 一 定序 表2 7 找中位数组 向上累计次数首次超过N 2的 组即为中位数组 该组的标志值即为中位数值 Me 一般 30 二 定距 1 未分组资料 表2 10 方法 中位数位置 N 1 2 31 概念解释 次序统计量 order statistics x1x2x3x4x5 9 229 659 209 259 30 9 209 229 259 309 65 32 表2 10 33 2 分组资料 1 单项式分组 表2 18 向上累计次数首次超过N 2的组即为中位数 组 该组的标志值即为中位数 Me 乙 34 三 组距式分组 首先确定中位数组 使用公式 下限公式 上限公式 35 公式中各字母含义 U 中位数组的上限 L 中位数组的下限 fm 中位数组的频数 Sm 1 向上累计时中位数组前一组的累计频数 即中位数前一组所对应的向上累计频数 Sm 1 向下累计时中位数组后一组的累计频数 即中位数后一组所对应的向下累计频数 i 中位数组的组距 36 f 2 x 向上 累计 Sm 1 Sm LU Me A b 中位数组 前一组 中位数组 B C a E D 下限公式Me L a 上限公式Me U b 下限公式推导 37 身高组中 值 人数频率 向上累计 人数频率 1 265 1 2951 281111 1 295 1 3251 314455 1 325 1 3551 34771212 1 355 1 3851 3722223434 1 385 1 4151 4024245858 1 415 1 4451 4324248282 1 445 1 4751 4610109292 1 475 1 5051 49669898 1 505 1 5351 52119999 1 535 1 5651 5511100100 合计 100100 表2 11 100名儿童身高统计分组表 f 中位 数组 次数 中位 数组 上限 首次大于 50 首次大于 50 中位数组 前一组所 对应向上 累计次数 中位 数组 中位 数组 下限 38 L 1 385 U 1 415 fm 24 Sm 1 34 i 0 03 39 西 藏 辽宁 天津 上海 图1 我国分地区人口年龄中位数 2000年 北京 河南 40 三 四分位数 quartile 概念 数据排序后处在25 50 和75 位置 上的数 25 25 25 25 Q1Q2Q3 Q2 Me 41 一 定序 表2 7 找Q1 Q2 Q3所在组 Q1所在组 向上累计次数首次超过 f 4的组 Q2所在组 向上累计次数首次超过 f 2的组 Q3所在组 向上累计次数首次超过3 f 4的组 Q1 Q1所在组标志值 Q2 Q2所在组标志值 Q 3 Q3所在组标志值 42 喜爱程度频次百分比 向上累 计 很反感37 69 3 不爱看1025 64 13 一般1025 64 23 爱看923 08 32 非常爱看717 95 39 总数39100 00 19 5 9 75 Q1所在 组 Q1 不爱看 Q2所在 组 Q2 一般 29 25 Q3所在 组 Q3 爱爱看 43 二 定距数据 1 未分组资料 spss版本 Q1位置 n 1 4 Q2位置 n 1 2 Q3位置 3 n 1 4 表2 10 Q1位置 n 1 4 25 25 Q2位置 n 1 2 50 5 Q3位置 3 n 1 4 75 75 Q1 x 25 0 25 x 26 x 25 1 37 0 25 1 37 1 37 1 37 Q2 x 50 0 5 x 51 x 50 1 4 0 5 1 41 1 4 1 405 Q3 x 75 0 75 x 76 x 75 1 44 0 75 1 44 1 44 1 44 44 二 定距数据 1 未分组资料 excel版本 Q1位置 n 3 4 Q2位置 n 1 2 Q3位置 3n 1 4 表2 10 Q1位置 n 3 4 25 75 Q2位置 n 1 2 50 5 Q3位置 3n 1 4 75 25 Q1 x 25 0 75 x 26 x 25 1 37 0 75 1 37 1 37 1 37 Q2 x 50 0 5 x 51 x 50 1 4 0 5 1 41 1 4 1 405 Q3 x 75 0 25 x 76 x 75 1 44 0 25 1 44 1 44 1 44 45 Excel 操作 quartile 46 2 分组资料 1 单项式分组 找Q1 Q2 Q3所在组 Q1所在组 向上累计次数首次超过 f 4的组 Q2所在组 向上累计次数首次超过 f 2的组 Q3所在组 向上累计次数首次超过3 f 4的组 Q1 Q1所在组标志值 Q2 Q2所在组标志值 Q 3 Q3所在组标志值 47 2 组距式分组 使用公式 找Q1 Q2 Q3所在组 Q1所在组 向上累计次数首次超过 f 4的组 Q2所在组 向上累计次数首次超过 f 2的组 Q3所在组 向上累计次数首次超过3 f 4的组 48 49 50 身高组中 值 人数频率 向上累计 人数频率 1 265 1 2951 281111 1 295 1 3251 314455 1 325 1 3551 34771212 1 355 1 3851 3722223434 1 385 1 4151 4024245858 1 415 1 4451 4324248282 1 445 1 4751 4610109292 1 475 1 5051 49669898 1 505 1 5351 52119999 1 535 1 5651 5511100100 合计 100100 表2 11 100名儿童身高统计分组表 f 首次大于 50 首次大于 25 Q3所在组 首次大于 75 Q1所在组 Q2所在组 L1 1 355 U1 1 385 51 身高人数向上累计 人数频率 1 265 1 295111 1 295 1 325455 1 325 1 35571212 1 355 1 385223434 1 385 1 415245858 1 415 1 445248282 1 445 1 475109292 1 475 1 50569898 1 505 1 53519999 1 535 1 5651100100 合计100 表2 11 100名儿童身高统计分组表 L1 1 355 U1 1 385 Sm1 1 12 f1 22 L2 1 385 U2 1 415 Sm2 1 34 f2 24 L3 1 415 U3 1 445 Sm3 1 58 f3 24 52 53 三 均值 一 未分组资料 简单算术平均数 二 分组资料 加权算术平均数 54 三 均值 一 未分组资料 简单算术平均数 二 分组资料 加权算术平均数 55 例 2 10 Excel 内置函数 average 56 例 2 11 Excel 内置函数 sumproduct sum 57 众数 中位数和算术平均数的关系 对称分布 均值 中位数 众数 分配为钟形 轻微不对称的经验公式 左偏分布 均值 中位数 众数 右偏分布 众数 中位数均值 58 第三节 离散趋势测量法 数据集中趋势的测度指标确实能反映某种事物的一般水平 在比较不同空间和时间上的情况是能消除规
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号