资源预览内容
第1页 / 共80页
第2页 / 共80页
第3页 / 共80页
第4页 / 共80页
第5页 / 共80页
第6页 / 共80页
第7页 / 共80页
第8页 / 共80页
第9页 / 共80页
第10页 / 共80页
亲,该文档总共80页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Page 1SAQM 上海质量管理科学研究院(SAQM) 版权所有 第 三 部分常用数据分析方法第 三 部分常用数据分析方法 Page 2SAQM 上海质量管理科学研究院(SAQM) 版权所有 3.1 什么是统计学 3.2 统计学的分类 3.3 统计数据的类型 3.4 统计中的一些基本概念 3.5 描述性分析 3.6 图形化分析 学习目标学习目标 Page 3SAQM 上海质量管理科学研究院(SAQM) 版权所有 3.1 什么是统计学什么是统计学? (statistics) 统计学统计学 是一种收集、处理、分析、解释数据并从数据 中得出结论的科学。 1. 收集数据:取得数据 2. 处理数据:图表展示 3.分析数据:利用统计方法分 析数据 利用统计方法分 析数据 4.解释数据:结果的说明 5.得到结论:从数据分析中得 出客观结论 Page 4SAQM 上海质量管理科学研究院(SAQM) 版权所有 统计研究的过程统计研究的过程 收集数据收集数据 (取得数据取得数据) 解释数据解释数据 (结果说明结果说明) 分析数据分析数据 (研究数据研究数据) 实际问题 处理数据处理数据 (整理数据整理数据) Page 5SAQM 上海质量管理科学研究院(SAQM) 版权所有 统计规律统计规律 正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2; 投掷一枚骰子出现16点的频率各为1/6 农作物的产量与施肥量之间存在相关关系 Page 6SAQM 上海质量管理科学研究院(SAQM) 版权所有 统计方法 描述统计推断统计 参数估计假设检验 3.2 统计学的分类统计学的分类 利用统计方法分析数据利用统计方法分析数据 本页已使用福昕阅读器进行编辑。 福昕软件( C ) 2 0 0 5 - 2 0 0 9 ,版权所有, 仅供试用。 Page 7SAQM 上海质量管理科学研究院(SAQM) 版权所有 3.2.1描述统计描述统计(descriptive statistics) 1.研究数据收集、整理和描述 的统计学分支 2.内容 收集数据 整理数据 展示数据 描述性分析 3.目的 描述数据特征 找出数据的基本规律 Page 8SAQM 上海质量管理科学研究院(SAQM) 版权所有 1.研究如何利用样本数据来 推断总体特征的统计学分 支 2.内容 参数估计 假设检验 3.目的 对总体特征作出推断 3.2.2推断统计推断统计(inferential statistics) Page 9SAQM 上海质量管理科学研究院(SAQM) 版权所有 3.3 统计数据的类型统计数据的类型 3.3.1什么是统计数据?什么是统计数据?(data) 1.对现象进行计量的结果 2.不是指单个的数字,而是由多个数据构成的数据集 3.不仅仅是指数字,它可以是数字的,也可以是文字的 Page 10SAQM 上海质量管理科学研究院(SAQM) 版权所有 统计数据的分类统计数据的分类统计数据的分类统计数据的分类 按计量尺度按计量尺度 分 类 的 数 据 顺 序 的 数 据 数 值 型 数 据 按时间状况按时间状况 截 面 的 数 据 时 序 的 数 据 按收集方法 观 察 的 数 据 试 验 的 数 据 3.3.2 统计数据分类统计数据分类 Page 11SAQM 上海质量管理科学研究院(SAQM) 版权所有 统计数据的分类统计数据的分类 (按计量尺度分按计量尺度分) 1.分类数据分类数据(categorical data) 只能归于某一类别的非数字型数据 对事物进行分类的结果,数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类 ;企业按属性分类。 2.顺序数据顺序数据(rank data) 只能归于某一有序类别的非数字型数据 虽然也是类别,但这些数据是有序的。数据表现为类别, 用文字来表述 例如,产品分为一等品、二等品、三等品、次品等 ;成绩 分为优、良、中、差。 3.数值型数据数值型数据(metric data) 按数字尺度测量的观察值 结果表现为具体的数值,对事物的精确测度 例如:身高为175cm、168cm、183cm Page 12SAQM 上海质量管理科学研究院(SAQM) 版权所有 统计数据的分类统计数据的分类(按收集方法分按收集方法分) 1.观测的数据观测的数据(observational data) 通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据 2.试验的数据试验的数据(experimental data) 在试验中控制试验对象而收集到的数据 比如,对一种新药疗效的试验,对一种新的农作物 品种的试验等 自然科学领域的数据大多数都为试验数据 Page 13SAQM 上海质量管理科学研究院(SAQM) 版权所有 可以分为可以分为计数型数据、计量型数据计数型数据、计量型数据 计量型数据计量型数据可以取给定范围内的任何一个可能的数值, 又称之为连续型数据。计量型数据是可以连续取值的数 据,属于连续型变量。 比如:各种计量工具测量的数据:长度、重量、时间、 温度等。 统计数据的分类统计数据的分类(按连续性分按连续性分) Page 14SAQM 上海质量管理科学研究院(SAQM) 版权所有 计数型数据计数型数据只能取一组特定的数值,而不能取这些数 值之间的数值,又称之为离散型数据。计数型数据是只 能按0,1,2,数列取值计数的数据(非负整数), 属于离散型变量。它一般由计数(数数)得到。 计数值可进一步区分为计件值和计点值。 对产品进行按件检查时所产生的属性(如统计合格 与不合格的产品件数)数据称为计件值。 每件产品中质量缺陷的个数称为计点值。如棉布上 的疵点数、铸件上的砂眼数等。 比如:产品的缺陷率、缺陷的次数、气孔的个数、客户 投诉次数。 统计数据的分类统计数据的分类(按连续性分按连续性分) Page 15SAQM 上海质量管理科学研究院(SAQM) 版权所有 3.4.1总体和样本总体和样本 1.总体总体(population) 所研究的全部个体(数据) 的集合,其中的每一个元 素也称为个体 分为有限总体和无限总体 有限总体的范围能够明确确定,且元素的数目是 有限的 无限总体所包括的元素是无限的,不可数的 2.样本样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量或样本量样本量 (sample size) 3.4 统计中的一些基本概念统计中的一些基本概念 Page 16SAQM 上海质量管理科学研究院(SAQM) 版权所有 样本是总体的代表与反映。但在抽取样本之后,我们并 不立即利用样本进行推断,而需对样本进行一番“加工”和“ 提炼”对样本资料的数量特征及其分布规律进行描述对样本资料的数量特征及其分布规律进行描述。 常用的统计量有:众数众数、中位数中位数、算术平均数算术平均数、极差极差、 四分位差四分位差、标准差标准差、方差方差等。 离散型随机变量常见的概率分布:二项分布二项分布、泊松分布泊松分布 等等。 连续型随机变量最常见的是正态分布正态分布,正态分布是概率 统计中最重要的分布。 Page 17SAQM 上海质量管理科学研究院(SAQM) 版权所有 某食品厂用自动装罐机生产净重为某食品厂用自动装罐机生产净重为345克的午餐肉罐头。由于生产 中众多因素的干扰,每只罐头净重都有差别,现从生产线上随机抽 克的午餐肉罐头。由于生产 中众多因素的干扰,每只罐头净重都有差别,现从生产线上随机抽 10个罐头,称其净重,得:个罐头,称其净重,得: 344 336 345 342 340 338 344 348 344 346 总体总体:生产线上罐头净重;:生产线上罐头净重; 样本样本:以上:以上10个罐头就是容量为个罐头就是容量为10的一个样本。的一个样本。 某型号的某型号的20辆汽车纪录了各自每加仑汽油行驶的里程数(单位: 千米)如下: 辆汽车纪录了各自每加仑汽油行驶的里程数(单位: 千米)如下: 29.8 27.6 28.3 28.7 27.9 30.1 29.9 28.0 28.7 27.9 28.5 29.5 27.2 26.9 28.4 27.9 28.0 30.0 29.6 29.1 总体:总体:该型号汽车每加仑汽油行驶里程;该型号汽车每加仑汽油行驶里程; 样本:样本:以上以上20辆汽车的每加仑汽油行驶里程,它的样本量是辆汽车的每加仑汽油行驶里程,它的样本量是20。 案例案例 Page 18SAQM 上海质量管理科学研究院(SAQM) 版权所有 1.参数参数(parameter) 描述总体特征的概括性数字度量,是研究者想要 了解的总体的某种特征值 所关心的参数主要有总体均值()、标准差()、 总体比例(p)等 总体参数通常用希腊字母表示 2.统计量统计量(statistic) 用来描述样本特征的概括性数字度量,它是根据 样本数据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值(x)、样本标准 差(s)、样本比例(p)等 样本统计量通常用小写英文字母来表示 3.4.2 参数和统计量参数和统计量 Page 19SAQM 上海质量管理科学研究院(SAQM) 版权所有 平均数 标准差 比例 平均数 标准差 比例 参数参数 p 统计量统计量 x s 总体总体 样本样本 p Page 20SAQM 上海质量管理科学研究院(SAQM) 版权所有 1.说明现象某种特征的概念,其特点是从一次观察到下一次 观察结果会呈现出差别或变化 如商品销售额、受教育程度、产品的质量等级等 变量的具体取值称为变量值,即数据 统计数据就是统计变量的某些取值 2.变量可以分为 分类变量(categorical variable) :说明事物类别的 名称,其取值是分类数据 顺序变量(rank variable):说明事物有序类别的名称 数值型变量(metric variable) :说明事物数字特征的 名称 离散变量:取有限个值(计数型数据) 连续变量:可以取无穷多个值(计量型数据) 3.4.3 变量变量(variable) Page 21SAQM 上海质量管理科学研究院(SAQM) 版权所有 变量及其类型变量及其类型 变量变量 基本分类基本分类其他分类其他分类 分类变量分类变量顺序变量顺序变量数字变量数字变量 随机变量 非随机变量 随机变量 非随机变量 经验变量 理论变量 经验变量 理论变量 Page 22SAQM 上海质量管理科学研究院(SAQM) 版权所有 2013/11/5 几种常用的统计软件几种常用的统计软件(software) 典型的统计软件典型的统计软件 MINITAB SPSS SAS STATISTICA Excel MINITAB STATISTICA Excel SAS SPSS Page 23SAQM 上海质量管理科学研究院(SAQM) 版权所有 3.5 描述性分析描述性分析 数据分布的特征:数据分布的特征: 1.分布的集中趋势; 2.分布的离散程度; 3.分布的形状。 集中趋势 离散程度 分布形状 Page 24SAQM 上海质量管理科学研究院(SAQM) 版权所有 3.5.1集中趋势的度量集中趋势的度量 1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 Page 25SAQM 上海质量管理科学研究院(SAQM) 版权所有 分类数据:众数 顺序数据:中位数和分位数 数值型数据:平均数 众数、中位数和平均数的比较 3.5.1集中趋势的度量集中趋势的度量 Page 26SAQM 上海质量管理科学研究院(SAQM) 版权所有 众
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号