资源预览内容
第1页 / 共49页
第2页 / 共49页
第3页 / 共49页
第4页 / 共49页
第5页 / 共49页
第6页 / 共49页
第7页 / 共49页
第8页 / 共49页
第9页 / 共49页
第10页 / 共49页
亲,该文档总共49页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
6普及普及培训培训第二部分 基本统计概念(ZTE-WB102-V1.0)ZTE-WB102-V1.0)统计概念统计概念解释以下基本统计概念。1.波动(偏差)2.连续数据和离散数据3.平均值、方差、标准差4.正态曲线5.用Z值将数据标准化6.中心极限定理7.过程能力-使用Z值作为衡量工序能力的指标-通过改进关键值Xs来改进Y8.稳定性因子波动波动所有的人不会都是同样的高度;所有的人不会都是同样的高度;所有的葡萄不可能同一天采摘所有的葡萄不可能同一天采摘问题问题:你期望存在波动吗你期望存在波动吗?什么类型的波动什么类型的波动?观测值变化观测值变化当重复进行测量的时候,通常会得到不同的答案,这就是波动!系统波动系统波动预期的和可预测的测量结果之间的差异。举例:夏季和冬季的空调的销售量不同。随机波动随机波动不可预测的测量结果之间的差异。举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试.可能得到两个不同的结果。1.2.观测值变化(观测值变化(续)我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。如果所有地区的手机销售量是一样的,那么我们就会怀疑是数据库出了问题。.如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。这种变化使我们的工作更具挑战性!这种变化使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个多个数据点,而且非常注意如何选取这些样本,以减少偏差。波动的产生是很自然的,意料之中的,是统计学的基础波动的产生是很自然的,意料之中的,是统计学的基础统计学的作用统计学的作用统计学用以下方法处理误差:(置信区间和假设检验置信区间和假设检验)。统计描述统计描述用图表和几个总结性数字(均值、方差、标准差)描述一组数据。统计推理统计推理确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。收集并分析数据,以估算过程变化的影响。试验设计试验设计数据的两种类型数据的两种类型 连续连续(可可变变)数据数据 使用一种度量单位,比如英寸或小时。离散离散 (属性属性)数据数据是类别信息,比如“通过”或“未通过”。连续数据连续数据离散数据离散数据问题问题解决办法解决办法举例举例:部件号部件号离散离散连续连续1通过2.0312通过2.0343未通过2.0764通过2.0225未通过2.001连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的特性。测量标准可以有意义地不断分割,使精确度提高。你能举出我们用来获得连续数据的三个器具例子吗?相对于仅仅知道部件是否合格而言,相对于仅仅知道部件是否合格而言,连续数据可以提供更多的信息。连续数据可以提供更多的信息。连续数据连续数据(也称为可变数据也称为可变数据)离散数据不能更进一步精确地细分。离散数据不能更进一步精确地细分。离散数据是某件事发生或未发生的次数,以发生的频数来表示。离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。离散数据离散数据(也包括属性或类别数据也包括属性或类别数据)地区地区亮和不亮亮和不亮离散数据离散数据一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获得更多的信息。如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出判断。.连续数据与离散数据进行比较的解释:连续数据与离散数据进行比较的解释:离散数据举例:离散数据举例:有凹痕的部件数量有凹痕的部件数量通过通过/未通过未通过申诉决议申诉决议 产出产出生产线不合格品数量生产线不合格品数量及时交货及时交货离散数据需要更多的数据点才能进行有效的分析离散数据需要更多的数据点才能进行有效的分析请在下面的例子旁,写出它是请在下面的例子旁,写出它是“连续连续”还是还是“离散离散”1 销售订单准确度2 数据输入准确度3 销售地区4 使用“合格/不合格”测量仪器得到的孔径5 孔径 6 应答中心对话时间7 制冷氟利昂的重量(克)8 每百万部件中有缺陷部件的数量9 装配线缺陷(ALD)应用你所学到的东西应用你所学到的东西总体总体 全组数据,全部对象。-一个总体中的元素数量用N来表示样本样本 总体的一个子集 -样本的元素数量用n 来表示平均值平均值 总体或样本的平均值-总体的平均值用 来表示-样本的平均值用X 或 来表示方差方差 数据与其平均值之间差值的平方的平均值。(它代表该组数据的分散程度)-总体的方差用 表示-样本的方差用s2或 表示均方差均方差是方差的(正)平方根。(它也代表该组数据的分散程度)。-总体的标准差用 来表示-样本的标准差用s或 来表示统计学术语统计学术语统计学术语和定义统计学术语和定义总体总体 全部对象.举例 1998年5月在深圳生产的所有的21英寸彩电样本样本 代表总体的一个子集数据。举例-1998年5月在深圳生产的一百二十台21英寸彩电举例:这个矩阵代表25个X的总体。画上圆圈的那些是由总体中的六个X组成的样本。平均值平均值 -总体或样本的平均值。总体或样本的平均值。用用x或来表示样本,用来表示总体。举例:给定一个样本:1,3,5,4,7,平均值就是:统计学术语和定义统计学术语和定义x =xn在这里X1是样本的第一个点,Xn是样本的最后一个点。.i1n,平均值的公式平均值的公式 x =(1+3+5+4+7)=20 =4.0 5 5样本的平均值等于样本的平均值等于4。标准差标准差 衡量数据分散程度的一个指标。一般用 表示总体,用s 或 表示样本。=(Xi-)2i=1NN总体总体的公式的公式方差方差-与平均值之差的平方的平均值。一般用s2或 2来表示。=S=(Xi-X)2i=1nn-1样本样本的公式的公式统计学术语和定义统计学术语和定义举例举例课堂举例:计算样本2,6,4 的方差和标准差首先计算均值:(2+6+4)/3=12/3=4计算平均值、方差和标准差x =xn ii=1ns 2 =n(Xi-X)2i=1n-1 s=(Xi-X)2i=1nn-1平均值 方差 标准差方差 (s2)=8/(3-1)=4标准差 (s)=sqrt(4)=2ixi(xi-4)(xi-4)21 2-242 6 243 4 00和12 08课堂练习课堂练习课堂举例:计算样本1,3,5,4,7 的方差和标准差 (使用下面的表作为向导。)首先计算平均值X:计算平均值、方差和标准差x =xni1ns 2 =n(Xi-X)2i=1n-1 s=(Xi-X)2i=1nn-1均值 方差 标准差方差 (s2)=标准差 (s 或)=统计学术语和定义统计学术语和定义缺陷;未满足与预期或规定用途有关的要求。(引起顾客不满意)单位缺陷数(DPU):PPM(Parts per Million)不合格品不合格品PPM=用PPM来表示缺陷率:PPM=DPU 1000000 不合格品数量检验的产品数量1000000 xx统计术语和定义统计术语和定义缺陷机会:做一项工作(或生产一件产品等)所有产生缺陷的可能性。如:一个过程的步骤数;一个产品的零件数。每百万机会的缺陷数(DPMO)DPMO=单位缺陷数每单位的缺陷机会1000000我能计算缺陷率吗我能计算缺陷率吗?我的过程产生了多少缺陷?生产40000只灯泡,其中50只有缺陷.DPMO是多少?x1,000,000=5040,0001250 DPMO如何计算如何计算DPMO?DPMO?我的过程产生了多少缺陷?1999年A19灯泡的客户退货率是1.0%。DPMO是多少?x1,000,000=如何把%转化成 DPMO?把%转化成 小数DPMO小数点向前移动2位0.01x1,000,000=10,000 DPMO作业作业-商务商务一名客户服务代表一名客户服务代表3天收到这些电话天收到这些电话:小时小时:第第 1 天天:第第 2 天天:第第 3 天天:电话数电话数回答数回答数电话数电话数回答数回答数电话数电话数回答数回答数 1202025232222 2151220182524 3252315152017 4232022202424 5262426232019 6272528282424 7232324212522 8212025232116未回答电话的未回答电话的DPMO是多少是多少:a)第第1天天b)第第2天天c)第第3天天d)3天天绘制直方图绘制直方图75706560151050高 度 频 数 59 61 63 63 64 59 62 66 65 65 64 60 65 62 64 68 70 65 63 64 68 66 65 66 67 64 66 58 65 65 71 63 69 63 66 70 64 67 64 66 62 64 64 64 61 64 63 65 64 68 66 67 69 71 68 66 65 63 64 64 68 67 65 64 65 64 70 65 68 65 66 69 66 66 65 63 68 66 62 67 65 66 67 66 60 67 63 60 64 7390位女士的身高用直方图形成一个连续分布用直方图形成一个连续分布测定单位测定单位条形的中心点平滑的曲线连接每个条形的中心点许多(但非全部)数据符合“正态”分布,或钟形曲线。正态分布的标准差正态分布的标准差()拐点拐点1 USLp(d)上限(USL)下限(LSL)均值()标准差()3 拐点与平均值之间的距离是一个 标准差。如果三倍的标准差都落在目标值和规范的上下限内,我们就称这个过程具有“三个西格玛能力”平均值平均值LSL曲线从较陡的状态变得越来越平坦面积和概率面积和概率合格部件合格部件控制限曲线下的面积是1.0。我们可以计算规范上下限之外的面积,也就是出现缺陷的概率。一个缺陷部件的概率一个缺陷部件的概率正态曲线与横轴之间的面积等于1,所以曲线下面的面积与缺陷发生的概率相关。正态分布可以用来将正态分布可以用来将 和和 转换为转换为出现缺陷的百分比。出现缺陷的百分比。规范上限出现缺陷的概率出现缺陷的概率=.0643假设Z=1.52。1.52之外的正态曲线下部的面积就是出现缺陷的概率。Z值是工序能力的一种尺度,通常称为“工序的西格马”,不要与过程标准差混淆。Z曲线下的整个面积是曲线下的整个面积是1 =0(在这里在这里 =1,=0 )使用正态表使用正态表Z=1.52下页上的表列出了Z值右边的面积。正态分布正态分布Z00.010.020.030.040.050.060.070.080.090.05.00E-014.96E-014.92E-014.88E-014.84E-014.80E-014.76E-014.72E-014.68E-014.64E-010.14.60E-014.56E-014.52E-014.48E-014.44E-014.40E-014.36E-014.33E-014.29E-014.25E-010.24.21E-014.17E-014.13E-014.09E-014.05E-014.01E-013.97E-013.94E-013.90E-013.86E-010.33.82E-013.78E-013.75E-013.71E-013.67E-013.63E-013.59E-013.56E-013.52E-013.48E-010.43.45E-013.41E-013.37E-013.34E-013.30E-013.26E-013.23E-013.19E-013.16E-013.12E-010.53.09E-013.05E-013.02E-012.98E-012.95E-012.91E-012.88E-012.84E-012.81E-012.78E-010.62.74E-012.71E-012.68E-012.64E-012.61E-012.58E-012.55E-012.51E-012.48E-012.45E-010.72.42E-012.39E-012.36E-012.3
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号