资源预览内容
第1页 / 共76页
第2页 / 共76页
第3页 / 共76页
第4页 / 共76页
第5页 / 共76页
第6页 / 共76页
第7页 / 共76页
第8页 / 共76页
第9页 / 共76页
第10页 / 共76页
亲,该文档总共76页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数理统计建模直方图 直方图:频率直方图和累积频率直方图直方图是用横坐 标标注质量特性 值,纵坐标标注 频数或频率值, 各组的频数或频 率的大小用直方 柱的高度表示的 图形直方图 在质量管理中,如何预测并监控产品质量状 况?如何对质量波动进行分析?直方图就是一目 了然地把这些问题图表化处理的工具。它通过 对收集到的貌似无序的数据进行处理,来反映 产品质量的分布情况,判断和预测产品质量及 不合格率。直方图绘制方法 直方图绘制6步法 集中和记录数据,求出其最大值和最小值。 (数据的数量应在100个以上,在数量不多的情 况下,至少也应在50个以上) 将数据分成若干组,并做好记号。(分组的 数量在620之间较为适宜) 计算组距的宽度。用组数去除最大值和最小 值之差,求出组距的宽度。 直方图绘制方法 计算各组的界限位。各组的界限位可以从第 一组开始依次计算。 统计各组数据出现频数,作频数分布表。 作直方图。以组距为底长,以频数为高,作 各组的矩形图。 四种抽样方法 收集数据又叫抽样,抽样有下列四种: 简单随机抽样:简单随机抽样是一种一步抽 样法,它要求在调查总体N中不加任何分组、划 类、排队等,完全随机抽取n个调查单位作为样 本。 等距抽样:等距抽样又称机械抽样或系统抽 样。它是先将总体中各单位按一定的标志排队 ,然后每隔一定的距离抽取一个单位构成样本 。四种抽样方法 分层随机抽样:分层随机抽样又称为类型随 机抽样、分类随机抽样。它是按照某一标志, 先将总体分成若干组(类),其中每一组(类)称 为一层,再在层内按简单随机抽样方法进行抽 样。 整群随机抽样:整群随机抽样是先将总体按 某一标志分成若干组,其中每个组称为一个群 ,以群为单位进行简单随机抽样,然后对抽到 的每个单位都进行调查。样本均值和方差常见抽样分布统计推断方法 例题1:从一个池塘里捞出1000尾鱼,将其尾部标以红点,仍然放入水中。经过一段时间, 再从池中捞出1000尾鱼,其中有红点的鱼有100 尾。试估计池中有多少尾鱼? 统计推断方法 例题1的分析:将1000尾鱼再放入水中以后,鱼的总数不变。经过一段时间,这些鱼在池中应 该分布“均匀”了,而第二次捞出的鱼中,有红点 者占捞出鱼总数的100/1000=10%,所以从比例 的观点看,池中鱼的总数x应该满足10%x=1000所以x=10000,因而可以认为池中的鱼大约在万尾左右。统计推断方法 例题2:由厂方提出的一箱产品计1000件,从 中取出100件,发现其中有2件不合格品。经约 定:如果一箱的废品率超过1%,那么买方就不接受此(整)箱产品;否则买方就得接受。问 此箱产品应否接收? 例题2的分析:按上例,从比例出发,认为此 箱产品的废品率为2/100=2%,它大于1%,因而按照约定,买方可以拒绝接收。 你觉得合理吗?统计推断方法先将上述模型一般化:(1)在上述两个例题中,所考察的个体(鱼,产品 )的全体(总体)个数都是一个有限数N。我们不 妨将所考察的个体通称为“球”,并且认为都在一个“ 袋”中。(2)在两个问题中,总体的元(个体)都分成两类 (有红点或无红点;废品或合格品),将前者通称为 “红球”,后者通称为“黑球”,记红球个数为M统计推断方法(3)在两个问题中,都从总体中抽出若干个体(一 个样本),样本容量为n(4)在两个问题中,样本中含有红球的个数为m(5)假设从总体中抽取任意一球的可能性都相等。统计推断方法 从而上述问题可归结为如下的超几何模型: 设有一袋,袋中有N个球,其中有M个红球,N- M个黑球,假设从袋中抽取任意一球的可能性相等 。现从袋中任取n个球,用X表示取出的n个球中的 红球数,则PX=m的表达式为统计推断方法 例1就是要估计N: 易见PX=m是N的函数。 一个“直观的想法”是:N应该使概率PX=m 达到最大 !?统计推断方法池塘内的鱼数为:统计推断方法 例2就是要检验废品率: 产品检验的问题是这样提出的:产品总免不了有 废品,在买卖中,买方当然希望买进的货物中废品 尽量的少,而卖方则希望合格品都被买方接受。最 自然的办法是由买卖双方对产品逐个检验。 显然,该办法在很多时候都是不现实的!(该办 法只能适用于非破坏性的检验,而且批量小、检验 费用低的情况。在现代化生产和市场交易中,这种 情况是很少的)统计推断方法 因此人们希望制定一种简便的验收方案,使买卖 双方在每批货物的交接中,尽可能都得到满足。即 对于卖方交付的每批产品,通过检验其中部分产品 ,使买方接收的废品比例和卖方被退回的合格品的 比例都在可以接受的限度内。 如何建立这种方案呢?统计推断方法 假设例题2中所检验的那箱产品的废品率为1%,则易计算得 也就是说,抽到3个以上的废品的概率(可能性 )是很小的(1.23%);而且还可以证明,当废品 率小于1%时,抽到3个以上的废品的可能性更小。统计推断方法 根据实践经验知道:概率很小的事件是难于发生 的。所以从卖方希望尽量将合格箱交出的观点看: 从一箱产品中抽取100个产品,抽到的废品数大于3时,就没有理由交给对方;抽到的废品数小于或等 于3时,就可以认为此箱产品合格,买方应该接收。于是 按照卖方的观点应该约定:从一箱产品中抽取 100个产品,抽到废品数大于3时,卖方应该自己留 下;抽到废品数小于或等于3时,就应该认为该箱产品合格,买方应该接收;统计推断方法 这种“概率很小的事件在实践中难于发生”在数理 统计学中称为“实际推断原理”:一个事件如果发生 的概率很小(如1%或5%),那么在一次试验中,就认为它不会发生;反之,一个事件如果发生的概 率很大(如99%或95%),那么在一次试验中,就认为它必定发生。 上述做法会犯错误吧?统计推断方法 事实上,事件发生的可能性小、难于发生,并不 等于不发生。所以存在这样的情况:抽到的废品数 虽然大于3,但该箱的废品率不超过1%. 此时,虽然此箱产品合格,但是按照约定,还得作为不合格处 理而招致损失。于是卖方损失的可能性达到1.23%. 在统计学中称为犯第一类错误的概率(弃真概率)统计推断方法 以上只是从卖方角度考虑问题,我们现在从买方 角度分析:卖方交出产品只是根据假设所检验的箱 合格做出的断言,该箱产品完全可能不合格。买方 当然十分关心接收不合格的箱的概率有多大?这个 概率在统计学中称为犯第二类错误的概率(纳伪概 率),买方总是希望纳伪的概率尽可能小。统计推断方法 按照超几何分布,此例的纳伪概率应该是:在废 品率超过1%,即M10001%=10的条件下,概率M111320304050P0.98210.81780.58850.22980.03820.0108 由上可以看出:在样本容量100,废品率超过规定1% 而小于或等于3%时,纳伪概率很大。这种情况使得卖方认为买方应该接受的产品,而买方却不能接受。统计推断方法 但从买方观点看,他也可以规定一个能接受的“ 最坏”(即使得产品质量达到他可以接受的最低程度 )的废品率,而使纳伪概率较小。人们称为“最坏” 的废品率为极限质量,通常记为p1,而将原来双方 约定的废品率称为合格质量,记为p0. 从上面计算结 果可知:如果极限质量规定为4%,那么纳伪概率不 超过3.8%. 如果极限质量规定为5%,那么纳伪概率 不超过1%.M111320304050P0.98210.81780.58850.22980.03820.0108统计推断方法 以上的讨论可以总结如下:设想交的每批产品数 (也称产品批量)为N,产品的抽样检验方案就是 :规定每批产品抽检的产品数n和其中允许废品数 的上限(也称合格品判定数)c. 如果抽出的n件产品 中的废品数X小于或等于c,这批产品就由买方整个 接收,如果X大于c,买方就拒收这批产品。统计推断方法(1)从卖方的观点看,“理想”的方案是:确定一个 数p0(0,1) (称为合格质量),如果一批产品中的 废品数MNp0时,就认为这批产品合格。对卖方来 说,方案的要求是:给出较小的正数(即弃真概 率,通常取1%或5%),使得n、c满足统计推断方法(2)从买方观点看,确定一个数p1(p0)(称为 极限质量),如果一批产品中的废品数MNp1时,就认为这批产品不合格而加以拒绝。对买方来说, 方案的要求是:对给出较小的正数(即纳伪概率, 通常取1%或5% ),使得n、c满足统计推断方法 又可以证明:PXc 随废品数M的上升而下降。再由实际情况,不妨设Np0、Np1都是整数。所以 满足上面两式的n、c就是满足 这组不等式通常不能直接求解,只能试解。或用 近似分布求解。统计推断方法 总结其中的统计思想 直接的总结是:超几何分布的第一个应用是:球 的总数未知,红球数已知,要通过抽取(观察)部 分球(样本)的情况来估计总数;第二个应用是: 球的总数知道,抽取(观察)一部分球(样本), 希望通过清点这一部分球中的红球数,来探讨全体 球中有多少红球。归纳起来,就是希望运用数学方 法,通过样本的数据来判断总体的某些性质这就是统计学研究的对象!统计推断方法 上升到理论高度总结是:两例显示数理统计 的两个重要研究内容:参数估计和假设检验 由于统计学是由对象的部分现象来推断全体 的现象,因此它的推断是归纳性的,它对所研 究的对象的结论不是决定性的,带有一定的随 机(偶然)性,而且还有犯错误的可能。但是 由于结论是用数学的方法概率论来表达的,因此又是决定性的!统计推断方法 另外,题目中也涉及到统计学的抽样和抽样 分布问题,很容易看出两个例题的抽样都不是 简单随机抽样(数理统计的研究都需要简单随 机抽样,这样数学处理才方便!),但都是实 际当中最易于采取的抽样,如何处理好二者的 关系还是相当必要的!区间估计 不仅需要给出参数的一个数值估计,往 往需要给出估计的误差 例如:铁院男生身高XN(,2) ,随机测 量16人的身高得 又如:食堂某师师傅的打饭饭量XN(,2) , 随机测测量9次打饭饭量 区间估计 南方成年男子身高XN(1,2) ,随机测 量4人的身高:167,170,175,188;北 方成年男子身高YN(2,2) ,随机测量4人 的身高:168,176,176,173,两样本独立 。问南北方成年男子平均身高有无差别? 假设检验 例: 某车间用一台包装机包装葡萄糖, 包得的袋装糖的重量XN(,0.0152),当 机器工作正常时0.5公斤。某日开工后 为检验包装机是否正常,随机地抽取9袋 包装好的糖,称得净重为(公斤):0.497 ,0.506,0.518,0.524,0.498,0.511, 0.520,0.515,0.512,问机器是否工作正 常?假设检验 例: 设各届学生概率统计成绩服从正态分布 ,为比较04届本科学生的概率统计平均成绩是 否较03届有所提高,分别从两届学生试卷中独 立随机抽取10份 03届:78 72 76 74 77 78 76 75 76 77 04届:71 81 77 79 80 79 79 77 77 82 问:04届本科学生的概率统计平均成绩是否 较03届没有所提高 假设检验 假设检验的统计思想和方法 1.假设检验的含义:在总体分布函数完 全未知或只知其形式不知其参数的情况下 提出某些关于总体的假设,根据样本对所 提出的假设做出判断是接受还是拒绝。 2.基本思想:小概率事件原理假设检验 步骤: (1)提出原假设H0和备选假设H1 (2)确定检验统计量 (3)对显著性水平确定拒绝域 (4)抽样检验假设检验两类错误 弃真错误: H0为真拒绝H0 纳伪错误: H0为假接受H0我们这里的假设检验只控制了犯第一 类错误的概率,未控制犯第二类错误的概 率 假设检验 分布拟合:在很多场合
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号