资源预览内容
第1页 / 共33页
第2页 / 共33页
第3页 / 共33页
第4页 / 共33页
第5页 / 共33页
第6页 / 共33页
第7页 / 共33页
第8页 / 共33页
第9页 / 共33页
第10页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1,5 仿真数据分析,2,2,本章主要内容,5.1 仿真输入数据采集与分析 5.1.1 仿真输入数据的采集和预处理 5.1.2 样本数据的独立性判别 5.1.3 分布形式假定 5.1.4 分布参数估计 5.1.5 拟合优度检验 5.2 仿真输出分析 5.2.1 系统的性能测度及其估计 5.2.2 终态仿真与稳态仿真 5.2.3 终态仿真的输出分析 5.2.4 稳态仿真的输出分析,3,3,5.1 仿真输入数据采集与分析,5.1.1 仿真输入数据的采集和预处理 正确地采集原始数据并对这些数据进行分析,是生产系统建模与仿真获得成功的关键环节之一。 数据采集的方法 通过实际观测获得系统的输入数据。 由项目管理人员提供的实际系统运行数据。 从已发表的研究成果、论文等资料中搜集类似系统的输入数据。 在具体的应用中,需要采集哪些数据以及如何采集数据等问题,还往往同所研究对象和研究的目的密切相关。,4,4,在数据采集过程中,一般应遵循的基本步骤及相关要求 确定信息/数据需求。 研究采集方法,编制采集计划。 设计和绘制数据采集表格。 按照研究目的和系统不同时段的特点,选定数据采集的地点和时间。 在采集任务比较繁重时,要按计划对数据进行分组采集。 在数据采集结束后,要对所得到的数据进行整理并作一大概的分析。,5,5,对仿真模型的输入数据进行分析的一般过程 检查所使用的数据是否独立; 大致判断各类数据所服从的概率分布; 估计各类分布有关的参数; 进行拟合优度检验。入数据。 在经过这一系列的分析步骤之后,我们就可以确定各类数据的拟合分布函数,并利用前面第3章中介绍的随机数及随机变量生成方法,得到满足要求的随机数据,并根据这些数据进行后续的仿真分析。,6,6,5.1.2 样本数据的独立性判别 相关图法,图5-1 相关图,7,7,散点图法,图5-2 散点图,8,8,表5-1 100个零件检测时间(单位:min),9,9,图5-3 零件检测时间的数据散点图,10,10,5.1.3 分布形式假定 点统计法 有一些分布函数可以通过实际参数的某些函数来进行确定,这些构造的统计量称为点统计量。而点统计法就是根据某些概率分布的各参数之间存在的一些特殊关系,通过它们构成的某些点统计量判断分布的类型。,11,11,12,12,直方图法 利用收集到的样本数据X1, X2, , Xn,通过绘制直方图可以得到相应总体分布的概率密度函数的基本图形估计。 直方图法基于概率密度的一个基本性质,即如果某输入随机变量X有密度函数f(x),则X取值在区间Ii = bi-1, bi的概率为 而利用样本数据,可以得到这一概率值 的估计为 ,即有 根据积分中值定理,可得 亦即:对 以 作为f(x)的估计。这就是直方图法的基本思想,13,图5-4 直方图,直方图法的一般步骤如下: 用b0和bk分别表示样本数据X1, X2, , Xn中的最小值与最大值,即,,,再把区间b0, bk划分成k个等间隔的小区间I1 = b0, b1), I2 = b1, b2), , Ik = bk-1, bk),其分点为,则可得每个小区间的长度,用fi表示样本数据X1, X2, , Xn落入第i个小区间Ii ( i = 1, 2, , k)中的个数,则f1 + f2 + + fk = n,14,14,计算每个小区间上的样本个数占整个样本数据量的比例(频度) ( i = 1, 2, , k) 定义函数 然后绘制函数h(x)的图形,即为所需要的直方图。 将步骤得到的直方图与基本理论分布的概率密度函数图形进行比较(先忽略位置及比例上的差别),观察何种分布与h(x)的图形相似,就可以假定样本数据X1, X2, , Xn服从该类型分布。 直方图的绘制十分简单,它可以应用于任何分布,并提供了一种很方便地将数据转换成直观可见轮廓的方法。但需要注意是,这种方法所得到的结果在很大程度上受到分区间宽度 的影响。,15,15,表5-3 零件到达间隔时间(按增序排列n = 219 单位:min),16,16,(a)b = 0.05,(b)b = 0.1,图5-5 零件到达间隔时间样本数据的直方图,(c)b = 0.2,17,17,称上述联合概率密度函数(5-6)为似然函数。对于总体为离散型分布的情形,定义似然函数为,那么,参数 ( j = 1, 2, , k)的极大似然估计值 ,就是使得似然函数L取最大时的 的值。即对任意的 ( j = 1, 2, , k),有,5.1.4分布参数估计,极大似然估计法 的原理是:认为所观测到的样本数据是实际生产系统中所产生的概率最大的一组数据。 假定总体的概率密度函数的形式 是已知的,其中 ( j = 1, 2, , k)为未知参数。若X1, X2, , Xk为来自总体的一个样本,则它的联合概率密度函数可以写成,18,18,例5-3:在例5-2中,已经确定了表5-3中的样本数据大概服从指数分布,概率密度函数为 ( x 0)。接下来,我们对其中的未知参数 的极大似然估计量进行求解。 根据指数分布的概率密度函数表达式,可得相应的似然函数为,上式也可写成,对式(5-10)两边求导数,可得,令上式为0,求解即可得参数 的极大似然估计量,即:指数分布的参数 的极大似然估计量是样本均值的倒数。根据表5-3中的样本数据,可计算得到 = 2.5063,19,19,5.1.5 拟合优度检验 基本思路:将得到的拟合分布函数用原始数据进行统计假设检验。即检验假设 H0:观测数据xi是以拟合分布函数F为分布 函数的独立同分布的随机变量 从严格的意义上来讲,当利用上述假设H0来对一组观测数据进行检验并且通过了该检验时,我们只能说“不拒绝”H0假设。但是,这并不就等同于说就是接受了这一假设。 常用的拟合优度检验方法主要用两种: 针对概率密度函数的2检验法; 针对分布函数的KS检验法。,20,20,5.2.1 系统的性能测度及其估计 通过仿真运行可以得到对生产系统性能的了解,而系统性能通常可以由一个或多个参数值(性能测度)来概括。 但是,由于包括生产系统在内的绝大部分离散事件系统本身所固有的一些随机性因素,每一次仿真运行只能是系统模型输出的一次抽样,因此所得到的结果与系统的“真正解”可能有很大的偏差。,5.2 仿真输出分析,21,21,例5-4:在图2-1所示的简单加工系统中,假设零件到达的时间间隔是某一服从指数分布且均值为5min的随机变量,每个零件的加工时间是服从某一指数分布且均值为4min的随机变量。采用仿真方法,分别针对长度为n = 1000、2000、3000、4000、5000个零件加工完毕的情形进行仿真运行,可以得到其平均队长Q(n)及平均等待时间d(n),如表5-4所示。 表5-4 简单加工系统的仿真结果,由表5-4可以看到,各次仿真运行的结果与理论值都有偏差,并且这些数值之间相差也较大。因此,仅从某一次仿真运行的结果来推断系统的性能并不一定能够保证所得到的结论就是正确的,我们不能把一次仿真运行所得的结果就当成是所研究问题的解。,22,22,仿真输出分析的目的就是通过采用适当的统计技术对仿真运行所产生的大量数据进行分析,来实现对未知参数的估计。对某一系统性能测度的估计,通常包括点估计法和区间估计法两种。 (1)点估计 点估计要解决的是寻找待估计参数的估计量(不含未知参数的样本函数),使得它在某种意义上可以作为未知参数的估计。 设n次仿真运行中某一输出随机变量X的观察值(即仿真输出的样本数据)为X1、X2、Xn,如果我们感兴趣的未知参数是均值E(X)和方差Var(X),那么常用的点估计有 样本均值,样本方差,23,23,(2)区间估计 点估计给出了未知参数的一个较好的推测,而区间估计可以对估计值距离参数真值的误差进行度量,并给出其置信度,以说明这个推测的误差为多大才算是合理的。 经典的统计方法对独立同分布的随机变量X1、X2、Xn给出总体均值的 置信区间为,其中, 是自由度为 的t分布上 百分位点,称 为置信度,它表示从样本数据中得到的随机区间(5-15)以概率 包含真实参数。,24,24,例5-5:对某生产系统重复仿真运行120次,得到平均周期时间的总均值为5.60小时,样本标准差为1.40小时。由于 ,所以可得长时间运行下的期望日平均周期时间的95%置信区间为,因此,我们最好的长时间运行下的日平均周期时间的推测是5.50小时,但是在该估计中可能存在有0.25小时的误差。,25,25,5.2.2 终态仿真与稳态仿真,终态仿真,也称为瞬态仿真,是指仿真运行某个持续的时间0, TE。这里,E表示停止仿真的某一个(或一组)特定的事件,TE则是指该事件E发生的时刻,它可以是一个固定的常数,也可以是一个随机变量。一般来说,终态仿真的结果与系统的初始条件有关。 与终态仿真不同,在稳态仿真中,对系统性能参数的估计则是建立在长期运行的基础之上的。它没有终止事件,因此其一次仿真运行的时间在理论上来讲是趋于无穷的,或者至少应该足够长,以便能够得到所求性能参数的良好估计。 总之,在两种不同类型的仿真中,终态仿真主要研究的是在规定时间内的系统行为,而稳态仿真则更侧重于对系统长期运行的稳态行为的关注。这种差异导致了仿真输出分析时,二者在所采用统计方法上的不同。,26,将 近似看成独立同分布随机变量的一组样本观测值,则其均值和方差的点估计分别为,26,5.2.3 终态仿真的输出分析,对某一终态系统仿真进行考察,它在有限的时间区间0, TE上运行,得到一组样本数据的观测值X1, X2, , Xn。其中的样本量n可以是固定数,也可以是随机变量(例如在时间TE内的观测次数)。 为了建立输出变量均值E(X)的置信区间,通常是使用相同的初始条件和同一终止事件对系统进行固定次数的独立重复仿真运行。并且在每次重复仿真运行中,使用不同的随机数流。这样得到的仿真输出数据可以被认为是独立同分布随机变量的一组样本观测值。 设对某一系统共进行了R次独立的重复仿真运行(R 2),令Xri表示第r次仿真运行中得到的第i个观测值,记,27,27,故可得E(X)的 置信区间为,其中, 是自由度 的t分布的上 百分位点。,例5-6:为考察某一工件的生产周期(工件从进入工厂到加工完成的时间),对该生产系统进行了20次独立的重复仿真运行,且每次仿真运行至第500个工件加工完成时结束。根据所得到的观测数据可计算得 = 0.346,S2 = 0.187。则相应总体均值的90%置信区间为,需要指出的是,这里所求得置信区间置信度的准确性依赖于总体分布为正态分布的假设。然而,该假设在实际中并不一定总能够满足。为了解决这一问题,通常所采用的方法是增加每次重复运行的时间,使 ( r = 1, 2, , R) 近似地服从于正态分布。 此外,采用上述固定样本量的方法来建立置信区间的不足之处还在于无法控制置信区间的半长。若重复仿真运行的次数较少,可能会出现所得置信区间过大而无法满足实际问题所要求的仿真精度的情况;若重复仿真运行次数太多,也可能超出了实际的需要而造成不必要的浪费。,28,28,假设在实际问题中所要求的绝对精度不超过 ,即,给出一种试算法的步骤如下: 对系统做R0次独立的重复仿真运行(如R0 = 4 5次),由此可得到样本数据的方差估计 ,计算,若 ,则所得区间估计已满足精度要求;否则,令,那么, 即为满足精度要求时至少应做的独立重复运行次数。 在已完成R0次重复运行的基础上,再补充进行 次独立的重复仿真运行,则用 次仿真运行所得到的输出数据来建立置信区间,即能够满足相应的精度要求(5-19)。,29,29,5.2.4 稳态仿真的输出分析,在稳态仿真中,我
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号