资源预览内容
第1页 / 共50页
第2页 / 共50页
第3页 / 共50页
第4页 / 共50页
第5页 / 共50页
第6页 / 共50页
第7页 / 共50页
第8页 / 共50页
第9页 / 共50页
第10页 / 共50页
亲,该文档总共50页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
.,随机性模型与模拟方法,.,随机变量 蒙特卡罗方法 随机数的生成 模拟,.,一、随机变量,何谓随机变量?随机变量是一个其值不可预测的变量。虽然一个随机变量在个别试验中其结果不确定,但在大量重复试验中其结果是具有统计规律的。正是随机变量的这种规律性使我们可以利用它来建模。例如我们可以利用下述的数据: 得出一个模型。,时间t(秒) 0 1 2 3 4 5 6 7 8 9 变量X 1 0 2 2 1 2 0 1 0 2,.,是一个离散的随机变量并取值于 0,1和2。我们不可能给出 与 的确定的关系式,但是可以通过数 的不同值出现次数来描述这随机型 的规律列表如下: 这个表给出了随机变量 的变化规律,频率告诉某个特定的事件发生的频繁程度。如果我们需要构造一个含有随机变量的模型,可以假设这个规律总是成立的,模型的假设可以基于这几个数据之上。实际操作时可以把频率分布当作概率函数来处理,但应注意概率是频率的极限值,这两者是有差异的。在处理一个简单的理论模型时,对概率函数,0 1 2 频数 3 3 4 频率 0.3 0.3 0.4,.,必须作出合适的选择。例如,假设在上述问题中的随机变量取三个值时等于可能的,这样其概率函数为 这个例子说明在处理随机变量的模型时有以下两种选择: (1)使用一个理论模型。这在任何一本概率统计的书上都可以找到一些标准的理论模型如二项分布等。每一个都基于一定的假设之下成立的,所以在选用时要特别注意其假设条件。 (2)使用基于实际数据的频率表,并不去套用不准理论模型。,0 1 2,.,使用前者的好处在于能精确地叙述变量的概率,在处理问题时可以充分发挥数理统计的作用。但这一好处把所求模式制约在了处理简单情形。随着复杂性的增加,数学就变的太难。使用后者的好处在于模型时基于观测到的数据而不是基于假设之上。增加复杂性并不成为一大障碍,但我们不再能利用数理统计而得求助于模拟以及模型的统计结果。 在建立随机性模型时,首先要注意,将要处理的是离散还是连续的随机变量。 1、离散随机变量 离散随机变量的理论模型是由概率函数 来刻画的。这个式子说明随机变量 取值 时的概 率。对于离散型的随机变量有下面三种重要的分布,.,(01)分布 设随机变量 只可能取0、1两个值,它的分布规律是 则称 服从(01)分布。对于一个随机实验,如果它的样本空间只包含两个元素,即 ,我们总能在 上定义一个服从(01)分布的随机变量 来描述这个随机实验的结果。例如,对新生儿的性别进行登记,检查产品的质量是否合格等都可以用(01)分布的随机变量来描述。,.,(2)二项分布 设实验 只有两个可能的结果,将 独立地重复地进行 次,则称这一串重复的独立实验为 重贝努利实验。它是一重和重要的数学模型,有着广泛的应用。若用 表示 重贝努利实验中事件 发生的次数, 是一个随机变量,它服从如下的二项分布 特别,当 时二项分布就是(01)分布。,.,(3)泊松分布 设随机变量 所有可能的取值为 而取各个值的概率为 其中, 是常数,则称 服从参数为 的泊松分布。可以证明当 很小时,以 为参数的二项分布,当 时趋于以 为参数的泊松分布,其中,.,2、连续的随机变量,理论模型的连续型随机变量可以由概率密度函数 来描述,对所有的 存在 ,且 ,随机变量落在区间 的概率可由 来给出,在连续型随机变 量中下述两种是重要的 。,.,(1)均匀分布 设连续型随机变量 具有概率密度 则称 在区间(a,b)上服从均匀分布。 在区间(a,b)上服从均匀分布的随机变量 ,具有下述意义的等可能性,即它落在区间(a,b)中任意等长度的子区间内的可能性是相同的,或者说它落在子区间内的概率只依赖于子区间的长度而与子区间的位置无关。 (2)正态分布 设连续型随机变量 的概率密度为 其中 为常数,则称 服从参数为 的,.,正态分布。 连续型随机变量的值如同离散的一样可以用频率表给出,但不同的是离散的随机变量每个频率对应于随机变量的一个值,而对于随机变量每一个频率对应于随机变量的一个取值范围。,.,二、蒙特卡罗方法,蒙特卡罗方法是计算模拟的基础,其名字来源于世界著名的赌城摩纳哥的蒙特卡罗。其思想来源于著名的蒲丰投针问题。 1777年法国科学家蒲丰提出了下述著名问题:平面上画有等距离 的一些平行线,取一根长度为 的针,随机地向有平行线的平面上掷去,求针与平行线相交的概率。 我们用几何概型来解决这一问题。设M为针落下后的中点, 表示中点M到最近一条平行线的距离, 表示针于平行线的交角,如图2.18所示。那么基本时间区域,.,图2.18,.,它为平面上的一个矩形,其面积为 。 为使针与平行线(与 最后的一条平行线)相交,其充要条件是 的面积为 ,这样针与平行线相交的概率为 设一共投掷 次( 是一个事先选好的相当大的自然数),观察到针和直线相交的次数为 。,.,从上式我们看到,当比值 不变时, 值始终不变。取 为 的近似值,我们可以算出 的近似值。可以想象当投掷次数越来越多时计算的结果就越来越准确。下表时这些实验的有关资料 (此处把 折算为1):,.,由此可以看出蒙特卡罗方法的基本步骤:首先,建立一个概率模型,使它的某个参数等于问题的解。然后按照假设的分布,对随机变量选出具体的值(这一过程又叫着抽样),从而构造出一个确定性的模型,计算出结果。再通过几次抽样实验的结果,的到参数的统计特性,最终算出解的近似值。 蒙特卡罗方法主要用再难以定量分析的概率模型,这种模型一般的不到解析的结果,或虽然又解析结果,但计算代价太大以至不可用。也可以用在算不出解析结果的定性模型中。 用蒙特卡罗方法解题,需要根据随机变量遵循的分布规律选出具体的至,即抽样。随机变量的抽样方法很多,不同的分布采用的方法不尽相同。在计算机上的各种分布的随机数事实上都是按照一定的确定性方法产生的伪随机数。,.,三、随机数的生成,我们知道对于丢硬币的随机结果可以用以下的离散随机变量的改里函数来描述 如果我们需要模拟随机变量的以个值或一个集合,可以用丢硬币然后记录其其结果的方法来得到,然而这具又相当的局限性,这里我们用数学程序来产生拟随机变量。即看上去是随机出现的,但并非真正的随家便朗,它们产生于一个梯推公式。不过这些拟随机数并没有明显的规律,当给于适当的伸缩之后,它们非常接近于在 区间的均匀分布。,X 0 1 P(x) 0.5 0.5,.,这种方法的思想是,设计一个把 和 之间的整数映射到它们自身上的函数 ,然后从 开始,依次计算 例如通过下面的公式可以产生这样的一组随机变量 给定任意一个初值,如 代入公式得 ,然后用 去除得 ;同样 代入公式,可以得 ,重复这一过程可以得到我们所需要的一组随机变量。在程序设计和软件包中通常用 来表示由这样,我们用它来表示从 上的均匀分布所产生的随机变量。,.,我们可以从它构造出另外的随机变量。例如,可以从 给出区间 上的连续均匀分布的随机变量。如果我们要生成带参数 的指数分布,可以用 。 如果我们要生成平均值未零,标准差为 1 的正态分布,可以用下列公式 和 来给出 的两个值,令 或 可以生成 型的正态分布。,.,为了得到离散的随机变量,我们把 分成若干部分。例如设计一个离散的随机变量有下列的概率函数。 取一个RND值:如果 ,则 ;如果 ,则 ; 如果 ,则 。 对于连续的随机变量除了取生成的随机变量是每类的中点外,我们可以用同样的思想进行列表分类。如,0 1 2 0.3 0.3 0.4,0-10 10-15 15-20 频率 0.2 0.5 0.3,.,的一个 值将平移到 。一个更细致的方法是用线性插值而不是取中点,即 给出 。 从已知的 模拟一个连续随机变量的理论分布,可以用以下方法:,.,(1)逆累积分布函数法 如果随机变量的 是 , 则累积分布函数是 。如果把它作为一个随机变量, 是 上的均匀分布。从 上的均匀分布取一个 值,解方程 得对应得 的值,例如,设 累积分布函数为 解 得 。这就是我们所要的由这个分布所生成的 的值,.,(2) 排除法 对于这种方法我们需要用两个 值来生成一个 值。设 的值在区间 外为 ,而 的最大值是 。 我们可以通过如下的步骤生成 的值。 从 上的均匀分布生成 和 ; 用 计算 ; 计算 ; 用 算出 ; 如果 ,则接受 ,否则排除 回到 。 对于上面的例子,我们取,.,四、模拟,模拟是现象的模型所产生的再现。所谓数学模拟就是用模型使现象再现。因此,表示现象的部分或总体的基本方程和表示自然规律的数学模型全是数学模拟。然而,狭义地讲主要指的是数字模拟。它是将复杂现象作出可以用数字计算机表达的数学模型,从数值上进行各种实验。各种方法随着计算机的进步已广泛地应用起来。因此我们所说的模拟主要是指数学模拟。,.,例 2.18 一列火车大约在下午1点离开 站其规律如下; 火车从 到 途中所需要的平均时间为 分,由 分钟的标准差。如果你要赶的是这趟火车的下一站 ,而你到达 的站的时间分布为 问你能赶上这列火车的概率是多少?,离站时间 13.00 13.05 13.10 概率 0.7 0.2 0.1,时间 13.28 13.30 13.32 13.34 概率 0.3 0.4 0.2 0.1,.,为了回答这个问题,我们需要一些随机数。这里我们将采用上面给出的那些随机数,即 等。而我们所要模拟的是 火车离站的时间 ; 火车途中的时间 ; 你到达车站 的时间 。 这样你赶上火车的条件是 。为模拟这个问题只需要生成 , 和 的值,然后检验这条件。但如何得到 的值是不明显的,因并不知道这个分布。这样,假设一个模型,取平均值为30,标准差为2的正态分布,由所给的条件知 , 为离散的,而 为连续的随机变量。,.,以分为时间单位,从 的下午以点起算,构造的模型如下 其中 。 计算结果为 , 和 ,这样 。在这种场合你比火车提前到达4分钟。但需要指出,这并不是说我们已经回答了这个问题,要回答这个问题我们要作多次这样的模拟,记下这些结果,算出能赶上火车的频率。通过足够多次的模拟之后我们就可以看出能赶上火车的概率。,.,一般用在模拟建模时,一次模拟的成功并不能说明什么问题,更不能说我们的主要工作已经完成。你必须多次的进行模拟,然后分析其结果。分析的种类要看模型的对象,而这在模拟的一开始就应该清楚的。在实验的模拟模型的对象是在变化的,但常常包括一下几种: 对系统的长期性态作出统计; 比较系统的可选择对象的安排; 研究参数变化的影响; 研究模型假设的影响; 找出系统最优方案; 上面的例子是相当平凡的,根本不能作为用模拟解决问题的例子。下面我们仅举两个简单的例子以理顺模拟模型的思路。,.,例2.19 某个理发店中有两名理发员 和
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号