资源预览内容
第1页 / 共123页
第2页 / 共123页
第3页 / 共123页
第4页 / 共123页
第5页 / 共123页
第6页 / 共123页
第7页 / 共123页
第8页 / 共123页
第9页 / 共123页
第10页 / 共123页
亲,该文档总共123页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第第5 5章章 决策决策分析分析管理决策方法课件5.1 无概率决策问题无无概概率率决决策策问问题题(不不确确定定型型决决策策问问题题),这类决策问题的特点是:决策人面临多多种种决决策策方方案案,对每个决策方案对应的几个不同决策状态无无法法估估计计其出现概概率率的的大大小小,仅凭个人的主主观观倾倾向向和偏好和偏好进行方案选择。22024/8/3管理决策方法课件5.1 无概率决策问题5.1.1 5.1.1 基本问题基本问题例例5-1 某公司打算生产一种新产品。该厂考虑了三种方案:(1)新建一条生产线(A1);(2)改造原有的生产线(A2);(3)从市场上采购部分零件进行组装(A3)。产品投放市场后,可能有需求量较高(N1)、需求量一般(N2)和需求量较低(N3)三种状态。32024/8/3管理决策方法课件5.1 无概率决策问题由于缺乏信息,无法对状态的概率作出估计,但可以估计出各方案的年收益,收益值如表5-1所示。在上面的决策问题中,厂家能够预测到可能出现的三种自然状态,但由于缺乏资料,无法估计状态发生的概率,所以这是一个典型的无概率决策问题。这类问题的决策主要取决于决策者的经验和素质。42024/8/3需求量较高(需求量较高(N1 )需求量一般(需求量一般( N2)需求量较低(需求量较低( N3)A1800400-100A2600450-50A340025080状态状态收益收益方案方案 表表5-1 各方案的年收益值各方案的年收益值 (单位:万元单位:万元)管理决策方法课件5.1 无概率决策问题5.1.2 5.1.2 决策的决策的基本基本准则准则典型的无无概概率率决决策策准准则则主要包括乐观准则、悲观准则、折中准则、等可能准则和最小后悔值准则。这些决策准则有时会产生相同的决策,但通常会产生不同的决策。决策者必须选择最最适适合合自自己己需需要要的决策准则或决策准则组合。为描述方便,作如下假定:l假设无概率决策问题的备选方案集为A=A1,A2,Am,自然状态集为N=N1,N2,Nn,方案Ai在状态Nj下的收益值为bij。52024/8/3管理决策方法课件5.1 无概率决策问题乐观准则乐观准则特点:决策者在情况不明时,对自然状态抱最最乐乐观观的的态态度度,从最好的自然状态出发,先从各方案中挑选最最大大收收益益值值,然后再从这些最大收益值中挑选出最优决策方案。公式则Al是乐观准则下的最优决策方案。乐观准则是一种比较冒险的决策方法,实际中很少采用。62024/8/3管理决策方法课件5.1 无概率决策问题例例5-2 使用乐观准则对例5-1中的最优方案进行决策。72024/8/3解解 (1)取各行的最大收益值,得(2)取各最大收益值中的最大值(3)决策。由于f(A1)=800,故方案A1为最优决策方案。管理决策方法课件5.1 无概率决策问题悲观准则(小中取大准则)悲观准则(小中取大准则) 悲观准则也称小中取大准则。这是一种在不确定型决策问题中,充充分分考考虑虑可可能能出出现现的的最最小小收收益益后,在最小收益中再再选取最大者选取最大者的保守决策方法。公式:则Al便是悲观准则下的最优决策方案。采用悲观准则的决策方法是一种不不冒冒风险而而稳妥妥的决策方法。使用这种方法有可能因保守而失去更大的获利机会。82024/8/3管理决策方法课件5.1 无概率决策问题例例5-3 使用悲观准则对例5-1中的最优方案进行决策。92024/8/3解解 (1)取各行的最小收益值,得(2)取各最小收益值中的最大值:(3)决策。由于f(A3)=80,故方案A3为最优决策方案。管理决策方法课件5.1 无概率决策问题折中准则折中准则 折中准则是指决策者对未来自然状态的估计既不那么乐观,也不那么悲观,在乐观和悲观两个极端之间用一个系数折中一下,求出各方案的折中收益值,然后再从中挑选出具有最大折中收益值最大折中收益值的方案作为最优决策方案。令为乐观系数,0 1,计算 若则Al为对应的折中决策法的最优决策方案。102024/8/3管理决策方法课件5.1 无概率决策问题例例5-4 使用折中准则对例5-1中的最优方案进行决策。112024/8/3解解 (1)确定乐观系数=0.3。(2)计算各方案的最大和最小收益值以及(3)取最大值:(4)决策。由于f(A3)=176,故方案A3为最优决策方案管理决策方法课件5.1 无概率决策问题等可能准则(等可能准则( LaplaceLaplace准则准则)等可能准则又称为Laplace准则,其基本思想是:既然没有更多信息可区分哪一种可能结果出现的概率会高于其他结果,因此每种可能结果的概率应该相同,均为1/n,进而计算得出各个方案的平均收益值,最后选择平平均均收收益益值值最最大大的方案作为最优决策方案。公式: 令 若则Al为等可能准则下的最优决策方案。122024/8/3管理决策方法课件5.1 无概率决策问题例例5-5 使用等可能准则对例5-1中的最优方案进行决策。132024/8/3解解 (1)求各方案的平均收益值(2)取各行的最大值(3)决策。由于f(A1)=367,故方案A1为最优决策方案。管理决策方法课件5.1 无概率决策问题后悔值准则后悔值准则由于决策总是面向未来,而未来总有一些不以人的意志为转移的不确定性因素会影响决策,所以事先做出的决策在未来蒙受这些不确定性因素影响,造成事后的结果可能差强人意而往往令人感到后悔。为了尽量减少后悔程度,也就产生了后悔值准则。后悔值准则可以描述如下:对收益矩阵,首首先先计计算算每一列的最大收益与该列的每一收益值的差额,称作该列状状态态下下的的后后悔悔值值或或机机会会损损失失值值,然后将所有的后悔值构成后悔值矩阵,对后悔值矩阵采用悲观准则决策对后悔值矩阵采用悲观准则决策,从而得到决策方案。142024/8/3管理决策方法课件5.1 无概率决策问题后悔值准则后悔值准则公式: 令 设矩阵H=(hij)mn为后悔值矩阵,则令若则Al为后悔值准则下的最优决策方案。152024/8/3管理决策方法课件5.1 无概率决策问题例例5-5 使用后悔值准则对例5-1中的最优方案进行决策。162024/8/3解解 (1)求各状态的最大收益:(2)求后悔值矩阵(4)取各最大损失值的最小值(3)每种方案的最大损失分别为(5)决策。由于f(A1)=180,故A1为最优决策方案。管理决策方法课件5.1 无概率决策问题5.1.3 5.1.3 决策结果分析决策结果分析对同一个无概率决策问题,采用不同的决策方法不同的决策方法,其最优决最优决策往往会各不相同策往往会各不相同。而不同的决策准则的优劣也难以权衡,所以实际应用时究竟采用哪种准则,全凭决策者的主观偏好全凭决策者的主观偏好而定。若决策者对未来充满乐观态度,可以采用乐观准则,若对未来充满悲观态度,则可采用悲观准则;否则,既不乐观也不悲观,则可以根据乐观程度采用折中准则;决策者若认为各种状态的出现概率均等,则可以采用等可能准则;若对机会损失较为敏感,则可以采用后悔值准则。172024/8/3管理决策方法课件5.1 无概率决策问题5.1.3 5.1.3 决策结果分析决策结果分析由于无概率决策问题始终依据决策者对自然状态的看法以及对待风险的态度,而不可能完全客观,所以近年来,国际管理学界倾向于以以评评估估状状态态概概率率(起码能够评估得出自然状态的主观概率)作作为为依依据据,将将无无概概率率决决策策转转化化为为概概率率型型决决策策,这样便可以采用依据统计规律的期望值准则来进行决策。182024/8/3管理决策方法课件5.2 有概率决策问题有概率决策问题也称风风险险型型决决策策问题,这类决策是指在未来情况和条件不完全确定,但其出现的概概率率已已知知(或可以估计出来)的条件下所作出具有一定风险的决策。192024/8/3管理决策方法课件5.2 有概率决策问题202024/8/35.2.1 5.2.1 基本问题基本问题例例5-7 某施工队要确定下个月是否按期开工,经调查得知,天气情况有三种可能:好、一般和坏,其出现的概率为0.2,0.5,0.3,损益情况如表5-2所示。在这个决策问题中,施工队能够预测到可能出现的三种自然状态和自然状态出现的概率,是一个有概率决策问题有概率决策问题。天气好天气好天气一般天气一般天气坏天气坏损益期望值损益期望值0.20.50.3A1(按期开工)108-5A2(不开工)-1-1-1 表表5-2 决策信息表决策信息表 (单位:万元单位:万元)概率概率自然状态自然状态损益值损益值备选方案备选方案管理决策方法课件5.2 有概率决策问题基本假定基本假定在决策分析时,通常把面临的几种自然情况称为自然状态或者客观条件,有时也简称为状态或条件,一般用N1,N2, ,Nn来表示,它们出现的概率,用P1,P2,Pn表示。备选方案一般A1,A2, ,Am来表示。一般地,在状态Nj下,选择方案Ai的损益值用bij表示,由它们构成的矩阵B=(bij)mn称为损益矩阵。212024/8/3管理决策方法课件5.2 有概率决策问题5.2.2 5.2.2 最大可能性准则最大可能性准则一个事件的概率越大,则它发生的可能性就越大。按照概概率率最最大大的状态进行决策的方法,称为最大可能性准则决策方法。以例5-7为例,天气一般出现的概率P2=0.5最大,因此按上述准则,应在这种状态下进行决策,这时问题已转化为确定型决策问题,易见方案A1(按时开工)是最优方案。222024/8/3管理决策方法课件5.2 有概率决策问题最大可能性准则最大可能性准则决策步骤决策步骤l令l若追求的目标是效益最大,则令 若追求的目标是损失最小,则令l选取方案 为最优方案。232024/8/3管理决策方法课件5.2 有概率决策问题例例5-8 某食品厂拟利用剩余劳动力和设备生产雪糕,市场日销量及其对应的概率和收益如表5-3所示,试用最大可能性准则对日生产量进行决策。242024/8/3市场日销量(箱)市场日销量(箱)损益期望值损益期望值1001201401600.20.50.30.1A1(100箱)5000500050005000A2(120箱)4400600060006000A3(140箱)3800540070007000A4(160箱)3200480064008000 表表5-3 决策信息表决策信息表 (单位:元单位:元)概率概率自然状态自然状态损益值损益值备选方案备选方案管理决策方法课件5.2 有概率决策问题解解 根据最大可能性准则,由于故每天生产120箱雪糕的方案(A2)为最优方案。管理决策方法课件5.2 有概率决策问题5.2.3 5.2.3 期望值准则期望值准则期望值准则就是先计算各备选方案的期望值,然后按照决策目标选择最优行动方案。若决策目标是追追求求效效益益最最大大,则选选取取收收益益期期望望值值最最大大的的行行动动方方案案。若决策目标是追追求求损损失失最最小小,则选选取取损损失失期期望望值值最最小小的的行行动动方方案案为最优方案。损益期望值的计算公式为其中Pj为出现第j种自然状态Nj的概率,bij为第i个方案Ai在第j种,自然状态下的损益值,Ei为第i个备选方案Ai的损益期望值。262024/8/3管理决策方法课件5.2 有概率决策问题例例5-9 使用期望值准则对例5-8中的最优方案进行决策。272024/8/3解解 (1)求各方案的期望收益值(2)因为max E1,E2,E3,E4=E3=5720元,所以选择方案A3(每天生产140箱)为最优方案,可获收益期望利润5720元。管理决策方法课件5.2 有概率决策问题在有些实际问题中,为了获得收益,还必须增加一定的投资,而且对不同的备选方案Ai,其所需的投资Qi也不相同。这时,需从投资和收益两个方面综合考虑,这时损益期望值的计算公式应修改为 其中Qi为第i个方案Ai所需的投资额。282024/8/3管理决策方法课件5.2 有概率决策问题5.2.4 5.2.4 最小期望机会损失准则最小期望机会损失准则最小期望机会损失准则以不同方案的期望损失作为择优的标准,选择期望损失最小期望损失最小的方案为最优方案。具体步骤(1)按照无概率决策中的后悔值准则计算不同状态下的各方案的机会损失,得到机会损失值矩阵H=(hij)mn。(2)计算各方案的期望机会损失值Li 令 则方案Ai0即为最优方案。292024/8/3管理决策方法课件5.2 有概率决策问题例例5-10 使用最小期望机会损失准则对例5-8中的最优方案进行决策。302024/8/3解解 (1)计算机会损失值矩阵H(2)分别计算各方案的期望机会损失值(3)因为min L1,L2,L3,L4=L3=580元,所以A3为最优方案。管理决策方法课件5.2 有概率决策问题5.2.5 5.2.5 决策树方法决策树方法把各种备选方案、可能出现的状态和概率以及产生的后果绘制在一张图上,称为决策树。在该图上分别计算出各个备选方案在不同状态下的损益值,通过综合比较做出决策的方法,称为决策树技术。312024/8/3例5-7的决策树表示管理决策方法课件5.2 有概率决策问题具体步骤具体步骤: :画一个方框方框作为出发点,称为决策点决策点。从决策点画出若干条直决策点画出若干条直线或折线线或折线,每条线代表一个行动方案,这样的直(折)线,称为方案枝方案枝。在各方案枝的末端画一个圆圈圆圈,称为状态点状态点,从状态点引出若状态点引出若干条直线或折线干条直线或折线,每条线表示一种状态状态,在线旁边标出每一状态的概率,称为概率枝概率枝。把各方案在各种状态下的损益值损益值标记在概率枝的末端。把计算得到的每个方案的损益期望值标在状态点上,然后,通过比较,选出收益期望值最大(或损失期望值最小)收益期望值最大(或损失期望值最小)的方案作为最优方案最优方案。322024/8/3管理决策方法课件5.2 有概率决策问题5.2.6 5.2.6 序贯决策树序贯决策树决策问题可依据决策者需要作决策的次数,分为单单阶阶决决策策问问题题和序贯决策问题序贯决策问题。单阶决策问题,决策者仅做一次决策,即对应的决策树中只有一个决策点。实际的决策问题往往是一个决策接着一个决策,环环相扣,构成一组序列决策问题,处理这种问题的一种有效方法称作序贯决策树方法序贯决策树方法。在完成整个问题的决策前所需的决策总次数,除了与每次做决策可可选选择择的的行行动动路路径径有关外,还与每次选择一种行动路径后出现的不确定事件结果不确定事件结果有关。332024/8/3管理决策方法课件5.2 有概率决策问题342024/8/3销路好销路好销路差销路差一次性投资一次性投资大规模生产30-550小规模生产10420 表表5-4 方案年赢利与一次性投资表(方案年赢利与一次性投资表(单位:万元单位:万元)状态状态方案方案例例5-8 某厂研制出一种新产品(预计销售生命为7年),并拟定3种备选生产方案。一是大规模生产,二是小规模生产,所需一次性投资额以及以后年盈利见表5-4。估计该产品前两年销路好的概率是0.6;若前两年销路好,则后五年销路好的概率为0.9,否则后五年销路好的概率为0.2。第三种方案是前两年先小规模生产,然后再决定后五年是否追加30万元以便大规模生产。试用决策树方法对该生产问题进行决策管理决策方法课件5.2 有概率决策问题352024/8/3解解 (1)画出问题的决策树管理决策方法课件5.2 有概率决策问题362024/8/3 (2)计算各结点的期望损益值节点5的损益期望值为E(5)=1500.9+(-25)0.1=132.5(万元)同理可计算出结点6-8、结点11-14的期望收益。根据期望值准则,剪掉结点剪掉结点12和和13的分支的分支。结点9的损益期望值为E(9)=132.5-30=102.5(万元)结点10的损益期望值为E(10)=E(14)=26(万元)结点4的损益期望值为E(4)=(102.5+210)0.6+(26+24)0.4=87.1(万元)同理可求得节点2、3的损益期望值分别为115.5万元和53.8万元。管理决策方法课件5.2 有概率决策问题372024/8/3(3)根据计算结果,应选方案三,即前两年先小规模生产,五年后再根据销路情况决定是否追加投资。考虑前期的投资,方案一的损益期望值为115.5-50=65.5万元;方案二的损益期望值为53.8-20=33.8万元;方案三的损益期望值为87.1-20=67.1万元。管理决策方法课件5.3 具有预知信息的决策分析由于无概率决策没有统一的客观标准,给实际应用带来了很大的不便,人们更希望能能够够确确定定自自然然状状态态的的概概率率分分布布,将无概率决策问题转化为概率型决策问题,以便使用期望值准则这个成熟而有效的定量分析方法加以解决。这就需要在决策之前,根根据据历史资料或者经验(即预预知知信信息息)对对自自然然状状态态发发生生的的概概率率进进行行估估计计,从而形成具有预知信息的决策分析问题。382024/8/3管理决策方法课件5.3 具有预知信息的决策分析392024/8/35.3.1 5.3.1 基本问题基本问题例例5-12 A公司拥有某地石油开采权,可自行钻探开采,为此需要花费30万元;也可以租让该地石油开采权给B公司,从而稳得租金10万元。据历史资料统计,在相似地理区域钻探的井中,有7口油井和16口干井,每口油井的收益大约为130万元。试问A公司应该如何决策?在这个问题中,除了给出决策方案、自然状态和不同方案在相应自然状态下的收益之外,还给出了历历史史统统计计资资料料,即预知信息,因此这是一个典型的具有预知信息的决策问题。在解决此类问题之前,首先需要了了解先验概率和信息的价值解先验概率和信息的价值。管理决策方法课件5.3 具有预知信息的决策分析5.3.2 5.3.2 先验概率先验概率在随机事件尚未发生之前,根据经验,对其发生概率做出的评估,称为随机事件的先验概率。先验概率主要包括两类,即统计概率统计概率和主观概率主观概率。统计概率概率l如果决策者对自然状态发生的情况积累了一定的历史资料,而且能够据此统统计计得得出出这些状状态态在在历历史史上上发发生生的的频频率率,并将其近似作为自然状态发生的概率,这样的概率称作统计概率。402024/8/3管理决策方法课件5.3 具有预知信息的决策分析统计概率统计概率设以a1表示A公司“自钻”,a2表示“出租”,s1表示“有油”,s2表示“无油”。根据历史资料统计,在相似地理区“有油”这一状态发生的频率为w(s1)=7/(7+16)0.3,将其近似作为A公司拥有石油开采权的某地“有油”状态发生的概率,即令P(s1)0.3,同理“无油”状态发生时的概率为P(s2)0.7。将此问题用决策表进行表示,根据期望收益值,决策方案为将该地石油开采权出租给B公司,期望获利13万元。412024/8/3s1(有油)s2(无油)一次性投资一次性投资 a1(自钻)100-309 a2(出租)201013(max)概率P (sj)0.30.7a*=a2状态状态方案方案管理决策方法课件5.3 具有预知信息的决策分析主观概率主观概率在实际决策中,对自然状态的发生情况往往缺乏历史资料,这时可以请教有实践经验和专业知识的专专家家来来估估计计这这些些状状态态发发生生的的概概率率,或或者者由由决决策策者者自自己己凭凭经经验验和和直直觉觉来来加加以以估估计计。这样得到的状态概率称为主观概率。主观概率绝非随心所欲的臆测,而是根据人们的经验做科学评估,也具有一定程度的客观性,尤其众多专家共同研究、评估,更是如此。确定主观概率常用的方法是专专家家咨咨询询法法,即征询许多专家的意见并加以分析与综合而定。然而如何征询,如何分析与综合,又有许多不同的具体方法。422024/8/3管理决策方法课件5.3 具有预知信息的决策分析两两比较法两两比较法仅有s1和s2两个状态的情形l首首先先判判断断s1、s2哪哪个个更更有有可可能能发发生生?若认为二者发生的可能性大致相当,则判断结束,有P(s1)= P(s2)=1/2;否则,譬如认为s1比s1更可能发生,则有P(s1)1/2,P(s2)3/4”与与“P(s2)1/4”哪哪个个更更可可能能发生生?若二者发生的可能性差不多,判断结束,有P(s1)=3/4,P(s2)=1/4;否则,如认为后者比前者更可能发生,则有1/2 P(s1)3/4,1/4 P(s2)5/8”与与“P(s2)3/8”哪哪个个更更可可能能发生生?若认为二者发生的可能性差不多,判断结束,有P(s1)=5/8”,“P(s2)=3/8”;否则继续432024/8/3管理决策方法课件5.3 具有预知信息的决策分析两两比较法两两比较法n个状态的情形l首先两两比较、评定,构成概率矩阵概率矩阵其中pij与pji是评估两状态si与sj时所得的概率,有l计算每一状态si的概率优势度概率优势度l计算各状态概率状态概率2024/8/3管理决策方法课件5.3 具有预知信息的决策分析5.3.3 5.3.3 灵敏度分析灵敏度分析通常在决策模型中自然状态的概率和损益值往往由估计或预测得到,不可能十分准确,此外实际情况也在不断地变化,因此需要分析为决策所用的数据可在多大范围内变动,原最优决策方案继续有效。进行这种分析称为灵敏度分析,在这里主要考虑自然状态先验概率的灵敏度分析先验概率的灵敏度分析。452024/8/3管理决策方法课件5.3 具有预知信息的决策分析考虑如下问题:例5-12中,P(s1)在什么范围内变动,才不会改变最优方案a*=a2。l设P(s1)=p,则P(s2)=1-p,可以得到各方案的收益期望值l若要保持最优方案仍为a2,则应有E(a1)E(a2),即l可以求得状态的概率影响范围0p 1/3l这说明当收益值全都保持不变的时候,状态概率P(s1)的取值在0,1/3范围内任意变化,最优决策方案a*=a2。由于当P(s1)1/3时,a*=a2,当P(s1)1/3时,a*=a1,因此,称此概率为状态s1关于方案a1和a2的转折概率。462024/8/3管理决策方法课件5.3 具有预知信息的决策分析转折概率的作用转折概率的作用l衡衡量量一一个个状状态态的的先先验验概概率率是是否否灵灵敏敏的的重重要要标标志志。当一个状态的先验概率临近转折概率时,则它是灵敏的,其取值稍有变化便可能引起最优方案的改变;此时最优方案相对状态概率则是不稳定的,值得进一步分析并且慎重使用。反之,当一个状态的先验概率在其相对影响范围内部临近转折概率时,则它是不灵敏的,此时最优方案相对该状态概率则是比较稳定的。l有有助助于于简简化化决决策策分分析析问问题题。考虑例5-12中的决策问题,假如对该地有油与否没有相似地理区域以往钻探的统计资料,因而需要作出主观评估。譬如假设决策者估计该地有油的概率超过四成,即P(s1)0.41/3,则可以作出决策a*=a2,而无须再评定P(s1)的确切数值,从而简化了决策分析问题。472024/8/3管理决策方法课件5.3 具有预知信息的决策分析5.3.4 5.3.4 信息的价值信息的价值在概率型决策中,除了状态概率之外,人们为了减少风险,降低问题的不确定性,以提高决策的成功率,往往还希望获取关于状态的更多信息,这种信息一般称作补充信息补充信息。而获取补充信息要付出一定代价,为了权衡是否值得付出一定代价去获取补充信息,必须实现对信信息息的的价价值值进进行行评评估估,从而了解哪些信息值得搜集。一般地,补充信息可以分为完完全信息和不完全信息全信息和不完全信息两类。482024/8/3管理决策方法课件5.3 具有预知信息的决策分析完完全全信信息息是指能够完全准确地预报未来发生状态的信息。由此类信息所获得的价值,称为完完全全信信息息价价值值。但在搜集全信息之前并不知道会出现哪种自然状态,因此预先只能计算完完全全信信息息的期望价值的期望价值EVPI(ExpectedValueofPerfectInformation)。当后果指标为收益时,完全信息期望价值等于完全信息条件下的收益期望值减去没有完全信息时的最大收益期望值E*,即当后果指标为损失时,完全信息期望价值为完全信息条件下的损失期望值减去没有完全信息时的最小损失期望值。例5-12中完全信息期望价值EVPI=1000.3+100.713=24(万元)。492024/8/3管理决策方法课件5.3 具有预知信息的决策分析获取完全信息付出的代价,称作完完全全信信息息费费CPI(CostofPerfectInformation),当且仅当EVPICPI时,才值得花费CPI的代价去获取完全信息,这一准则称作EVPI准则准则。完全信息固然可靠,但往往不易获得或得不偿失。如例5-12中,由于只有钻探才能肯定有油与否,而钻探费用为30万元,大于完全信息的价值24万元,所以不值得钻探以获取完全信息。502024/8/3管理决策方法课件5.3 具有预知信息的决策分析5.3.5 5.3.5 贝叶斯决策分析贝叶斯决策分析由于完全信息往往不易获得,在实际中更常用的获取补充信息的方法是试试验验。地质勘探、产品抽样检查等,都是试验的方法。这样获取的信息不能准确预报未来发生的状态,但倘若能够提高收益或者降低损失期望值,则它也是有价值的,这样的信息称作不不完完全全信信息息,其价值称作不不完完全全信信息息价价值值EVII(ExpectedValueofImperfectInformation)在这种情况下,由于需要根据贝叶斯公式来计算状态的后验概率,因而通常称该方法为贝叶斯决策分析方法贝叶斯决策分析方法。512024/8/3管理决策方法课件5.3 具有预知信息的决策分析522024/8/3后验概率计算公式后验概率计算公式设P(sj)(j=1,2,n)为状态sj的先验概率,i(i=1,2,m)为追加信息后结果的一个可能值。则在i发生的条件下,sj发生的后后验概率验概率为管理决策方法课件5.3 具有预知信息的决策分析532024/8/3例例5-13 继续讨论例5-12,假定有一个地质勘探队可以对该地区进行一次地震试验,从而探明其地下结构是封闭结构还是开放结构(注:有油地区多为封闭结构,无油地区多为开放结构)。另据统计,该地质勘探队将有油地区勘探成封闭结构的概率为0.8,把无油地区勘探为开放结构的概率为0.6。地震试验费为5万元,试用贝叶斯分析判断A公司是否应该进行这项试验?解解 设以a3表明进行该项试验,以1、2分别表示试验结果为封闭、开放结构。分别计算各后验概率如下表所示。sj(1)(2)(3)=(1)(2)(4)=(3)/P(i)P(sj)P(1|sj)P(2|sj)P(1sj)P(2sj)P(sj|1)P(sj|2)s10.30.80.20.240.060.24/0.52=0.460.06/0.48=0.125s20.70.40.60.280.420.28/0.52=0.540.42/0.48=0.875P(1)=0.52P(2)=0.48管理决策方法课件5.3 具有预知信息的决策分析根据后验概率,画出该问题的决策树进行地质勘探的收益期望值为20.9万元,而没有不完全信息时的最大收益期望值为13万元,因此不完全信息的价值为20.9-13=7.9万元,而地震试验费用为5万元,所以值得花5万元进行地震试验以获得地质结构的信息。542024/8/3管理决策方法课件5.4 群决策问题552024/8/35.4.1 5.4.1 基本问题基本问题与概念与概念随着社会的发展和科技进步,知识和信息量的增长,需要决决策策的的问问题题越越来来越越多多,也越越来来越越复复杂杂,决策者往往难以单凭自己的经验和智慧来应付所有决策问题,于是产生了各种咨咨询询机机构构和和智智囊囊团团,以便把具有不同知识结构和经验的专家集中在一起,借助众人的智慧以弥补决策者个人才智、经验和精力的不足,这样做综合了多方面的信息和意见综合了多方面的信息和意见,保证了决策的科学化保证了决策的科学化。任何重大的决策都会影响一群人,作为公正、民主的社会,每一项重要决策都应该尽量满足受其影响的群众的愿望和要求,他们的代表组成各种代代表表大大会会和和委委员员会会,任何重要决策都应集中代表大会或委员会中各位成员的意见,并得到大会的批准。除此之外,各级行政管理部门的各种重大问题也应由领导班子集体讨论集体讨论,制定决策、协调行动。管理决策方法课件5.4 群决策问题562024/8/3群决策的概念群决策的概念由于决策过程及其内容的复杂性,要想决策更为科学,必须由若干决策者组成的决策群体进行决策,建立一个由不同知识结构组成的、运用科学理论和方法、可以相互启迪、具有丰富知识的决策群体,这样的决决策策群群体体,在决策理论中称作群群(group),群所作的决策称为群群决决策策(group decision making)。群群决决策策的的定定义义可以表述为:由一定组织形式的群决策成员,面对共同的环境,为解决存在的问题并要达到预定的目标,依赖一定的决策方法和方案集,按照预先制定的协调模式进行的决策活动。管理决策方法课件5.4 群决策问题572024/8/35.4.2 5.4.2 社会选择与投票表决规则社会选择与投票表决规则群决策领域涉及面最广的、最重要的部分是社社会会选选择择问问题题。社会选择就是要根据社会中各成员的价值观和对不同方案的选择产生社会的决策。即要把社会中各成员对各种状况的偏好模式集结成为单一的社会偏好模式。人类社会中的选举问题、相关政策的制定乃至国家政治体制的确定都属于社会选择问题。在人类社会发展过程中采用的社会选择方法主要有传传统统、独独裁裁、投票表决和市场机制投票表决和市场机制。投票表决包括在选票上不反映投票人对候选人(偏好方案)偏好的非非排排序序式式选选举举制制和在选票上反映投票人偏好的排排序序式式选选举举制制。管理决策方法课件5.4 群决策问题582024/8/3一人当选情形一人当选情形计计点点式式选选举举:即每个投票人以无记名投票方式投给自己中意的候选人的选举方式,西方国家的政治选举中通常采用这种方法,该方法适用于两个候选人竞争的场合,最常用的计票方法是简单多数票方法简单多数票方法,即获票较多的候选人当选。 绝绝对对多多数数制制:当候选人多于两个时,有两种选择方法。一是按照得票多少,票数最多者当选,称作相对多数制;二是得票超过半数者能当选,称作绝对多数制。二二次次投投票票法法:在第一次投票后无任何候选人获得半数选票,则应对在第一次投票中得票最多的两个候选人进行二次投票,选出一位得票超过半数的候选人。管理决策方法课件5.4 群决策问题592024/8/3一人当选情形一人当选情形反反复复投投票票法法:该方法对每次投票中候选人的人数不做硬性规定,而希望得票太少的候选人自动退出竞选,或者投票人因自己支持的候选人得票太少,当选无望而支持其他候选人,使得选票向少数候选人集中,反复进行,直到产生某个得票超过半数的候选者为止。取取舍舍表表决决法法:该方法规定第一次投票后无过半数票获得者,则将得票数最少的候选人淘汰掉,对其他候选人进行下一轮投票,反复进行,直到产生过半数候选人为止。申奥城市的产生用的就是这种方法。管理决策方法课件5.4 群决策问题602024/8/3多人当选情形多人当选情形非非转转移移式式投投票票表表决决:种方法规定每个人只有一票,采用无记名式投票,按简单多数法确定当选者,例如要从几个候选人中选出三个当选者,则选择得票数排在前三位的三名候选人当选。复复式式投投票票表表决决:这种方法规定选举中要产生多少当选者,每个投票人就可以投多少张票,但每个候选人只能投一票。该方法的缺陷在于如果选举涉及激烈的党派斗争或路线斗争,则有可能使所有职位都集中于实力较强的某个党派,即使其实力只强一点。因此这种方法只有在存在共同利益的团体和组织内部方可使用。管理决策方法课件5.4 群决策问题612024/8/3多人当选情形多人当选情形受受限限的的投投票票表表决决:这种方法是为了避免复式投票中某个党派独占全部席位提出的。它规定每个投票人可以投的票数必须小于当选人数。累累加加式式投投票票表表决决:该方法规定每个投票人拥有的选票数等于待选席位数,且这些选票可以任意支配,既可以全部投给某一候选人,也可以随意分配给若干候选人。这种方法能给少数派以切实的保护。认认可可选选举举:认可选举法规定只要投票人愿意,他可以投票给尽可能多的候选人,但对每个候选人最多只能投一票。由得票最多的候选人当选。管理决策方法课件5.4 群决策问题622024/8/3多人当选情形多人当选情形 名名单单制制:该方法不是针对候选人投票,而是由各党派或组织提出它的候选人名单,再由投票人对这些名单投票,即投票支持某个政党或组织。最后根据各党派的名单的得票数来分配席位,并按各名单应得席位与名单上候选人的次序确定具体人选。集体的席位分配方法有最大均值法和最大余额法。可可转转移移式式投投票票:该方法常用于36个席位的选举。在每一轮投票中,每个选民只有一票,第一轮投票后统计各候选人得票数,以及定额Q=n/(m+1),其中,n为投票总数,m为要产生的席位数。凡得票数大于Q的候选人均可当选,得票数最少者被淘汰;如有剩余席位,则由未当选的候选人在下一轮投票中竞争,如此继续,直到选出全部席位的当选者为止。管理决策方法课件5.4 群决策问题632024/8/3排序式选举排序式选举非排序式选举方法,并不能可靠地解决两个以上候选人竞争单一职位的问题,有可能导致并不受大部分成员欢迎的候选人当选。因此在投票时,不仅要让投票人表达他最希望看到多个候选人中的哪一个被选上,还应该让投票人表明他对各候选人的偏好次序,这就是排序式选举排序式选举,亦称偏好选举偏好选举。基于社会选择函数的排序式选举方法:Condorcet函函数数和和Borda函数函数等。管理决策方法课件5.4 群决策问题642024/8/3Condorcet函数函数Condorcet提出的社会原则可表述为:在从多个候选人中选择一个时,如果存在某个候选人x,能在与其他候选人逐一比较时按过半数决策规则击败其他所有人,则x称为CondorcetCondorcet候候选选人人,由他当选;如果不存在,则应按照Condorcet函数fc(x)值的大小来排列候选人的优劣次序。fc(x)是x与其他所有候选人逐一比较时,得票最少的那一次的所得票数,即 其中 表示第i个投票人认为x优于y, 表示群中认为 x 优于 y 的成员数,A 表示候选人的集合。管理决策方法课件5.4 群决策问题652024/8/3例例5-14 有60个投票人,对3个候选人进行投票,投票人对各候选人的投票偏好如下表所示。解解 所有候选人成对比较的结果是,出现过半数票的循环。需要采用Condorcet函数,即个体人数偏好顺序23172810由于fc(b)fc(a)fc(c),所以群决策结果为。管理决策方法课件5.4 群决策问题662024/8/3Borda函数函数由投票人根据偏好对各候选人排序,设A中有m个候选人,则将m-1, m-2, , 1, 0分别赋值于排在第一位、第二位、最后位的候选人,然后统计各候选者得分大小,最高分者为获胜者。定义Borda函数为 其中fB(x)是x与其他候选人逐一比较m-1次中所得票数的总和,各候选人按照fB(x)值的大小排序。管理决策方法课件5.4 群决策问题672024/8/3例例5-15 用Borda函数求解例5-14。解解 计算Borda得分,将2,1,0分别赋予排在第一、第二和第三位的候选人,则有 a的Borda得分223+1(2+10)=58 b的Borda得分2(17+2)+1(23+8)=69c的Borda得分2(10+8)+117=53个体人数偏好顺序23172810由于fB(b)fB(a)fB(c),所以群决策结果为。管理决策方法课件5.4 群决策问题682024/8/35.4.3 5.4.3 专家咨询与多目标群决策方法专家咨询与多目标群决策方法在现实生活中,有许多群决策问题,尤其是大型工程技术问题和社会经济问题,开始时并无现成方案可供选择,方案的产生也绝非某个人所能完成,而是需要依靠各有关方面的专家,发挥众人的才智,在决策问题的求解过程中逐步形成各种方案,并在方案的评价过程中不断改进方案,最终做出选择和确定实施办法。在这类问题的求解过程中,专家组成的群通常只是上级行政部门及其主管人员的参谋班子、咨询机构或智囊团,他们的主要作用是为主管部门或主管人员作评价和判断提供咨询意见,最终决策要由主管部门的负责人来做,这类问题称作专专家咨询问题家咨询问题。管理决策方法课件5.4 群决策问题692024/8/3多目标群决策方法多目标群决策方法多目标群决策问题多被用于方案的评价和选择中。对对方方案案评评价价的的实实质质是是决决策策人人对对方方案案偏偏好好的的表表达达。由于群中成员对方案的评价有多项标准(即准则),而各方案又各有优劣,有时总体性能不分上下,这就要用适当的方法根据有关准则进行全面评价,这些准则可以是定量描述,也可以是定性说明这些准则可以是定量描述,也可以是定性说明。一般地,可定量描述的准则可以用赋值、打分或以基数效用函数来评价;而定性的准则只能通过方案的两两比较给出次序关系。因此,多目标群决策方法可以分为基基数数性性方方法法和和序序数性方法。数性方法。管理决策方法课件5.4 群决策问题702024/8/3多目标群决策方法多目标群决策方法设群中共有n个成员,要对m个方案进行评价,评价的准则有p种,每个群成员采用的准则可以相同,也可以不同,群成员i(i=1, n)对各备选方案的评价可以记为 其中 表示群成员i 根据准则l =1,p对候选方案j 的评价;表示群成员i 根据准则l对候选方案 j=1,m的评价。问题的求解是要群成员根据p种不同的准则对各备选方案所作出的评价Ai,i=1,n得到群的评价G。管理决策方法课件5.4 群决策问题712024/8/3无论是基数方法还是序数方法,在对备选方案进行评价时都有两种途径l一致准一致准则法法l个体各自个体各自评价法价法当群成员能够就采用何种评价准则及各准则的权重达成一致意见时可以采用一致准则法,否则采用个体各自评价法,即先由群成员各自对方案的总体优劣做出评价,再集结群中成员的评价形成群的决策。管理决策方法课件5.4 群决策问题722024/8/3一致准则法一致准则法首先从Ai (i=1,,n)得出根据各准则l=1,,p的排序矩排序矩阵其中的元素表示第i个群成员根据准则l对备选方案j的评价,与Ai中的值相同。根据,计算各群成员对各备选方案在准则l时的Borda得分,并计算备选方案j的总得分bjl管理决策方法课件5.4 群决策问题732024/8/3由bjl (j=1,m)的大小,可以确定各备选方案优劣次序k (k=1,m),并定义一致性矩阵,是一个mm的非负矩阵,其中的元素为,根据bjl备选方案j被排在k位时=1,否则=0,所以中每行(或每列)有且仅有一个元素为1,余者为0。设准则的权向量为 ,且计算群的加权一致性矩阵加权一致性矩阵G=gjk,其中管理决策方法课件5.4 群决策问题742024/8/3求解如下指派问题求解如下指派问题(*),获得备选方案j的排序若xjk=1,则表示候选对象j应排在第k位。管理决策方法课件5.4 群决策问题752024/8/3例例5-16 某企业为拓展市场,提出了5种方案分别为a1,a2,a3,a4和a5。6位不同部门的经理根据准则C1,C2和C3对这5种方案进行了排序,所得排序矩阵如下。试求群对各方案的排序。管理决策方法课件5.4 群决策问题762024/8/3解解 以上述矩阵为基础,每个准则Cl对应有一个矩阵Bl,由此可得Borda得分矩阵和总得分。对准则C1,有由可得Borda得分矩阵B总得分为管理决策方法课件5.4 群决策问题772024/8/3根据得分最高的方案最优排在首位的原则,由准则C1,各方案的群的排序是根据准则C2,各方案的排序是,由于a3,a4的Borda总分均为7,所以方案无差异,可令管理决策方法课件5.4 群决策问题782024/8/3根据准则C3,各方案的排序是,所以加权一致性矩阵为管理决策方法课件5.4 群决策问题792024/8/3设6位经理协商后同意取W=(0.28,0.32,0.4),则将加权一致性矩阵中的数据代入指派问题(*),可以解得群对各方案的排序为管理决策方法课件5.4 群决策问题802024/8/3个体各自评价法个体各自评价法首 先 由 群 成 员 i根 据 准 则 l (l=1,p),对各备选方案排序,得到Ai,并求出i的权向量Wi,由Ai和Wi计算算i的的加加权一一致致性性矩矩阵求解指派问题若,则表示成员i将备选对象j排在第k位。用以上方法求出成员i=1,n对各备选对象的排序后,再用Borda等方法集结各个成员的意见,形成群的排序。管理决策方法课件5.4 群决策问题812024/8/3例例5-17 根据例5-16的排序矩阵,使用个体各自评价法求解群对各方案的排序。解解 由已知设W1=(0.2,0.3,0.5),则加加权一致性矩一致性矩阵F1为管理决策方法课件5.4 群决策问题822024/8/3由此求得经理1对方案的排序是;同样,若经理2的权向量为W2=(0.4,0.3,0.3),各方案的排序为若经理3的权向量为W3=(0.2,0.4,0.4),各方案的排序为若经理4的权向量为W4=(0.3,0.3,0.4),各方案的排序为若经理5的权向量为W5=(1/3,1/3,1/3),各方案的排序为若经理6的权向量为W6=(0.3,0.2,0.5),各方案的排序为管理决策方法课件5.4 群决策问题832024/8/3群组的优先序矩阵群组的优先序矩阵为相应的相应的Borda得分得分为因此,群对备选方案的综合排序为:管理决策方法课件5.5 对策问题对策论(GameTheory)又被称为博博弈弈论论,它是运筹学的一个重要分支,主要研究具有竞争或者对抗性质的现象和规律,在经济学、政治科学、军事科学、进化生物学以及当代的计算机科学等领域中有广泛的应用。对策论就是研究对策行为中斗争各方是是否否存存在在着着最最合合理理的的行行动动方方案案,以及如如何何找找到到这个合理的行动方案的数学理论和方法。842024/8/3管理决策方法课件5.5 对策问题852024/8/3例例5-18 齐王与田忌赛马齐王与田忌赛马:战国时期,齐王与大将田忌商议赛马,双方约定:l(1)各自出上、中、下三种等级的马各一匹;l(2)每次比赛双方各处一匹马,共举行三场比赛;l(3)每匹马只参加一次比赛;l(4) 输者每输一场要付给胜者黄金一千两。由于田忌的马比齐王同等级的马都要略逊一筹,在头一轮的比赛中,双方都是用同等级的马进行对抗,所以齐王很快赢了全部三场,得到了三千两黄金。鉴于第一次赛马的惨败,所以当齐王再次邀请田忌赛马时,田忌感到很为难。田忌的军师孙膑是位颇有才能的军事家,他得知后,便为田忌出了一个计策:用自己的下等马和齐王的上等马比赛,而用自己的上等马和齐王的中等马比赛,用自己的中等马和齐王的下等马比赛。在第二轮比赛中,田忌依计而行,结果一负两胜,净赢千金。管理决策方法课件5.5 对策问题862024/8/35.5.1 5.5.1 基本概念基本概念对策模型的基本要素对策模型的基本要素l局局中中人人:参与竞争或对抗的各方,他们参与对策并有切身利益关系与决策权。如例5-18中的齐王与田忌各为竞争的一方,可分别称其为局中人甲与局中人乙。l策策略略:局中人选择对付其它局中人的行动方案称为策策略略。一个策略必须是局中人在一场竞争活动中,自始至终所应采取的全部行动的一套完整方案。某局中人的所有可能策略全体称为策策略略集集。在一局对策中,每个局中人从其策略集中各取出一个策略参与对策,这些策略合起来称为一个局势局势。管理决策方法课件5.5 对策问题872024/8/3对策模型的基本要素对策模型的基本要素在例5-18中,田忌共有(上,中,下),(上,下,中),(中,上,下),(中,下,上),(下,上,中),(下,中,上)六个策略,这六个策略的全体即为田忌的策略集。类似地,齐王也有六个策略。例5-18中,田忌取策略(下,上,中),齐王取策略(上,中,下),这就构成一个局势(下,上,中),(上,中,下)。得失得失:一个局势决定了各局中人的对策结果。一局对策的结果称为得失。如例5-18中,田忌赢得一千金,齐王损失一千金。每个局中人的得失是全体局中人所取定的一组策略(即局势)的函数,称为支付函数或赢得函数支付函数或赢得函数。管理决策方法课件5.5 对策问题882024/8/3对策的分类对策的分类按局中人的数目多少来分,可以分为二人对策和多人对策按策略的数目是否有限来分,可以分为有限对策和无限对策按支付函数的特点来分,可以分为零和对策与非零和对策按局中人参与对策时相互之间的关系来分,可以分为主从对策与平等对策在多人对策中,还可以分为结盟对策与不结盟对策按数学模型的性质来分,可分为矩阵对策、微分对策和树图对策等管理决策方法课件5.5 对策问题892024/8/35.5.2 5.5.2 矩阵对策问题建模与求解矩阵对策问题建模与求解基本模型基本模型l设G为一对策模型,以甲方、乙方表示两个局中人,以 , 分别表示甲方、乙方 的策略集,则S1和S2可构成mn个局势(i,j)。l以aij表示局势(i,j)的赢得,则甲方的赢得矩阵为l局中人乙的赢得矩阵为B=-A,则称G为一矩阵对策模型,记为G=S1, S2; A。 管理决策方法课件5.5 对策问题902024/8/3在例5-18中,设以 表示田忌的策略集, 表示齐王的策略集,其中则田忌的赢得表得表为 123456131111121311113113111411131151111316111113齐王齐王田忌田忌管理决策方法课件5.5 对策问题912024/8/3因此,田忌的赢得矩阵赢得矩阵为故 齐 王 与 田 忌 赛 马 问 题 的 基 本 模 型 可 表 示 为 G=S1, S2; A 其中田忌是甲方,齐王是乙方。管理决策方法课件5.5 对策问题922024/8/3最优纯策略最优纯策略例例5-19 设已知矩阵对策G=S1,S2;A,其中S1=1,2,3,S2=1,2,3,局中人甲的赢得矩阵为A,其对应的赢得表为表5-9。123min1316-62426310312-12max106乙乙甲甲表表5-9管理决策方法课件5.5 对策问题932024/8/3最优纯策略分析最优纯策略分析:l若局中人甲要获取最大赢得10,则需采取策略3;但局中人乙会采取策略3对付3。l若局中人甲知道局中人乙会采取策略3,则会采取策略2对付3l若局中人甲采取策略2,则乙会采取策略2;l若局中人甲知道局中人乙会采取策略2,则甲仍然会采取策略2此时,2和2就是甲、乙方的最优策略或最稳妥策略。123min1316-62426310312-12max106乙乙甲甲管理决策方法课件5.5 对策问题942024/8/3设矩阵对策模型G=S1,S2;A,其中S1=1,2,m,S2=1,2,n,若 则称值VG为对策G的最最优值,局势(i*,j*)称为对策G在纯策略意义下的解或鞍点解或鞍点,i*和j*分别称为局中人甲、乙的最最优 纯策略策略。考虑例5-18,根据田忌的赢得矩阵,易知 因此例5-18在纯策略意义下无解。管理决策方法课件5.5 对策问题952024/8/3鞍点存在定理鞍点存在定理l矩阵对策G=S1,S2;A在纯策略意义下有解(鞍点)的充要条件是:存存在在一一个个局局势势(i*, j*),使得对任任意意的的i、j,都有成立管理决策方法课件5.5 对策问题962024/8/3混合策略混合策略例例5-20 设设矩阵对策G=S1,S2;A, S1=1,2,S2=1,2。局中人甲的赢得矩阵为 ,讨论矩阵对策的解分析分析:由于 ,因而对策G没有鞍点,即 在纯策略意义下,没有解。由于不存在最优纯策略,各局中人的决策总有一定的风险,且不能被对方猜中。因此每个局中人决策时,不是决定用哪个纯策略,而是决定以多大概率选取每个纯策略。这就是“混合策略”的概念。管理决策方法课件5.5 对策问题972024/8/3在例5-20中,假定局中人甲以概率x选取纯策略1,以概率1-x选取2;局中人乙以概率y选取纯策略1,以概率1-y选取2。于是局中人甲的期望赢得甲的期望赢得为由上式可知,当x=3/4时,E=35/4,即当局中人甲以概率3/4选取纯策略1时,他的期望赢得至少是35/4。而对于局中人乙来说,最稳妥的办法是取y=1/8,从而使局中人甲的赢得最多为35/4。综上,当X*=(3/4,1/4)T, Y*=(1/8,7/8)T时,双方都会取得满意的结果。管理决策方法课件5.5 对策问题设矩阵对策模型G=S1,S2;A,其中S1=1,2,m,S2=1,2,n,A=(aij)mn。设局中人甲以概率xi选取纯策略i, xi满足0 xi1,;局中人乙以概率yj选取纯策略j, yj 满足0 yj1,。令X=(x1,x2,xm)T,Y=(y1,y2,yn)T分别表示m维和n维概率向量。我们称X(或Y)为局中人甲(或乙)的混混合合策策略略;称(X,Y)为一个混混合合局局势势;称E(X,Y)=XTAY为局中人甲的期望赢得期望赢得管理决策方法课件5.5 对策问题992024/8/3【定理定理】任何矩阵对策G=S1,S2;A在混合策略意义下一定有解。不等式组的解分别是局中人甲、乙的最优混合策略。管理决策方法课件5.5 对策问题1002024/8/3若v0,作变换,则由式*得到对局中人甲来说,总希望对策值v越大越好;而对于局中人乙来说,总希望对策值v越小越好。因此,求求局局中中人人甲甲、乙乙的的最最优优混混合策略可化为求解如下的两个线性规划问题合策略可化为求解如下的两个线性规划问题。管理决策方法课件5.5 对策问题1012024/8/3而。由于任何矩阵对策在混合策略意义下一定有解,所以上述两个线性规划问题一定有解。如果它们无解,说明v的假设错了,这时应该令v0,并适当修改以上线性规划问题,再求解即可。管理决策方法课件5.5 对策问题1022024/8/3例例5-21 设矩阵对策G=S1,S2;A,其中,求对策G的解与值。解解 利用单纯形法求解如下两个线性规划问题可得最优解 为对策G的值。所以对策G的解为管理决策方法课件5.5 对策问题1032024/8/35.5.3 5.5.3 二人无限零和对策问题建模二人无限零和对策问题建模矩阵对策(二人有限零和对策)最简单的一种推广就是将局中人的策略集从有限集变为无限集策略集从有限集变为无限集。例如,一艘潜艇要从A港航行到B港,航行过程中至少要露出水面换气一次。敌方飞机在航线上监视潜艇活动。这时,潜艇需要考虑在航线AB间的什么地方露出水面换气而不被敌机侦察到。因航线AB间的点是无限多的,所以潜艇、飞机可采取的策略都是无限多的。管理决策方法课件5.5 对策问题1042024/8/3最优纯策略最优纯策略二人无限零和对策的基本模型记为G=S1,S2,H,其中局中人甲的策略集S1和局中人乙的策略集S2中至少有一个是无限集合, H为局中人甲的赢得函数。若存在*S1,*S2,满足记,则称VG为对策G的值,称使上式成立的(*, *)为G在纯策略意义下的解,把*、*分别称为甲 方、乙方的最优纯策略。【定定理理】(*, *)为G=S1,S2,H在纯策略意义下的解的充要条件是:对任意的S1和任意的S2,都有管理决策方法课件5.5 对策问题1052024/8/3例例5-22 设设甲方、乙方相互独立地从区间0,1中分别选择一个实数x和y,甲方的赢得函数为。甲方希望H越大越好,而乙方则希望H越小越好。试求解该对策问题。解解 画出函数H(x,y)的等值线,如图。通过分析该图不难看出,对策双方的平衡局势(最优纯局势)为(x*,y*)=(1,1),即x*=1,y*=1分别为甲、乙方的最优纯策略,而对策值VG= H(x*,y*)。管理决策方法课件5.5 对策问题1062024/8/3混合策略混合策略二人无限零和对策G=S1,S2,H在纯策略意义下有解的情形比较少见,所以同矩阵对策一样,也需考虑混合策略问题。为简化研讨,一般可考虑S1=S2=0,1,且H(x,y)为连续函数的情形。这类对策又称为(单位正方形上的)连续对策连续对策。若用x,y表示纯策略,用FX(x)、FY(y)表示混合策略X和Y的分布函数,则甲方的赢得函数为记分别表示甲方、乙方的对策值,其中D为0,1区间上的分布函数集合。可以证明,对对任任何何连连续续对对策策,一一定定有有v1=v2,即即连连续续对对策策在在混混合策略意义下一定有解。合策略意义下一定有解。管理决策方法课件5.5 对策问题1072024/8/35.5.45.5.4 二人有限非零和对策问题建模二人有限非零和对策问题建模基本模型基本模型l在二人有限对策中,若甲乙双方的赢得总和不全为零,则称为二人有限非零和对策二人有限非零和对策。l设S1=1,2,m,S2=1,2,n分别表示甲方和乙方的策略集;A=(aij)mn和B=(bij)mn分别甲方和乙方的赢得矩阵,其中aij和bij分别为甲方、乙方关于局势(i,j)的赢得。l记(A,B)= (aij,bij)mn为双元矩阵,则二人有限非零和对策的基本模型记为G=S1,S2,(A,B),又称作双双矩矩阵阵对策对策,这种对策,对策双方可能合作共赢对策双方可能合作共赢。l显然,当A=-B时,双矩阵对策就转化为矩阵对策。管理决策方法课件5.5 对策问题1082024/8/3基本思路基本思路例例5-23 囚囚徒徒困困境境:甲、乙两人因涉嫌同一桩罪行而被警察逮捕,并隔离审讯。警方的政策是“坦白从宽,抗拒从严”:若两人都坦白则各判刑8年;若一人坦白而另一人抵赖,则坦白者被释放,而抵赖者被判刑10年;若两人都抵赖,则因大多罪责缺乏证据而各判刑年。则甲、乙两人应如何决策? 解解 本例的局中人甲、乙两人都有两个策略,即坦白和抵赖,其赢得矩阵分别表示如下:显然,A+ B0,因此,本例是一个双矩阵对策问题。管理决策方法课件5.5 对策问题1092024/8/3囚徒困境问题的双元矩阵决策表如下表所示按照亚当斯密的理论,每一个人都是“理性的经济人”,都会从利己的目的出发进行选择。因此甲乙都会这样剖析本案:l假如对方坦白,自己若抵赖,则被判刑10年,而自己坦白会被判刑8年,所以坦白比抵赖好;l假如对方抵赖,自己若坦白,则会被释放,自己若抵赖,则会被判刑1年,所以也是坦白为好。l综上,不管对方坦白与否,自己都当选择坦白。最终两人都选最终两人都选择了坦白,结果都被判刑择了坦白,结果都被判刑8年年。 乙乙甲甲坦白坦白抵赖抵赖坦白坦白(8,8)(0,10)抵赖抵赖(10,0)(1,1)管理决策方法课件5.5 对策问题1102024/8/3纳什均衡纳什均衡在“囚徒困境”典例中,甲、乙两人都选择“坦白”策略所构成的这一局势,反映出参与对策的各方均能自觉接受的一种利益均衡状态,由于这一“均衡”本质属性是由美国人约翰纳什所揭示,故命名为纳纳什什均均衡衡(Nash equilibrium),又称为非合作均衡非合作均衡。在一局二人有限非零和对策中,无论对方的策略如何选择,本方都会选择某个确定的策略,则该策略被称为支配性策略。而由双方各自的支配性策略所构成的这个局势,就被定义为纳纳什什均衡均衡。在实际应用中,纳什均衡局势常被称作纳什均衡解纳什均衡局势常被称作纳什均衡解。管理决策方法课件5.5 对策问题1112024/8/3纳什均衡纳什均衡更一般而言,纳纳什什均均衡衡系系由由所所有有局局中中人人的的单单方方最最优优策策略略所所组组成成,即在其他各方策略都不变的情况下,没有任何一方会有积极性选择其它策略,因为这不会使本方获得更大利益,却可能适得其反,从而没有任何一方会积极打破这种均衡。纳什均衡理论蕴涵着一个深刻的哲理,就是个个体体理理性性与与集集体体理理性性的的矛矛盾盾。即,对每个局中人而言均为个体理性的选择,但对于整个集体来说却是不理性的决策。反之,整个集体理性的选择,由于并非每个个体的理性决策,因此若无强制有效约束措施,个体绝不会自觉遵守。 经济学上的应用:同同一一行行业业中中不不同同企企业业之之间间的的价价格格竞竞争争、公公共商品的供给,以及贸易自由与贸易壁垒问题共商品的供给,以及贸易自由与贸易壁垒问题。管理决策方法课件5.5 对策问题1122024/8/3例例5-24 智智猪猪博博弈弈:猪圈里有一头大猪、一头小猪。猪圈的一端有猪食槽,另一端安装着控制猪食供应的开关,按启开关就会有10个单位的猪食进槽,但凡按启开关都须付出2个单位的成本。若大猪先到槽边,大、小猪获得食物的收益比是9:1;同时到槽边,收益比是7:3;小猪先到槽边,收益比是6:4。试求纳什均衡解。解解 先建立双元矩阵决策表(下表)。表中第一格表示两头猪同时按启开关,因而同时走到猪食槽前,大猪获食7个单位,小猪获食3个单位,扣除2个单位的成本,其赢得分别为5和1,其它情形依此类推。 按启按启等待等待按启按启(5,1)(4,4)等待等待(9,-1)(0,0)大猪大猪小猪小猪管理决策方法课件5.5 对策问题1132024/8/3现求本例的纳什均衡解。首先注意到,不论大猪选择“按启”还是“等待”,小小猪猪的的最最优优决决策策均均是是选选择择“等等待待”。既定小猪最优决策为“等待”,大大猪猪的的最最优优决决策策只只能能是是选选择择“按按启启”。所以,本本例例的的纳纳什什均均衡衡解解就就是是:大大猪猪按按启启,小猪等待,各得小猪等待,各得4个单位食物,多劳者不多得个单位食物,多劳者不多得。 这个典例的纳什均衡解适用许多同类实际对策。譬如在在股股票票市市场场上上炒炒股股票票,有大户,也有小户,大户类似“大猪”,小户类似“小猪”。恰如“智猪博弈”,“炒股”的纳什均衡解为:对小户而言,最优决策是选择“跟大户”;而大户则必须自己搜集信息,进行分析与抉择。这已是不争的历史事实并成为股市新手的借鉴经验。 管理决策方法课件5.5 对策问题1142024/8/3标号法步骤标号法步骤考察甲方的赢得,对应乙方每一个给定的策略,都找出甲甲方方的的最大赢得值并标上记号最大赢得值并标上记号。用类似的方法考察,找出乙方的每个最大赢得值并标号乙方的每个最大赢得值并标号。逐一观察每个元素(aij,bij),而双双标标号号元元素素(aij*,bij*)对对应的局势就是一个纳什均衡解应的局势就是一个纳什均衡解。管理决策方法课件5.5 对策问题1152024/8/3例例5-25 已知双矩阵对策问题,见下表。试求纳什均衡解。解解 考察甲方的赢得:对应乙方的三个不同策略L、C、R,找出甲方相应的最大赢得值,并画圈分别标记。 LCRU(0,4)(4,0)(5,3)M(4,0)(0,4)(5,3)D(3,5)(3,5)(6,6)甲甲乙乙 LCRU(0,4)(,0)(5,3)M(,0)(0,4)(5,3)D(3,5)(3,5)(,6)甲甲乙乙管理决策方法课件5.5 对策问题1162024/8/3考察乙方的赢得:对应甲方的三个不同策略U、M、D,找出乙方相应的最大赢得值,并且分别画圈。观察上表,双标号元素(,)对应的局势(D,R)就就是是本本例的纳什均衡解例的纳什均衡解。 LCRU(0,)(,0)(5,3)M(,0)(0,)(5,3)D(3,5)(3,5)(,)甲甲乙乙管理决策方法课件5.5 对策问题1172024/8/35.5.55.5.5 多人对策问题建模多人对策问题建模多人非合作对策多人非合作对策l多人非合作对策,是指多个局中人之间互不合作,对策略的选择不允许事先有任何交换信息的行为,不允许订立任何约定。矩阵对策就是一种非合作对策矩阵对策就是一种非合作对策。 l一一般般模模型型记记为为G = ( S1, ,S2, , , ,Sn; u1, , u2, , , , un ),其中,1)局中人集合为I=1,2,n,n3;2)每个局中人的策略集Si均为有限集;3)局势s=(s1,s2, ,sn)S1S2Sn;4)每个局中人i的赢得函数为ui=ui(si,s-i),其中s-i=(s1,si-1,si+1,sn)表示由除了局中人i之外的所有局中人的策略组成的向量。管理决策方法课件5.5 对策问题1182024/8/3n人非合作对策人非合作对策纳什均衡纳什均衡l设有G = (S1,S2,Sn;u1, u2, un ),若存在s1* S1,s2* S2, sn* Sn,对局中人的任一策略si Si,(i=1,2, ,n ),都有则称为对策对策G的纳什均衡解的纳什均衡解,为局中人1,2, ,n的纳什均衡策略。l根据理性人假设,当其他人选定策略 后 ,局中人i选定的策略 应是其策略集Si中的最优策略。ln人非合作对策在纯策略意义下的纳什均衡解不一定存在。但是,可以证明, n人人非非合合作作对对策策在在混混合合策策略略意意义义下的纳什均衡解一定存在下的纳什均衡解一定存在。管理决策方法课件5.5 对策问题1192024/8/3多人合作对策多人合作对策l合合作作对对策策的的基基本本特特征征是参加对策的局中人可以进行充分的合作,即可以事先商定好,把各自的策略协调起来,并在对策后对所获赢得进行重新分配。l合合作作的的形形式式是所有局中人可以形成若干联盟,每个局中人仅参加一个联盟,联盟所得要在联盟的所有成员中进行重新分配。l在合作对策中,需要研究的重要问题是:如如何何形形成成联联盟盟,以及联盟的赢得如何合理分配(即如何维持联盟)以及联盟的赢得如何合理分配(即如何维持联盟)?管理决策方法课件5.5 对策问题1202024/8/3多人合作对策多人合作对策模型模型l构成合作对策的两个基本要素为局中人集合I和特征函数v(S)I=1,2, ,n;S为I 的任一子集,即任何一个可能形成的联盟;v(S)表示联盟S在对策中的赢得,又称之为联盟S的价值。它表示联盟S中的成员无需求助于S之外的局中人就能得到的可转让赢得的总量。l因此,可将合作对策模型表示为G=I,v。管理决策方法课件5.5 对策问题1212024/8/3例例5-26 有3个局中人,每人各提出一个3人分配3万元的分配方案。试按以下几种情况分别探讨合作对策模型:(1)若3人方案一致,则通过,并成为实际分配方案;(2)只要局中人1和2两人方案一致,就可以成为实际分配方案;(3)只要任何两人一致,就可以成为实际分配方案。解解 (1)合作对策模型为 及 (2)合作对策模型为 及管理决策方法课件5.5 对策问题1222024/8/3例例5-26 有3个局中人,每人各提出一个3人分配3万元的分配方案。试按以下几种情况分别探讨合作对策模型:(1)若3人方案一致,则通过,并成为实际分配方案;(2)只要局中人1和2两人方案一致,就可以成为实际分配方案;(3)只要任何两人一致,就可以成为实际分配方案。解解 (3)合作对策模型为 及管理决策方法课件5.5 对策问题1232024/8/3例例5-27 n个人组成的寻宝探险队在一个山洞里面找到一批宝物,每件价值为1个货币单位,每件要两人合作才能运回。对应的可转让赢得的合作对策模型为G=I,v,其中其中|s|表示联盟 中的成员个数。设以n维向量 表示联盟赢得的一个分配方案,其中xi表示联盟成员iI的分配所得,若X满足下列条件: 则称X是合作对策G=I,v的一个可行解一个可行解。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号