资源预览内容
第1页 / 共53页
第2页 / 共53页
第3页 / 共53页
第4页 / 共53页
第5页 / 共53页
第6页 / 共53页
第7页 / 共53页
第8页 / 共53页
第9页 / 共53页
第10页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章 完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,主要内容,2.1基本分析思路和方法 2.2纳什均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展,2.1 基本分析思路和方法,2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法,2.1.1 上策均衡,上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 上策均衡不是普遍存在的,2.1.2 严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略 严格下策反复消去法:,注意 :这种消去法既可以在同一个博弈方的策略空间反复使用,也可以在各个博弈方的策略空间上交叉使用,只要各博弈方还有严格下策,就可以继续,严格下策消去法的缺陷:由于博弈方之间的策略存在一定的依存关系,所以往往不存在绝对的优劣关系,只存在相对的,有条件的优劣关系,因此,严格下策消去法有时候就无法应用。 例如:石头剪子布,猜硬币等,2.1.3 划线法,由于博弈策略的相互依存性,没绝对的优劣性,所以一般我们需要先找出自己针对其他博弈方的每种策略或策略组合的最佳对策,即自己的可选策略中与其他博弈方的策略组合配合能给自己带来最大的得益的策略。然后在此基础上,通过对其他博弈方和自己的策略的判断,预测博弈的可能结果和确定自己的最优策略。,情侣博弈与纳什均衡,博弈论,例如:,(拳击,拳击)、(时装,时装)都是由具有相对优势的策略构成的均衡,称为纳什均衡。,*,在纳什均衡中,每个局中人的策略都是针对其他局中人策略的最佳策略。纳什均衡是非合作博弈理论中最重要的一个均衡概念。,在纳什均衡策略组合下,任何一个局中人都不会单独改变自己的策略,或者说都不愿意单独偏离这个均衡。,这意味着当出现的策略组合不是纳什均衡时,至少有一个局中人会感到后悔。,寻找纳什均衡划线法,博弈论,例如:情侣博弈,例如:囚徒困境,当某一个格里的两个数字都有下划线时,说明其对应的策略分别是两个人都愿意选的,都是应对对手的最佳策略,所以构成纳什均衡。,情侣博弈有两个纳什均衡,囚徒困境博弈只有一个纳什均衡。,上策均衡一定是纳什均衡,但纳什均衡不一定是上策均衡。,*,寻找纳什均衡划线法,博弈论,例如:,*,策略组合(A,X)、(A,Y)、(B,X)结果都是(0,0),但是(A,Y)和(B,X)都不是纳什均衡,只有(A,X)是纳什均衡。(B,Y)也是纳什均衡。,划线法:通过每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”,优点:划线法简单易操作,具有普遍性,缺点:许多博弈存在不确定性的结果,就没法用这种方法找出均衡结果,2.1.4 箭头法,箭头法思路:对博弈中的每个策略组合进行分析,考察每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。,箭头法:通过反应各博弈方选择倾向的箭头,寻找博弈中具有稳定性策略组合的方法,2.2 纳什均衡,2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法,2.2.1 纳什均衡的定义,策略空间: 博弈方 的第 个策略: 博弈方 的得益: 博弈: 纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,2.2.2 纳什均衡的一致预测性质,一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果 只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能,纳什均衡的特性,博弈论,纳什均衡的力量来源于其一致预测性和稳定性。 若所有局中人都预测一个特定的博弈结果会出现,而且都不会利用这种预测能力选择与预测结果不一致的策略,即没有哪个局中人有偏离这个预测结果的愿望,因此这个预测结果最终会成为博弈的结果,这种特性称为一致预测性。 注意,这里所说的一致性是指各局中人的实际行为选择与他们的预测一致,而不是指各局中人的预测或选择一致、无差异。 在具有一致预测性的均衡之下,局中人的决策具有稳定性和自我强制性。,*,因此,在假设各局中人都有完全理性时,即不会犯错误的情况下,不可能预测任何非纳什均衡是博弈的结果。虽然不能保证人们不犯错误,但是不能因为无法保证人们不犯错误而舍弃纳什均衡概念。,纳什均衡的特性,博弈论,最后的归宿博弈说明,纳什均衡具有很好的稳定性。,纳什均衡也可以理解为是这样一种策略组合,这种组合由所有局中人的最优策略组成。即给定其他人策略的情况下,没有任何一个局中人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡,或者说纳什均衡是一种僵局,给定别人不动的情况下,没有人有兴趣动。,如果谁想偏离纳什均衡另搞一套,利益角逐的最终结果,还是会回到纳什均衡的位置。,*,2.2.3 纳什均衡与严格下策反复消去法,上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡 命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡。 命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2.3 无限策略分析和反应函数,2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性,2.3.1 古诺的寡头模型,寡头产量竞争以两厂商产量竞争为例,得出纳什均衡为:,从效率评价来看: 即,如果两厂商合作的话,获得的利润更大。,两寡头间的囚徒困境博弈,以自身最大利益为目标,各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5,2.3.2 反应函数,古诺模型的反应函数:厂商1 的最佳对策产量计算公式,是厂商2的一个连续函数。称这个连续函数为厂商1对厂商2 的一个反应函数。,理性局限和古诺调整,2.3.3 伯特兰德寡头模型,伯特兰德模型各厂商选择的是价格而不是产量 产品无差别,有很强的替代性,但也不是完全替代 消费者对价格不十分敏感,2.3.4 公共资源问题,公共草地养羊问题,以三农户为例 n=3,c=4。得出 从公共资源的效率评价:得出 这个例子再次说明:纳什均衡或者非合作博弈的结果有可能是低效率的。,竞争:个体利益最大化,合作:总体利益最大化,2.3.5 反应函数的问题和局限性,在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。 即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。,2.4 混合策略和混合策略纳什均衡,2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数,2.4.1 严格竞争博弈和混合策略的引进,一、猜硬币博弈,1.此博弈为严格竞争博弈,以前的方法求不出均衡结果 2.该硬币方要想胜出,需要采用随机方法决定出正面还是反面。假设盖硬币方出正面的概率为p,则只有当p=1/2时,才不会让对方占到任何便宜,(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念,二、混合策略、混合策略博弈 和混合策略纳什均衡,混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,三、数值例子,该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析,策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6,解决该例子的原则 1.不能让对方猜到自己的选择 2.他们选择每种策略的概率一定要使对方无机可乘,四、齐威王田忌赛马,经计算,齐威王和田忌都已1/6的相同概率随机选择的六个纯策略,构成了此博弈的唯一混合策略纳什均衡。在上述混合策略下,齐威王的得益是1,田忌的期望是-1,五、小偷和守卫的博弈,加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,2.4.2 多重均衡博弈和混合策略,一、夫妻之争的混合策略纳什均衡,夫妻之争博弈的混合策略纳什均衡 策略 得益 博弈方1 (0.75,0.25) 0.67 博弈方2 (1/3,2/3) 0.75,不难发现,这个结果不如夫妻双方交流协商时,任何一方迁就对方时都得到至少1收益,都比现在的收益大。,二、制式问题,制式问题混合策略纳什均衡 A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296,从这个结果可以看出,两博弈采取不相互协调,各自独立选择的制式也是不理想的。因为经过协调之后采取任何一个纯策略均衡的得益都比混合期望的高。,三、市场机会博弈,进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0,此例说明,纯粹的市场竞争并不一定是高效率的,在市场竞争中结合一定的协调机制,包括某种利益的补偿,可能会更有效率,2.4.3 混合策略和严格下策反复消去法,在包括混合策略的情况下,关于严格下策反复消去法的结论仍然是成立的。 1.任何博弈方都不会采用任何严格下策,不管他们是纯策略还是混合策略 2. 严格下策反复消去法不会消去任何纳什均衡 3.如果经过反复消去后留下的策略组合是唯一的 因此在混合策略的情况下,仍然可以严格下策反复消去法进行分析,此博弈不存在严格下策。但是如果我们允许博弈方1采取混合策略,设博弈方以概率分布(1/2,1/2,0),即各有一半机会选择U,M不选D.,由于此时的得益是大于1,由于双方是风险中性的,所有(1/2,1/2,0)是严格下策。此时再按严格下策反复消去法就可以到一个均衡(3,3).,2.4.4 混合策略反应函数,猜硬币博弈,反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反应函数构成的函数。在混合策略里,博弈方的选择范围为选择的概率分布。 反应函数即一方对另一方的概率分布的反应,夫妻之争博弈,夫妻之争博弈的混合策略
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号