资源预览内容
第1页 / 共63页
第2页 / 共63页
第3页 / 共63页
第4页 / 共63页
第5页 / 共63页
第6页 / 共63页
第7页 / 共63页
第8页 / 共63页
第9页 / 共63页
第10页 / 共63页
亲,该文档总共63页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第三章第三章 完全信息动态搏弈完全信息动态搏弈 - -子博弈精炼纳什均衡子博弈精炼纳什均衡n一一 博弈扩展式表述博弈扩展式表述n二二 扩展式表述博弈的纳什均衡扩展式表述博弈的纳什均衡n三三 子博弈精练纳什均衡子博弈精练纳什均衡子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况多个参与人的情况蜈蚣博弈蜈蚣博弈n四四 重复博弈和无名氏定理重复博弈和无名氏定理n五五 应用举例应用举例逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向归纳法要求逆向归纳法要求“所有参与人是理性的所有参与人是理性的”是是所有参与人的共同知识。因此,在所有参与人的共同知识。因此,在有多个参与人有多个参与人或或每个参与人有多次行动机会每个参与人有多次行动机会的情况下,逆向归的情况下,逆向归纳法的结果可能并非如此。纳法的结果可能并非如此。多个参与人的情况多个参与人的情况(2,2)如果如果n很小,逆向很小,逆向归纳法的结果归纳法的结果逆向归纳法与子搏弈精练纳什均衡的存在问题n如果如果n n很大,结果又如何呢?很大,结果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多个参与人的情况多个参与人的情况(2,2)如果如果n很大很大 对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p=1/2,则无限次重复博弈的纳什均衡为: 厂商从生产高质量的产品厂商从生产高质量的产品开始,继续生产高质量的产品,开始,继续生产高质量的产品,除非曾经生产过低质量产品,除非曾经生产过低质量产品,如果上一次生产了低质量的产如果上一次生产了低质量的产品,之后永远生产低质量的产品,之后永远生产低质量的产品。品。 第一个消费者选择购买,第一个消费者选择购买,只要厂商不曾生产过低质量的只要厂商不曾生产过低质量的产品,随后消费者继续购买,产品,随后消费者继续购买,如果厂商曾件生产过低质量的如果厂商曾件生产过低质量的产品,之后消费者不再购买。产品,之后消费者不再购买。重复博弈的均衡结果贴现因子:下一期的一单位支付在这一期的价值。重复博弈和无名氏定理n参与人不固定时的重复博弈1,1-1,20,00,0厂商厂商消费者消费者购买购买不不购买购买高质量高质量低低质量质量质量博弈质量博弈 厂商:如果生产低质量的产品,得到的短期利润是2,但之后每阶段利润为0,如果总是生产高质量的产品,每阶段得到1单位利润,贴现值为1/(1- ) =2,厂商将不会生产低质量产品。害怕失掉消费者。 消费者: =1/2,其只关心1阶段的支付,只有当预期高质量时,才会购买。消费者预期不曾生产过低质量产品的厂商将继续生产高质量产品,故选择购买,反之亦然厂商生产过高质量的产品.重复博弈的均衡结果 克莱因等认为这个例子可以解释为什么消费者偏好去大商店购买东西而不信赖走街串巷的小商贩。 西蒙等用类似博弈解释雇佣关系,认为,企业存在的原因之一正式创造一个“长期的参与人”,这样一个参与人由于对未来利益的考虑而更讲信用。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一一 博弈扩展式表述博弈扩展式表述n二二 扩展式表述博弈的纳什均衡扩展式表述博弈的纳什均衡n三三 子博弈精练纳什均衡子博弈精练纳什均衡n四四 重复博弈重复博弈n五五 应用举例应用举例斯坦克尔伯的寡头竞争模型斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型轮流出价的讨价还价模型囚徒的救赎囚徒的救赎旅行者困境旅行者困境n斯坦克尔伯的寡头竞争模型企业1企业2v参与人:企业参与人:企业1 1、企业、企业2 2;v行动顺序:企业行动顺序:企业1 1先选择产量先选择产量q q1 1,企业企业2 2观测到观测到q q1 1,然后选然后选 择自己的产量择自己的产量q q2 2。v支付:支付: 利润,利润是两个企业产量的函数利润,利润是两个企业产量的函数n斯坦克尔伯的寡头竞争模型nqi :第i个企业的产量nC:代表单位不变成本n假定逆需求函数为:n第i个企业的利润函数为:企业1企业2斯坦克尔伯的寡头竞争模型n用你向归纳法求解,首先考虑给定q1的情况下,企业2的最优选择。企业2的问题是:最优化一阶条件意味着:因为企业1预测到企业2将根据S2(q1)来选择q2,企业1在第1阶段的问题是:n均衡结果比较垄断情况下库诺特寡头竞争模型斯坦克尔伯寡头竞争模型产量A:A:B:B:总产量利润A:A:B:B:总利润斯坦克尔伯的寡头竞争模型n从上述计算可以看出:n斯坦克尔伯的均衡总产量大于库诺特均衡总产量,企业1的斯坦克尔伯的均衡产量大于库诺特均衡产量,企业2的斯坦克尔伯的均衡产量小于库诺特均衡产量。同样,企业1在斯坦克尔伯博弈中的利润大于在库诺特博弈中的利润,企业2的利润却有所下降,这就是所谓的“先动优势”。n 拥有信息优势可能使参与人处于劣势。企业1先行动的承诺价值 :企业1之所以获得斯坦克尔伯利润而不是库诺特利润,是因为它的产品一旦生产出来就变成了一种积淀成本,无法改变,从而使企业2不得不承认它的威胁是可置信的。而假如企业1只是宣布了它将生产 ,企业2是不会相信她的威胁的。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一一 博弈扩展式表述博弈扩展式表述n二二 扩展式表述博弈的纳什均衡扩展式表述博弈的纳什均衡n三三 子博弈精练纳什均衡子博弈精练纳什均衡n四四 重复博弈重复博弈n五五 应用举例应用举例斯坦克尔伯的寡头竞争模型斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型轮流出价的讨价还价模型囚徒的救赎囚徒的救赎旅行者困境旅行者困境轮流出价的讨价还价模型n分蛋糕的动态博弈n游戏规则:第一轮由第一个参与人(小鹃)提出条件,第二个参与人小明可以接受,从而游戏结束,也可以不接受,则游戏进入第二轮;小明提出条件,小鹃可以接受,从而结束游戏,也可以不接受,从而进入第三轮;蛋糕融化呈线性,游戏结束,蛋糕融化n第一种情况:假设博弈只有一步,小鹃提出分配方案,如果小明同意,两个人按照约定分蛋糕,如果小明不同意,两人什么也得不到。结果会怎样?轮流出价的讨价还价模型n第二种情况:桌上放了一个冰淇淋蛋糕,但两轮谈判过后,蛋糕将完全融化。博弈结果如何?n第三种情况:桌上的冰淇淋蛋糕在三轮谈判后将完全融化,结果又如何?n第四种情况:桌上的冰淇淋蛋糕在四轮谈判后将完全融化,或者在五轮谈判、六轮,100轮谈判后将完全融化,结果又如何? 博弈的结果是:假如“轮数”是偶数,双方各得一半,假若轮数是奇数,则小鹃得到(n+1)/2n;小明得到(n-1)/(2n)第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈n五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型囚徒的救赎旅行者困境囚徒的救赎n好莱圬大片肖申克的救赎是一部很好看的电影,主要内容是一个被冤屈的囚犯如何凭着坚定的信念和聪明才智逃出牢房。我们的“囚犯”也可以通过好的策略合作,摆脱“困境”的诅咒。囚徒的救赎-一报还一报一报还一报能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。如果重复博弈多次,就有报复的机会,这种惩罚的规则是:人家对你怎么做,你就对他怎么做,如果他上次背叛了你,你这次背叛他,如果上次他与你合作,你这次就选择与他合作。艾克谢罗德认为,一报还一报体现了这个策略符合四个优点:清晰、善意、报复性和宽恕性。这一法则不会引发作弊,所以是善意的;它不会让作弊者逍遥法外,所以是报复的;它不会长时间怀恨在心,只要作弊者改正,就愿意恢复合作,所以是宽恕的。一报还一报从自己的不可欺负性得到好处,还放弃了占他人便宜的可能性囚徒的救赎n重复囚徒困境的几个建议:n1、不要嫉妒n2、不要首先背叛n3、对合作和背叛都要给予回报n4、不要耍小聪明第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈n五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型囚徒的救赎旅行者困境旅行者困境-做人不要太精明n哈佛大学巴罗教授:n两个旅行者从一个以生产细瓷花瓶闻名的地方旅行回来,在提取行李的时候,发现花瓶被摔坏了,就向航空公司索赔。航空公司知道花瓶的价格大概杂八、九十元,但不知道他们购买的确切价格。因此航空公司请两位旅客在100元以内写出花瓶的价格,如果两个人写得一样,就按照写的数额赔偿,如果不一样,原则上按照低的价格赔偿,并认为该旅客讲了真话,奖励2元,而讲假话的罚款2元。n这个博弈的最终结果将是什么?旅行者困境n一位富翁的狗在散步时跑丢了,于是他急匆匆到电视台发了一则启示:有狗丢失,归还者得酬金1万元,并附有狗的彩照。一个乞丐看到广告后,第二天一大早就报着狗准备去领酬金,当他经过一家大商店的墙体屏幕时,发现酬金涨到了3万元,乞丐又折回住处,把狗重新栓在那里,在接下来的几天里,乞丐从来没有离开过这只大屏幕,当酬金涨到使全市居民感到惊讶时,乞丐返回他的住处,可是那只狗已经死了-在这个世界上,金钱一旦被作为筹码,就不会再买到任何东西。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n练习练习: :n参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%,支付函数为:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述:(1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策;(4),同(3),但妻子先决策,丈夫后决策.作业n强盗分赃(向前展望,倒后推理)有5个强盗抢得10枚硬币,在如何分赃上争论不休,于是他们决定:(1)抽签决定个人的号码(1,2,3,4,5)(2)由1号提出分配方案,然后5人表决,如果方案超过半数同于就通过,否则他被扔进大海喂鲨鱼;(3)1号死后,2号提方案,4人表决,当且仅当超过半数同意时方案通过,否则2号被扔进大海;(4)依次类推,知道找到一个每个人都接受的方案(当然,如果只剩5号,他独吞)n结果会如何?作业强盗1234501001000098011970120970102
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号