资源预览内容
第1页 / 共26页
第2页 / 共26页
第3页 / 共26页
第4页 / 共26页
第5页 / 共26页
第6页 / 共26页
第7页 / 共26页
第8页 / 共26页
第9页 / 共26页
第10页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第四章第四章 重复博弈重复博弈 本章介绍基本博弈重复进行构成的重复博本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。整个重复博弈过程作为整体进行研究。复旦大学经济博弈论课件本章分三节本章分三节4.1 4.1 重复博弈引论重复博弈引论4.2 4.2 有限次重复博弈有限次重复博弈4.3 4.3 无限次重复博弈无限次重复博弈复旦大学经济博弈论课件4.1 重复博弈引论重复博弈引论4.1.1 4.1.1 为何研究重复博弈为何研究重复博弈4.1.2 4.1.2 基本概念基本概念复旦大学经济博弈论课件4.1.1 4.1.1 为何研究重复博弈为何研究重复博弈n经济中的长期关系经济中的长期关系n人们的预见性人们的预见性n未来利益对当前行为的制约未来利益对当前行为的制约n长期合同、回头客、长客和一次性买卖长期合同、回头客、长客和一次性买卖的区别的区别n有无确定的结束时间有无确定的结束时间复旦大学经济博弈论课件4.1.2 基本概念基本概念n有限次重复博弈:给定一个基本博弈有限次重复博弈:给定一个基本博弈G G(可以是静态博(可以是静态博弈,也可以是动态博弈),重复进行弈,也可以是动态博弈),重复进行T T次次G G,并且在每,并且在每次重复次重复G G之前各博弈方都能观察到以前博弈的结果,这之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为样的博弈过程称为“G“G的的T T次重复博弈次重复博弈”,记为,记为G(T)G(T)。而而G G则称为则称为G(T)G(T)的的“原博弈原博弈”。G(T)G(T)中的每次重复称为中的每次重复称为G(T)G(T)的一个的一个“阶段阶段”。n无限次重复博弈:一个基本博弈无限次重复博弈:一个基本博弈G G一直重复博弈下去的一直重复博弈下去的博弈,记为博弈,记为G( )G( )n策略:博弈方在每个阶段针对每种情况如何行为的计策略:博弈方在每个阶段针对每种情况如何行为的计划划n子博弈:从某个阶段(不包括第一阶段)开始,包括子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分此后所有的重复博弈部分n均衡路径:由每个阶段博弈方的行为组合串联而成均衡路径:由每个阶段博弈方的行为组合串联而成复旦大学经济博弈论课件重复博弈的得益重复博弈的得益复旦大学经济博弈论课件4.2 4.2 有限次重复博弈有限次重复博弈4.2.1 4.2.1 两人零和博弈的有限次重复博弈两人零和博弈的有限次重复博弈4.2.24.2.2唯一纯策略纳什均衡博弈唯一纯策略纳什均衡博弈 的有限次重复博弈的有限次重复博弈4.2.34.2.3多个纯策略纳什均衡博弈多个纯策略纳什均衡博弈 的有限次重复博弈的有限次重复博弈4.2.4 4.2.4 有限次重复博弈的民间定理有限次重复博弈的民间定理复旦大学经济博弈论课件4.2.1 两人零和博弈的有限次重复博弈n零和博弈是严格竞争的,重复博弈并零和博弈是严格竞争的,重复博弈并不改变这一点。不改变这一点。n以零和博弈为原博弈的有限次重复博以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。博弈中的纳什均衡策略。复旦大学经济博弈论课件4.2.24.2.2唯一纯策略纳什均衡博弈的唯一纯策略纳什均衡博弈的 有限次重复博弈有限次重复博弈n定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。-5,-50,-8-8,0-1,-1坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-5,-5)-10,-10-13,-5-5,-13-6,-6坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-10,-10)复旦大学经济博弈论课件有限次重复削价竞争博弈有限次重复削价竞争博弈100,10020,150150,2070,70高 价低 价高价低价寡头寡头2寡寡头头1削价竞争博弈有唯一纯策略纳什均衡(70,70)有限次重复的结果仍然是(低价,低价)复旦大学经济博弈论课件4.2.34.2.3多个纯策略纳什均衡博弈的多个纯策略纳什均衡博弈的 有限次重复博弈有限次重复博弈5,53,32,00,22,06,00,20,61,1HMH厂商厂商2ML厂厂商商1L三价博弈2,23,13,11,34,47,11,31,78,8厂厂商商1厂商厂商2LMHHML两次重复三价博弈的等价模型触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复博弈方博弈方1 1:第一次选:第一次选H H;如第一次结果为;如第一次结果为(H,H)(H,H),则第二次选,则第二次选M M,否则选,否则选L L博弈方博弈方2 2:同博弈方:同博弈方1 1复旦大学经济博弈论课件两市场博弈的重复博弈(重复两次)两市场博弈的重复博弈(重复两次)n(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1)(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1)n连续两次采用混合策略连续两次采用混合策略(2,2)(2,2)n(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)轮轮换策略换策略n一次纯策略一次纯策略+ +一次混合策略一次混合策略(1.5,3)(3,1.5)(1.5,3)(3,1.5)0,04,11,43,3厂厂商商1厂商厂商2BAAB两市场博弈复旦大学经济博弈论课件重复博弈不同策略、均衡及一次性博弈得益比较重复博弈不同策略、均衡及一次性博弈得益比较n不同策略组合、均衡得益图示厂商2得益厂商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)复旦大学经济博弈论课件4.2.4 有限次重复博弈的民间定理n个体理性得益:不管其它博弈方的个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最只要自己采取某种特定的策略,最低限度保证能获得的得益低限度保证能获得的得益n可实现得益:博弈中所有纯策略组可实现得益:博弈中所有纯策略组合得益的加权平均数组合得益的加权平均数组n定理:设原博弈的一次性博弈有均定理:设原博弈的一次性博弈有均衡得益数组优于衡得益数组优于w w,那么在该博弈,那么在该博弈的多次重复中所有不小于个体理性的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均子博弈完美纳什均衡的极限的平均得益来实现它们得益来实现它们厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)复旦大学经济博弈论课件4.3 无限次重复博弈4.3.1 4.3.1 两人零和博弈的无限次重复博弈两人零和博弈的无限次重复博弈4.3.2 4.3.2 唯一纯策略纳什均衡博弈唯一纯策略纳什均衡博弈 的无限次重复博弈的无限次重复博弈4.3.3 4.3.3 无限次重复古诺模型无限次重复古诺模型4.3.4 4.3.4 有效工资率有效工资率复旦大学经济博弈论课件4.3.1 4.3.1 两人零和博弈的无限次重复博弈两人零和博弈的无限次重复博弈n两人零和博弈无限次重复的所有阶段都两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡博弈的混合策略纳什均衡复旦大学经济博弈论课件4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈两寡头削价竞争博弈 该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈4,40,55,01,1HLHL复旦大学经济博弈论课件无限次重复两寡头削价博弈 触发策略:第一阶段采用触发策略:第一阶段采用H H,如果前,如果前t-1t-1阶段的结果阶段的结果都是都是(H,H)(H,H),则继续采用,则继续采用H H,否则采用,否则采用L L。 如果博弈方如果博弈方2 2采用采用L L,总得益现值为,总得益现值为 如果博弈方如果博弈方2 2采用采用H H,总得益现值为,总得益现值为 因此当因此当 时,此触发策略纳什均衡策略时,此触发策略纳什均衡策略复旦大学经济博弈论课件两寡头削价竞争无限次重复博弈的民间定理两寡头削价竞争无限次重复博弈的民间定理厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)(5,0)(5,0)复旦大学经济博弈论课件4.3.3 无限次重复古诺模型 假定:假定: ,边际成本都为,边际成本都为2。 在无限次重复古诺模型中,当贴现率在无限次重复古诺模型中,当贴现率 满足一定条件满足一定条件时,两厂商采用下列触发策略构成一个子博弈完美纳什均时,两厂商采用下列触发策略构成一个子博弈完美纳什均衡:衡: 在第一阶段生产垄断产量的一半在第一阶段生产垄断产量的一半1.5;在第;在第 t 阶段,如阶段,如果前果前 t-1 阶段结果都是阶段结果都是(1.5,1.5),则继续生产,则继续生产1.5,否则,否则生产古诺产量生产古诺产量2。 复旦大学经济博弈论课件 设厂商设厂商1已采用该触发策略,若厂商已采用该触发策略,若厂商2也采用该触发策也采用该触发策略,则每期得益略,则每期得益4.5,无限次重复博弈总得益的现值为:,无限次重复博弈总得益的现值为: 如果厂商如果厂商2偏离上述触发策略,则他在第一阶段所选偏离上述触发策略,则他在第一阶段所选产量应为给定厂商产量应为给定厂商1产量为产量为1.5时,自己的最大利润产量,时,自己的最大利润产量,即满足:即满足: 解得解得 ,此时利润为,此时利润为5.0625,高于触发策略,高于触发策略第一阶段得益第一阶段得益4.5。复旦大学经济博弈论课件 但从第二阶段开始,厂商但从第二阶段开始,厂商1 1将报复性地永远采用古诺将报复性地永远采用古诺产量产量2 2,这样厂商,这样厂商2 2也被迫永远采用古诺产量,从此得利润也被迫永远采用古诺产量,从此得利润4 4。因此,无限次重复博弈第一阶段偏离的情况下总得益的现因此,无限次重复博弈第一阶段偏离的情况下总得益的现值为:值为: 当当 上述策略是厂商上述策略是厂商2 2对厂商对厂商1 1的同样触发策略的最佳反应,的同样触发策略的最佳反应,否则偏离是最佳反应。否则偏离是最佳反应。 复旦大学经济博弈论课件4.3.4 有效工资率模型设定模型设定: 首先厂商选择工资率为 ,然后工人选择接受或拒绝。如果拒绝,则他作个体户得到收入 小于 ,如果接受 ,则工人选择努力工作(负效用 )还是偷懒(无负效用)。 厂商只能看到产量高低,高产量为 ,低产量0。 工人努力工作时一定是高产量 ,不努力时却并不一定是0,而是高产量 的概率为 ,低产量0的概率为 。 工人努力工作时,厂商得益为 ,工人得益为 ; 工人偷懒时,厂商期望得益为 ,工人得益为 。复旦大学经济博弈论课件考虑如下的触发策略考虑如下的触发策略: 厂商在第一阶段给工资率厂商在第一阶段给工资率 ,在第,在第t阶段,如果前面阶段,如果前面t-1阶段结果都是阶段结果都是 则继续给则继续给 ,否则从此永远是,否则从此永远是 。 工人的策略是如果工人的策略是如果 则接受,否则宁愿作个体则接受,否则宁愿作个体户得到户得到 ,并在以前各期结果都是,并在以前各期结果都是 和当前工资率和当前工资率为为 时努力工作,否则偷懒。时努力工作,否则偷懒。 设厂商已采用上述触发策略。由于设厂商已采用上述触发策略。由于 ,工人接受,工人接受工作是最佳反应。用工作是最佳反应。用 记工人努力工作时无限次重复博记工人努力工作时无限次重复博弈得益的现值,则弈得益的现值,则 即即复旦大学经济博弈论课件 用用 记工人选偷懒时无限重复博弈得益的现值,则:记工人选偷懒时无限重复博弈得益的现值,则: 即即 因此当因此当 即即时,努力是工人的最佳选择。时,努力是工人的最佳选择。 反过来,设工人已采用上述触发策略。若厂商给的工资反过来,设工人已采用上述触发策略。若厂商给的工资率满足上式条件,并且威胁一旦产量降低就解雇工人,则各率满足上式条件,并且威胁一旦产量降低就解雇工人,则各阶段的得益为阶段的得益为 ,无限次重复博弈得益现值为,无限次重复博弈得益现值为 。若不愿给。若不愿给 ,则解雇工人,以后得益为,则解雇工人,以后得益为0。因此只要因此只要 ,厂商选择前述触发策略就是最佳反应。,厂商选择前述触发策略就是最佳反应。 复旦大学经济博弈论课件 综上所述,在满足综上所述,在满足的条件下,双方的触发策略构成一个纳什均衡。而上述两式的条件下,双方的触发策略构成一个纳什均衡。而上述两式实际上意味着实际上意味着即工人努力的产出扣除努力负效用后的剩余,必须不小于工即工人努力的产出扣除努力负效用后的剩余,必须不小于工人作个体户的收入即机会成本,加上一定比例的取决于努力人作个体户的收入即机会成本,加上一定比例的取决于努力负效用、贴现系数和偷懒可能得高产量概率的附加部分。负效用、贴现系数和偷懒可能得高产量概率的附加部分。 最后这个不等式正是存在有效工资率,工作激励有效的基最后这个不等式正是存在有效工资率,工作激励有效的基本条件。本条件。复旦大学经济博弈论课件
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号