资源预览内容
第1页 / 共26页
第2页 / 共26页
第3页 / 共26页
第4页 / 共26页
第5页 / 共26页
第6页 / 共26页
第7页 / 共26页
第8页 / 共26页
第9页 / 共26页
第10页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
策略性博弈与纳什 均衡 张涵 本章要点 博弈论理论背景 博弈论中的几个基本概念 策略博弈与占优 最优反应与纳什均衡 混合策略与最大最小(max min)策略 理论背景 传统微观经济学中的完全竞争市场假设 寡头市场上企业间的产量博弈和价格博弈 诺依曼与摩根斯坦的博弈论与经济行为 塔克的“囚徒困境” 纳什均衡 基本概念 游戏者(players):博弈中的游戏者是作决 策的个人。 行动或步骤 行动集:游戏者的行动集合(action set)记 为A i =a i ,是该游戏可能采取的全部行动 之集合。 基本概念 行动组合:一个行动组合是一个有序集a = a i (i=1,2,n),是由一个博弈中几个游戏者各采取 一个行动而组成的。它实质上是博弈中的某一个 解。 游戏的顺序(order of play)它是指在什么时候该 谁下棋?可分为“同时”(Simultaneously)与“序列” (Sequential)。“同时”是指游戏者同时决定自己 的行动,“序列”需明确谁先行,谁后走。 基本概念 信息集(information set)是指在博弈的某一时点 上关于不同变量的取值的全部知识之和。 游戏者的策略(Players Strategy) 策略:即按什么规则到行动集中去选择行动。 策略集或策略空间(Players Strategy or Strategy Space):S i 是游戏I所有策略的集合。 基本概念 策略组合(Strategy Combination):S= (S1,S2,Sn)。 游戏者的收益(Players Payoff) payoff 是指(1)在所有别的游戏者选择了 策略之后,并在老天(自然)选择以后,进 行了博弈之后,带给游戏者的效用;(2) 或是由游戏者与别的游戏者选择的策略的函 数带给游戏者的预期效用。 基本概念 结果(out come) 均衡(equilibrium) 博弈均衡,记为S*=(S1*,S2*,Sn*), 是博弈中几个游戏者各自都采取了其最优策 略而产生的一个策略组合。由均衡所产生的 结果叫均衡结果。 策略博弈与占优 策略博弈的定义 策略博弈又称标准型博弈(normal form game),该博弈由三个要素构成: 游戏者名单(a list of players);每个 游戏者的策略单(a list of strategies for i);每一策略组合所对应的收益单(a list of payoff)。 策略博弈与占优 例2:石头、布、剪刀的博弈 这是一个“零和博弈”。 策略博弈与占优 占优(dominance) 在非协同博弈里,有两种解的技术:一种是 占优解,一种是均衡解(又称纳什均衡Nash epulibrium)这里先分析占优解。 例4,考虑由表10.4 所给出的策略型博弈, 可以看出:无论B 会选择U 还是V,对于A来 说,选择Y 总比选择X 好。我们称X被Y占优 了,而Y 是占优于X。 策略博弈与占优 策略博弈与占优 经过推理,博弈的结果是(Y,V)。 我们把以上A排除X 的过程叫做“简单占优”,即只 排除一次。一旦在第一个游戏者排除了一个策略之 后,一个或几个策略会在此基础上相继被排除掉, 则称占优过程为“相继占优”(successive dominance),或“重叠占优”(iterated dominance)。上例中,(Y,V)就是重叠占优得 到的。而在表10.4 左图中,只有“简单占优”,我们 无法预测博弈的最终结果。 最优反应与纳什均衡 在博弈中,占优只给我们带来极少的分析结果。 在博弈理论的文献里,最典型的方法是纳什 (Nash)均衡分析。 最优反应(best response) “所有别的游戏者的策略”的表述 对于某一策略组合S=(S1,S2Si, Si+1Sn),记S-i=(S1,S2,Si1, Si+1,Sn)为所有别的游戏者的策略,即一个策 略组合中去掉第i 个游戏者的所选策略。 最优反应与纳什均衡 最优反应的定义 给定S-i,游戏者的最优反应记为Si*,是指能 给他带来最大收益的策略,即 (10.2) 如(10.2)式为严格不等式,则“最优反应” 为严格的最优反应。 最优反应与纳什均衡 纳什均衡 纳什均衡的定义 一个策略组合S* =(S 1*, S 2*, , S n *)被 称为纳什均衡,如果别的游戏者不背离这一 组合,就没有人会背离他自己的最优反应 Si*,换言之,对于所有的i (10.3) 最优反应与纳什均衡 这就是说,当参与博弈的每一个游戏者都发挥了自 己的最优反应策略时,并且这些最优反应形成一个 组合,便形成了纳什均衡。可见,古诺均衡是一个 纳什均衡。 纳什均衡的另一种表达式 若记B (S-i)为给定S-i 时游戏者i 的最优反应集,显 然Nash 均衡是一个策略组合S* =(S 1*, S 2*, , S n*) ,使得S i * B i(S- i * ) ,对所有游戏者i。 这实质上启示我们如何找Nash均衡。 最优反应与纳什均衡 举例:囚犯的困境中的纳什均衡 纳什均衡不唯一的例证 性别的冲突 Nash 均衡两个:(拳击、拳击),(芭蕾,芭蕾),说明:两个在 如何协调上存在冲突,但毕竟合作比分裂对各方都好。 混合策略与 最大最小(max min)策略 定义:对于游戏者i,其一个混合策略是一个 概率密度函数i: SiR ,使得对于所有 的s i Si,都有i (s i ) 0,且 i(s i ) = 1 对于i来说,所有的i的集合记为M i= i 混合策略与 最大最小(max min)策略 混合策略纳什均衡:如果对于博弈中所有的 游戏者i,对于所有的iMi,都有U i (* ) U i(i*, -i* ),则称*为一个混合策 略的纳什均衡。 定理:如果*是一个混合策略的纳什均 衡,则对于具有i给定的正概率的每一个策 略si S i ,都有U i (* ) = U i (si, -i* ) 混合策略与 最大最小(max min)策略 该实例告诉我们求混合纳什均衡的方法。 例7,考虑下列博弈: 纯战略的纳什均衡为(U,L)与(D,R)。 以下求混合策略的纳什均衡。 混合策略与 最大最小(max min)策略 若B选择L的概率为q,选择R的概率为1q;则A 的收益应满足 2q0(1q)=0q(1q)1 (10.7) 若A选择U 的概率为P,选D的概率为1P,则B 的 收益应满足 1P0(1P)(1P)2 (10.8) 可求得q=1/3,P=2/3。 因此,A=(2/3,1/3) 与B=(1/3,2/3)便是一个 混合的纳什均衡 最大最小化策略 (max min strategy) 最大最小化策略 (max min strategy) 如果B 是以损害A 为目标,则B 知道A 会选 择“下”时,会故意选择“左”,尽管B 这样做自 己并没有什么好处,但B 达到了损害A 最厉 害的目标。A 如果估计到这一可能性,则还 是保守一点为妙,即“两害之间取其较好的” 策略。即“最大最小策略”。 最大最小化策略 (max min strategy) A首先考虑,如选“上”,min1,1=1,如选 “下”,min-1000,2= -1000,A的决策是从 两个坏结果中挑一个相对好的结果。所以, A会选择“上”。 如果B仍想以损害A为目标,这时便不可能得 逞,只好选择“右”。结果是(上,右)。 最大最小化策略 (max min strategy) A如选择maxmin策略,结果不是“收益极大 化”,但却确保了“风险极小化”,所以 maxmin 策略又称为保守策略。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号