策略性博弈与纳什均衡-

策略性博弈与纳什均衡张涵本章要点博弈论理论背景博弈论中的几个基本概念策略博弈与占优最优反应与纳什均衡混合策略与最大最小（max min）策略理论背景传统微观经济学中的完全竞争市场假设寡头市场上企业间的产量博弈和价格博弈诺依曼与摩根斯坦的博弈论与经济行为塔克的“囚徒困境” 纳什均衡基本概念游戏者（players）：博弈中的游戏者是作决策的个人。行动或步骤行动集：游戏者的行动集合（action set）记为A i =a i ，是该游戏可能采取的全部行动之集合。基本概念行动组合：一个行动组合是一个有序集a = a i （i=1,2,n），是由一个博弈中几个游戏者各采取一个行动而组成的。它实质上是博弈中的某一个解。游戏的顺序（order of play）它是指在什么时候该谁下棋？可分为“同时”（Simultaneously）与“序列” （Sequential）。“同时”是指游戏者同时决定自己的行动，“序列”需明确谁先行，谁后走。基本概念信息集（information set）是指在博弈的某一时点上关于不同变量的取值的全部知识之和。游戏者的策略（Players Strategy）策略：即按什么规则到行动集中去选择行动。策略集或策略空间（Players Strategy or Strategy Space）：S i 是游戏I所有策略的集合。基本概念策略组合（Strategy Combination）：S= （S1，S2，Sn）。游戏者的收益（Players Payoff） payoff 是指（1）在所有别的游戏者选择了策略之后，并在老天（自然）选择以后，进行了博弈之后，带给游戏者的效用；（2）或是由游戏者与别的游戏者选择的策略的函数带给游戏者的预期效用。基本概念结果（out come）均衡（equilibrium）博弈均衡，记为S*=（S1*，S2*，Sn*），是博弈中几个游戏者各自都采取了其最优策略而产生的一个策略组合。由均衡所产生的结果叫均衡结果。策略博弈与占优策略博弈的定义策略博弈又称标准型博弈（normal form game），该博弈由三个要素构成：游戏者名单（a list of players）；每个游戏者的策略单（a list of strategies for i）；每一策略组合所对应的收益单（a list of payoff）。策略博弈与占优例2：石头、布、剪刀的博弈这是一个“零和博弈”。策略博弈与占优占优（dominance）在非协同博弈里，有两种解的技术：一种是占优解，一种是均衡解（又称纳什均衡Nash epulibrium）这里先分析占优解。例4，考虑由表10.4 所给出的策略型博弈，可以看出：无论B 会选择U 还是V，对于A来说，选择Y 总比选择X 好。我们称X被Y占优了，而Y 是占优于X。策略博弈与占优策略博弈与占优经过推理，博弈的结果是（Y，V）。我们把以上A排除X 的过程叫做“简单占优”，即只排除一次。一旦在第一个游戏者排除了一个策略之后，一个或几个策略会在此基础上相继被排除掉，则称占优过程为“相继占优”（successive dominance），或“重叠占优”（iterated dominance）。上例中，（Y,V）就是重叠占优得到的。而在表10.4 左图中，只有“简单占优”，我们无法预测博弈的最终结果。最优反应与纳什均衡在博弈中，占优只给我们带来极少的分析结果。在博弈理论的文献里，最典型的方法是纳什（Nash）均衡分析。最优反应（best response） “所有别的游戏者的策略”的表述对于某一策略组合S=（S1，S2Si， Si+1Sn），记S-i=(S1，S2，Si1， Si+1，Sn)为所有别的游戏者的策略，即一个策略组合中去掉第i 个游戏者的所选策略。最优反应与纳什均衡最优反应的定义给定S-i，游戏者的最优反应记为Si*，是指能给他带来最大收益的策略，即（10.2）如（10.2）式为严格不等式，则“最优反应” 为严格的最优反应。最优反应与纳什均衡纳什均衡纳什均衡的定义一个策略组合S* =(S 1*, S 2*, , S n *)被称为纳什均衡，如果别的游戏者不背离这一组合，就没有人会背离他自己的最优反应 Si*，换言之，对于所有的i （10.3）最优反应与纳什均衡这就是说，当参与博弈的每一个游戏者都发挥了自己的最优反应策略时，并且这些最优反应形成一个组合，便形成了纳什均衡。可见，古诺均衡是一个纳什均衡。纳什均衡的另一种表达式若记B (S-i)为给定S-i 时游戏者i 的最优反应集，显然Nash 均衡是一个策略组合S* =(S 1*, S 2*, , S n*) ，使得S i * B i(S- i * ) ，对所有游戏者i。这实质上启示我们如何找Nash均衡。最优反应与纳什均衡举例：囚犯的困境中的纳什均衡纳什均衡不唯一的例证性别的冲突 Nash 均衡两个：（拳击、拳击），（芭蕾，芭蕾），说明：两个在如何协调上存在冲突，但毕竟合作比分裂对各方都好。混合策略与最大最小（max min）策略定义：对于游戏者i，其一个混合策略是一个概率密度函数i： SiR ，使得对于所有的s i Si，都有i (s i ) 0，且 i(s i ) = 1 对于i来说，所有的i的集合记为M i= i 混合策略与最大最小（max min）策略混合策略纳什均衡：如果对于博弈中所有的游戏者i，对于所有的iMi，都有U i (* ) U i(i*, -i* )，则称*为一个混合策略的纳什均衡。定理：如果*是一个混合策略的纳什均衡，则对于具有i给定的正概率的每一个策略si S i ，都有U i (* ) = U i (si, -i* ) 混合策略与最大最小（max min）策略该实例告诉我们求混合纳什均衡的方法。例7，考虑下列博弈：纯战略的纳什均衡为（U,L）与（D，R）。以下求混合策略的纳什均衡。混合策略与最大最小（max min）策略若B选择L的概率为q，选择R的概率为1q；则A 的收益应满足 2q0(1q)=0q(1q)1 （10.7）若A选择U 的概率为P，选D的概率为1P，则B 的收益应满足 1P0（1P）（1P）2 （10.8）可求得q=1/3，P=2/3。因此，A=(2/3,1/3) 与B=(1/3,2/3)便是一个混合的纳什均衡最大最小化策略（max min strategy）最大最小化策略（max min strategy）如果B 是以损害A 为目标，则B 知道A 会选择“下”时，会故意选择“左”，尽管B 这样做自己并没有什么好处，但B 达到了损害A 最厉害的目标。A 如果估计到这一可能性，则还是保守一点为妙，即“两害之间取其较好的” 策略。即“最大最小策略”。最大最小化策略（max min strategy） A首先考虑，如选“上”，min1,1=1，如选 “下”，min-1000,2= -1000，A的决策是从两个坏结果中挑一个相对好的结果。所以， A会选择“上”。如果B仍想以损害A为目标，这时便不可能得逞，只好选择“右”。结果是（上，右）。最大最小化策略（max min strategy） A如选择maxmin策略，结果不是“收益极大化”，但却确保了“风险极小化”，所以 maxmin 策略又称为保守策略。