第六章博弈论初步-－金锄头文库

第六章博弈论初步教学目的和要求：在寡头垄断的市场上，厂商之间的决策是相互影响的，可以用博弈论的有关理论来分析具有相互影响的厂商之间的决策行为。通过本章的学习，学生应该了解博弈论的基本概念，能够运用博弈论的有关理论分析厂商的行为，并且重点掌握古诺模型、斯塔克博格模型、伯特兰模型、价格领导模型等几个有关厂商价格和产量决策的模型。教学重点与难点：纳什均衡、古诺模型、伯特兰模型、价格领导模型教学时数：8 课时第一节博弈论和博弈简介博弈论是研究产业组织的有效方法，著名经济学家泰勒尔说：“正如理性预期使宏观经济学发生革命一样，博弈论广泛而深远地改变了经济学家的思维方式”。博弈论与传统经济学有关决策理论的区别在于：后者涉及的个人决策，个人效用只依赖于自己的选择，而外在于他人的选择；然而博弈论看来，个人效用不仅依赖于自己的选择，而且依赖于他人的选择。一、博弈论的基本知识1. 博弈个人，团体或组织在面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自从中取得相应结果的过程。2. 博弈论英文为Game theory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。3. 描述博弈的要素参与人(player)，参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体) ；行动(actions)，行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策；信息(information)信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识；策略(strategy)策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排；支付(payoff)函数支付函数是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西；结果(outcome),结果是指博弈分析者感兴趣的要素的集合，常用支付矩阵或收益矩阵来表示。均衡(equilibrium)，均衡是指所有参与人的最优策略或行动的组合4. 博弈的分类行动顺序信息静态动态完全信息完全信息静态博弈；纳什均衡；纳什(1950,1951)完全信息动态博弈；子博弈精炼纳什均衡；泽尔腾(1965)不完全信息不完全信息静态博弈；贝叶斯纳什均衡；海萨尼(1967-1968)不完全信息动态博弈；精炼贝叶斯纳什均衡；泽尔腾(1975)二、占优策略、劣策略和纳什均衡1占优策略均衡当参与的一方拥有一种策略，该策略无论何时，无论其他参与者选择什么策略，都优于可选择的其他策略时，我们就称该参与者拥有占优策略(dominant strategy)。如果所有参与者都有占优策略存在，那么所有参与者占优策略的组合就构成了占优策略均衡。LRT7 75 8B856 6参与者2参与者 12重复剔除劣策略的占优均衡实际生活中，通常只有很少的博弈拥有占优策略，当存在一种策略，不论其他参与人选择什么策略，该策略的收益都比其他策略差时，称之为严格劣策略，严格劣策略参与者不会选择可以剔除。如果是重复剔除劣策略后剩下的唯一的策略组合，则存在重复剔除的占优均衡。该博弈是重复剔除占优可解的(dominance solvable)，策略组合称之为重复剔除劣战略占优均衡。3.纳什均衡纳什均衡的含义：纳什均衡是一种策略组合，这种策略组合由所有参与人的最优策略组成，即给定别人策略的情况下，没有任何单个参与人有积极性选择其他策略，从而没有任何参与人有积极性打破这种均衡。(1)囚徒困境(prisoners dilemma)囚徒乙坦白不坦白囚徒甲坦白-5 ,-50, -10不坦白-10, 02, -2(2)智猪博弈(boxed pigs)小猪按不按大猪按5, 14, 4不按9, -10, 0纳什均衡的数学表达：纳什均衡：有n个参与人的战略式表述博弈G=S , , S ； u，u ,战略组合S*1n 1n= (S*,，S *)是一个纳什均衡，如果对于每一个i, S *是给定其他参与人S *=(S *,1ni i1S *, S *，S *)的情况下第i个参与人的最优战略，即：u (s *,s *) u (s a ,s *)对任意-1i+1ni i -i i i -iS a US ,和任意的I都成立。ii第二节寡头垄断厂商的静态竞争模型一、产量决策-古诺模型古诺模型是寡头的产量决策模型，对该模型的博弈研究是产业组织理论的重要基础。例：设一市场有1、2两家厂商，他们生产相同的产品。设厂商l的产量为ql,厂商2 的产量为q2，则市场总产量为：Q=q1+q2。设P为市场出清价格(可以将产品全部卖出去的价格)，则P是市场总产量的函数P=P(Q)=8 Q。再假设两厂商的生产都无固定成本，且每增加一单位产量的边际生产成本相等C1=C2=2,即他们分别生产ql和q2产量的成本为2q1和2q2。最后，强调这两厂商是同时决定各自的产量的，即在决策之前不知道另一方的产量。在上述问题构成的博弈中博弈方为厂商1 和厂商 2。他们的策略空间都是由不同的产量组成，因为产量受生产能力的限制，因此理论上产量是有一个上限的，但如果假设产量是连续可分的，则他们各自都有无限多种可选策该博弈中两博弈方的得益自然是各自的利润，即各自的销售收益减去各自的成本，根据给定的情况，分别为: u1= q1P(Q)-C1u1=q18-(q1+ q2)-2q1u2= q2P(Q)-C2 u2-q28-(q1+ q2)-2q2两博弈方(厂商)的得益(利润)都取决于双方的策略(产量)。对厂商2的任意产量q2,厂商 l 有反应函数：1q = R (q ) =(6 - q )1 1 2 2 2这是通过令U1对q1的导数等于0求得的。同样的，厂商2对厂商1的产量q1的反应函数为：q 二 R (q )二 1(6 - q )2 2 1 2 1这两个反应函数都是线性函数，我们可用平面上的两条直线表示它们，如图*虽然本博弈中两博弈方都有无限多种可选策略，因而无法用得益矩阵表示该博弈，但纳什均衡的概念同样还是适用的，只要其中q1*和q2*相互是对对方策略的最佳对策，就是一个纳什均衡。并且，如果我们可证实它是该博弈中唯一的纳什均衡，则它同样是博弈的解。前面我们介绍的划线法等都是通过在不同策略之间两两比较找出纳什均衡的，这些方法在有无限多种策略时显然不适用，那么我们该如何去找本博弈的纳什均衡呢？实际上，划线法等方法的原理都是寻找针对其他博弈方策略的最佳对策，即在其他博弈方的一定策略下本方能实现自身最大得益的策略，这其实就是数学中的最大值的概念。因此，当我们研究的博弈有无限多种策略，得益函数为连续函数时，我们只要根据数学中求最大值的方法，求出各博弈方在给定其他博弈方策略时能实现自身最大得益值的策略，并找出它们的交叉点，就一定是我们要找的纳什均衡。因此，在本博弈中，（ql*,q2*）的纳什均衡的充分必要条件是q1*和q2*的最大值问题：max （6 q - q q * - q 2）1 121vq 1max （6 q - q q * - q 2）2 212q2因为求最大值的两个式子都是各自变量的二次式，且二次项的系数都小于0,因此ql*和 q2*只要能使它们各自对ql和q2的导数为0,就一定能实现它们的最大值。令：I 6 - q * - 2 q * 二 0v216 - q * - 2 q * 二 012解之，得q1* = q2* = 2,并且这是唯一的一组解。因此（2, 2）是本博弈唯一的纳什均衡策略组合，也就意味着它是本博弈的解。两厂商将各生产2单位产量，双方得益（利润）都为2X （8 一 4）一 2X2 = 4。市场总产量为2十2 = 4,价格为8 一 4=4,两厂商的利润总和为4+4 = 8。上述是两厂商独立同时作产量决策，他们根据实现自身最大利益的原则行动而得到的结果。那么这个结果究竟怎么样，两厂商有没有真正实现自身的最大利益，从社会总体的角度来看效率又如何?为了对这些问题作出一个判断,我们必须换一个角度来考察这个问题。上面是假设两厂商都是从追求自己一家的利益出发进行决策，虽然他们不能忽视其他博弈方的存在，但却不是关心其他博弈方的利益，不是以总体利益为目标的。如果我们现在以总体利益为目标来考虑市场的最佳产量，结果会有怎样的不同呢?首先我们可以根据市场的条件求出实现最大总得益（总利润）的总产量。设总产量为Q,则总得益U=QP（Q） CQ=Q（8 一 Q）一 2Q=6Q-Q2。很容易求得使总得益最大的总产量Q*=3，最大总得益 u*=9。将此结果与两厂商独立决策，只追求自身利益时博弈的结果相比，总产量较小，而总利润却较高。因此，从两厂商构成的总体来看，后一种方法的效率更高。换句话说，如果两厂商可以合作，联合起来决定产量，找出使总利益最大的产量后各自生产该产量的一半1.5，则各自可分享到比双方不合作，只考虑自己利益而独立决策时更高的利益（4.54）。但是，在独立决策，缺乏协调机制的企业之间的这种合作并不很容易,即使双方认识到了合作的好处，达成了一定的协议，这种协议也往往缺乏足够的强制力,最终是很难维持上述对双方都真正最有利的产量，原因主要是因为各生产一半实现最大利润的总产量的策略组合（1.5，1.5）不是纳什均衡，也就是说，在这个策略组合（产量组合）下，双方都可以通过独自改变（增加）自己的产量而得到更高的利润，他们都有突破限额1.5的冲动,在缺乏有足够强制力的协议等限制手段的情况下，这种冲动注定他们不可能维持限额，最终是大家都增产，直至达到纳什均衡水平（2， 2），实现并不是可能实现的最大利润的稳定状态。这实际上就是“囚徒的困境”博弈的一个变种。古诺模型在现实中最好的例子是石油输出国组织的限额和突破。石油输出国组织成员国已知各自为政、自定产量的博弈结果肯定是使油价下跌、利润受损，因此有共同磋商制定产量限额以维持油价的意愿。但一旦规定各国的生产限额，且按照这个限额生产时，每个成员国都会发现，如果其他国家都遵守限额，只有自己超产，则自己将获得更多的利润，并且因为只有一国超产油价不会下跌太多，从而其他各国只是普遍受少量损失，因此各成员国在本位利益的驱使下，都会希望其他国家遵守限额而自己偷偷超产，独享更多的利益。最终的结果是各国普遍突破限额，限产计划破产，油价严重下跌，各国都只能得到不是最满意的纳什均衡的利润。这基本上就是石油输出国组织成员国面临的实际情况。三、价格决策伯特兰德模型（一）产品同质的伯特兰德模型1模型说明假设市场上只有两家企业：企业 1 和企业 2，双方同时定价，它们生产的产品完全相同（同质），寡头企业的成本函数也完全相同：生产的边际成本等于单位成本C,且假设不存在固定成本。市场需求函数D （p）是线性函数，相互之间没有任何正式的串谋行为。由于两个寡头垄断企业生产的产品同质，因而定价高者将失去整个市场；如果两个企业定价相同，则它们将平分市场。在上述条件下，两个企业的最优战略将如何选择呢？0P2 = MCP2在上图中，两个坐标轴分别代表两个企业的策略选择。企业 1