《博弈论前沿专题》Word版教案-

20112012学年第二学期博弈论前沿专题Word版教案第一章预备知识（1）1 博弈论学科的研究对象：a 博弈论研究冲突与合作b 理性的个体或群体间的冲突与合作c 相互影响的决策理论（罗伯特奥曼Robert J. Aumann）2 博弈论(Game Theory)学科的产生和发展：（1）作为一门学科始于1944年冯诺伊曼（Von Neumann）和摩根斯坦（O. Morgenstern）的“Theory of Games and Economic Behavior” 一书。（2）50年代初天才数学家纳什（J. Nash）证明了非合作博弈稳定解的存在性，纳什均衡和一般均衡一起成为经济学两个基石。（3）泽尔腾（1965）提出求解动态博弈问题的子博弈均衡概念；（4）海萨尼（Harsanyi，1967）提出求解不完全信息博弈问题的海萨尼转换，以及对于不完美信息博弈问题的贝叶斯均衡概念；（5）90年代以来博弈论的3个发展动向：合作博弈理论（cooperate GT）、演化博弈（evolutionary GT）、实验博弈3 古典经济学中“理性经济人”内涵：（1）“自利”。追求自身利益是根本动机，同时利他。（2）“理性行为”4 西蒙的“有限理性”概念：（1）经济学家西蒙（1976）认为，经济行为人由于：人类认知能力的限制；未来预测不确定性；多样化的目标追求，最优解是根本达不到的，提出了“有限理性”（bounded rationality）（2）具有有限理性的个体决策者，只能进行次优选择-追求较满意的目标。5 博弈论中“理性”概念的内涵：（1）目标理性(主观理性):参与者追求自身利益的最大化(经济学理性的内涵)（2）过程理性（具有理性的能力）：给定参与者对外部环境的信念后最大化自己的报酬，即“前后一致的”做出选择.可以分为两个推理步骤：a 认知理性（cognitive）参与者对相关环境可获得的信息与形成的信念之间的一致性，即参与者具有对相关环境形成信念的能力；b 工具理性（instrumental）参与者对外部给定的机遇与固定的偏好之间的一致性，即参与者具有从既定的信念推导出采取相应策略的能力。6 贝叶斯决策：（1）先由过去的经验或者专家估计获得即将发生事件的事前先验概率；（2）根据调查或者试验得出的条件概率，利用贝叶斯公式，计算事后的后验概率。第二章预备知识（2）1 博弈中均衡（纳什均衡）的不同理解：（1）观点1：参与者们采取的最佳应对策略一致同意达到的结果，其具有“可自我实施”（self-inforcement）的特征（即：独自偏离均衡策略不会带来更好结果）。该观点认为，均衡是一种结果。（2）观点2：博弈均衡，当且仅当每一个参与者对所有参与者的行为有正确的预期。该观点认为，均衡是一种信念。（3）观点3：该观点认为，均衡是一种规则。在“理性”假设下，该三种定义是等价的。2 选择（selection）与精练（perfection）(1) 选择问题：在非合作博弈中，一些威胁和承诺是不可信的，如何选择那些能够实现一致预期的均衡结果；(2)精练问题：对于博弈存在多重均衡的情况，如何判断哪些均衡更有可能实现。3 Nash在其博士论文“Non-cooperative games”（1950年）给出Nash均衡的两种解释:(1) 是“理性主义”的、内省的、演绎的传统解说均衡是通过理性的参与者进行严密的逻辑演绎推理得到的，对参与者的理性能力有较高要求（传统博弈分析）。(2) 是学习的、归纳的、演化的解说当时没有很好的方法构建数学模型（国际上90年代兴起演化博弈理论）。4 合作博弈：参与者之间的协议是有完全约束力并能够实施的，即外生给定的。合作博弈研究的主要问题：如何实现有约束力的协议的参与者之间无冲突的串谋？5 完美信息（perfective information）参与者在选择行动时了解以前的历史，并且双方没有同时行动。完备信息（complete information）参与者对博弈的信息是否完全了解，又称完全信息。当各个要素（参与者、规则、得益、策略）都是共同知识时，为完备信息。第三章传统博弈理论的简介1 传统博弈理论的研究思路：参与者“完全理性”假设下，通过推理演绎达到均衡化过程。均衡是瞬间实现的。2 纳什均衡（Nash Equilibrium，简记NE）的理解：参与者可以直接交换信息并一致同意选择某一策略，虽然这些口头协议无法强制实施，但是每个参与者单独偏离却不会带来更大收益，因此该策略组合是自动实施的（self-enforcing）。3 纳什均衡的无效率问题：囚徒困境在非合作博弈框架内的解决途径？博弈重复进行的过程中产生合作行为。其它的一些途径包括声誉效应、互惠机制、利他主义行为、空间网络上的演化博弈等4 无限次重复博弈的分析思路；在无限次重复博弈中，考虑到时间价值，引入贴现系数，这样总收益将是一个有限数加以比较。5如何理解无限次重复博弈的无名氏定理（民间定理）？对于原博弈具有唯一NE（如囚徒困境）的无限次重复博弈，可以设计出具有可信威胁的触发策略，如果参与者比较看重未来长期合作的收益（贴现系数足够大），就可以达成合作结局，摆脱囚徒困境。6 动态博弈的核心问题：为了影响对方下阶段的行动，作出一些威胁或承诺。但这些威胁或承诺是否可信？7 子博弈完美的基本思想：（1）动态博弈中，一个纳什均衡策略的每一个子博弈都是纳什均衡，则该均衡策略是子博弈完美纳什均衡；（2）其对于双方理性能力的要求是基于“共同知识”，因此在NE的基础上（可自我实施的稳定均衡），依据反向归纳法进一步剔除那些不可信的威胁和承诺。（3）由于动态博弈的核心问题是“可信性”，因此子博弈完美均衡是求解动态博弈问题的基本均衡概念。8 不完全信息博弈的处理方法：（1）海萨尼转换（Harsanyis procedure），引入一个神秘的“自然”，其事先决定了参与者的各种可能类型，以及每种类型发生的概率。注意：每个参与者的真实类型只是他本人的私人信息；但是各种可能的类型和相应概率，却是共同知识。由此，可将不完备信息转化为完备但不完美信息。（2）进而，通过贝叶斯决策，可以得到不完美信息下分析方法。9 计算要求：掌握求解静态博弈的混合策略均衡；动态博弈的子博弈完美纳什均衡；重复博弈的均衡路径求解第四章不完全信息博弈和信息经济学（1）：道德风险和激励理论1 信息经济学的研究对象：以参与者不对称信息为基本出发点，分析不对称信息对效率的损害，以及怎样设计可能的机制减轻这种损害。2 私人信息（private information）:订立契约或执行过程中只有自己知道的信息。其造成了交易双方的不对称信息。公共信息（public information）:大家都可以观察到的信息。3 委托人和代理人：交易过程中具有私人信息的一方称为代理人(agent)，处于信息劣势的一方称为委托人(contract)。不对称信息的交易过程即为委托人与代理人签订某种契约的过程。4 道德风险（moral hazard）：由于委托人无法简单的要求代理人根据其利益采取相应的行动，因此代理人根据自己喜好采取有损委托人利益的行动（又称为签订契约后隐藏行动问题）。其中，一种情况是代理人的行动无法被观察；另一种情况是观察到代理人的行动后无法证实违背合同。5 逆向选择（adverse selection）:代理人在交易前谎报自己的真实信息，从而谋取更大利益。由于委托人降低了对代理人水平的预期，造成高质量的代理人退出市场，交易减少，效率下降（又成签约前的隐藏信息问题）。6 委托代理模型：（1）参与约束(Participation Constraints)：代理人接受合同所能获得的最低效用，应该大于市场的保留效用。（2）激励相容约束（Incentive-compatibility Constraints）：在委托人无法观察代理人行动时，合同设计必须满足代理人付出较高水平的努力获得的效用，大于偷懒的效用。此时代理人的激励和委托人目标是相容的。各种激励方案，必须同时满足代理人的参与约束和激励相容约束。（3）委托人选择的最优激励方案，目标使得委托人的期望收益最大化。7 委托代理理论的优缺点：（1）优点：给定外部环境下，适用于分析在信息不对称条件下，哪一种激励兼容的契约安排能够成为对环境和激励约束的次优反应。（2）局限性：一是模型解对技术环境、参与者目标函数的参数、代理人参与约束的外部制度环境的设定非常敏感；二是适用于特定的由技术唯一决定的制度环境中，未能考虑政治、文化、惯例等其它因素。第五章不完全信息博弈和信息经济学（2）：逆向选择和信息甄别1 阿克罗夫（Akerlof）在其1970年发表的柠檬市场：产品质量的不确定性与市场机制中举了二手车市场的案例。2 考虑劳动力可以通过接受教育发送信号的情况，分离均衡概念的涵义：是指均衡状态下，不同类型的代理人选择不同的观察指标（信号）最优水平，从而委托人能够加以区分。3 不同信息条件下的效率比较：(1) 完全信息下，企业不需任何成本，直接观察到两种类型的劳动力；(2) 不完全信息下信号发送达到分离均衡时，企业也能区分两种类型的劳动力，但是高素质劳动力需要付出一定的教育成本，效率损失；4 信息甄别概念：在不完全信息下，委托人设计特定的契约对不同类型的代理人进行筛选。5 计算要求：作图和计算分析信号发送的混同均衡和分离均衡临界值。第六章不完全信息博弈和信息经济学（3）：机制设计理论与显示原理1 机制设计理论的研究对象：为了达到某种理想的目标，而需要设计什么样的博弈规则（机制）来实现？其中所谓最优的机制，是从机制设计者角度而言最好的均衡结果。2 设计者的约束条件：(1) 首先，不能有任何强迫(参与约束，或个人理性约束)；(2) 其次，参与者只根据自身利益最大化采取相应行动(激励相容约束)3 机制设计的过程：(1) 委托人设计一个机制（或契约、激励方案），即博弈规则；(2) 代理人接受或拒绝该机制；(3) 接受机制的代理人进行由机制所确定的博弈。4 机制设计的目的：由于不完全信息下的均衡结果存在着福利损失，机制设计理论的一个重要目的：寻求使这种福利损失最小的机制5 显示原理：任何一个说谎话机制（non-truth-telling）下的潜在交易达到的均衡结果，都可以被一个说真话的机制所取代。显示原理（revelation principle）能够大大缩小我们的考察范围：当代理人拥有私人信息可以说谎时，根据显示原理，搜寻最优机制的范围缩小为那些说真话的机制即可。第七章不完全信息博弈和信息经济学（3）：招标和拍卖1拍卖和招标（auction）：把出售物品称为拍卖，把为了发包一项工程或提供一项服务的交易活动称为招标，即花钱购买服务。两者区别：拍卖品已经存在，信息比较完全，因此由出价高者获得；招标是未完成的工程或服务，涉及到未来的不确定性，除了价格低廉外，还要考虑企业实施的承诺和企业信誉等因素。两者共同点：通常标的物潜在价值都比较大；市场上只有单方向的竞争，即潜在的买主和投标人之间；一般情况下，买主对标的物的估价（保留价格）是私人信息，卖主或招标人不知道。2 独立私有价值拍卖（individual private value auction）：每个参与者都知道自己对拍卖品的估价，但是不知道别人的估价，而且每个买主是相互独立的（即拍卖时候不相互影响，不勾结）。如艺术品3 公共价值拍卖（common value auction）：拍卖品的价值对所有买主都是相