资源预览内容
第1页 / 共35页
第2页 / 共35页
第3页 / 共35页
第4页 / 共35页
第5页 / 共35页
第6页 / 共35页
第7页 / 共35页
第8页 / 共35页
第9页 / 共35页
第10页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
博弈论 第三章 混合策略纳什均衡第二节 混合策略纳什均衡的求解方法二、支付最大化法 例:扑克牌对色游戏(p77) u无纯策略NE u给定混合策略p甲=(r,1-r); p乙=(q,1-q) v甲(p甲, p乙)=rq(-1)+(1-q) 1+ (1-r)q1+(1-q)(-1)= 2r(1-2q)+(2q-1) v乙(p甲, p乙)=q r1+(1-r)(-1)+ (1-q)r(-1)+(1-r)1 =2q(2r-1)-(2r-1)u混合策略纳什均衡是甲在策略空间红,黑上以概率分布 p甲*=( 1/2,1/2)进行选择,乙也在策略空间红,黑上以概率p乙*=(1/2 ,1/2)进行选择解:Max 甲(p甲, p乙)rq*=1/2f.o.c. 1-2q=0Max 乙(p甲, p乙)qr*=1/2f.o.c. 2r-1=0博弈论 第三章 混合策略纳什均衡第二节 混合策略纳什均衡的求解方法二、反应对应法 例:扑克牌对色游戏(p77) u无纯策略NE u给定混合策略p甲=(r,1-r); p乙=(q,1-q) v甲(p甲, p乙)= 2r(1-2q)+(2q-1) l整理原则:一项含r,一项不含r v乙(p甲, p乙)= 2q(2r-1)-(2r-1) l整理原则:一项含q,一项不含q u按照NE的条件,一个策略组合如过是一个NE,那么其中的 每一个策略都是参与人针对其他参与人策略组合的最优反应 ,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略 (离散情形),也可能是一个反应函数(reaction function,如连 续情形、古诺模型)。而在一个混合策略NE中,这个“最优反 应”将是一个概率或很多个概率被称为“反应对应 ”(reaction correspondence)博弈论 第三章 混合策略纳什均衡第二节 混合策略纳什均衡的求解方法二、反应对应法 例:扑克牌对色游戏(p77)u先看甲的最优反应,记为r*=R(q): v观察甲(p甲, p乙)= 2r(1-2q)+(2q-1)rq0 1 (红)1(红)1/21/2r*=R(q)反应对应曲线博弈论 第三章 混合策略纳什均衡第二节 混合策略纳什均衡的求解方法二、反应对应法 例:扑克牌对色游戏(p77)u再看乙的最优反应,记为q*=R(r): v观察乙(p甲, p乙)= 2q(2r-1)-(2r-1)rq0 1 (红)1(红)1/21/2q*=R(r)反应对应曲线博弈论 第三章 混合策略纳什均衡第二节 混合策略纳什均衡的求解方法二、反应对应法 例:扑克牌对色游戏(p77)u作为NE,各个参与人的反应应该同时为最优,只有两个反应对应 的交点满足uNE:r*=1/2, q*=1/2uNE支付为: 甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0rq0 1 (红)1(红)1/21/2q*=R(r)r*=R(q)博弈论 第三章 混合策略纳什均衡第二节 混合策略纳什均衡的求解方法二、反应对应法 作业:社会福利博弈。使用反应对应法找到纳什均衡。流浪汉寻找工作 游荡救济 政府不救济3,2-1,3-1,10,0博弈论 第三章 混合策略纳什均衡第三节 寻找多重纳什均衡例:情侣博弈 两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡? 一、支付最大化法 给定混合策略p陈明=(r,1-r); p钟信=(q,1-q)Max 陈明(p陈明, p钟信)=r3q+(1-q) + (1-r)0+2(1-q) =r(4q-1)+2(1-q)Max 钟信(p陈明, p钟信)=q (2r+0)+ (1-q)r+3(1-r) =q(4r-3)+(3-2r)u NE:(r*, q*)=(3/4, 1/4)二、反应对应法rq博弈论 第三章 混合策略纳什均衡第三节 寻找多重纳什均衡二、反应对应法:情侣博弈 先看陈明的最优反应,记为r*=R(q):u 陈明(p陈明, p钟信) =r(4q-1)+2(1-q)rq0 1 (钟信德语)1(陈明德语)1/4r*=R(q)博弈论 第三章 混合策略纳什均衡第三节 寻找多重纳什均衡二、反应对应法:情侣博弈 再看钟信的最优反应,记为q*=R(r):u 钟信(p陈明, p钟信)=q(4r-3)+(3-2r)rq0 1 (钟信德语)1(陈明德语)1/4q*=R(r)3/4博弈论 第三章 混合策略纳什均衡第三节 寻找多重纳什均衡二、反应对应法:情侣博弈 反应对应曲线有三个交点:三个NE:ur*=0, q*=0 纯策略(确定性)ur*=3/4, q*=1/4 混合策略(不确定性)ur*=1, q*=1 纯策略(确定性)rq0 1 (钟信德语)1(陈明德语)1/43/4r*=R(q)q*=R(r)博弈论 第三章 混合策略纳什均衡第三节 寻找多重纳什均衡二、反应对应法:情侣博弈 支付的帕累托优势:初步印象陈明=r(4q-1)+2(1-q),钟信=q(4r-3)+(3-2r)ur*=0, q*=0 纯策略(确定性) v 双方NE支付: 陈明*=3,钟信*=2ur*=3/4, q*=1/4 混合策略(不确定性) v双方NE支付: 陈明*=3/2,钟信*=3/2ur*=1, q*=1 纯策略(确定性) v双方NE支付: 陈明*=2,钟信*=3u纯策略纳什均衡比混合策略纳什均衡具有支付优势,这称为帕累托 优势u如果博弈同时存在纯策略纳什均衡和混合策略纳什均衡,前者往往得 到优先考虑博弈论 第三章 混合策略纳什均衡第三节 寻找多重纳什均衡二、反应对应法:情侣博弈 夫妻之争博弈博弈论 第三章 混合策略纳什均衡第四节 纳什均衡的存在性 不同均衡概念的关系优势均衡纯策略纳什均衡混合策略纳什均衡博弈论 第三章 混合策略纳什均衡第四节 纳什均衡的存在性L 问题:是否所有的博弈都存在NE(纯的或混合的)?u Nash在1950年证明:任何有限博弈,都至少存在一个NE 。纳什定理:在一个由n个博弈方的G=S1,, Sn; u1, un中,如果n是有限的,且 Si都是有限集,则该博弈 至少存在一个纳什均衡,但可能包含混合策略u Wilson(1971)证明,几乎所有有限博弈,都存在有限奇 数个NE,包括纯策略NE和混合策略NE。u(纯策略)纳什均衡的存在性定理(Debreu,1952; Glicksberg,1952;Fan,1952):考虑一个n人策略式博弈,如果每个参与人的纯策略 空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支 付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。博弈论 第三章 混合策略纳什均衡第四节 纳什均衡的存在性 例:凹但不连续的支付函数二人博弈:策略空间为S1=S2= (0, 1)支付函数: 反应对应:反应对应曲线:s2s11/31/3s1=s2=无纳什均衡博弈论 第三章 混合策略纳什均衡第四节 纳什均衡的存在性L 问题:是否所有的博弈都存在NE(纯的或混合的)?u(纯策略)纳什均衡的存在性定理(Debreu,1952; Glicksberg,1952;Fan,1952):考虑一个n人策略式博弈,如果每个参与人的纯策略 空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支 付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。u(混合策略)纳什均衡的存在性定理 (Glicksberg,1952) :在n人策略式博弈中,如果每个参与人的纯粹策略空 间Si是欧氏空间中的非空、紧(闭而有界)的凸集,如果 支付函数ui(s)为连续函数,那么博弈至少存在一个混合策 略Nash均衡.博弈论 第三章 混合策略纳什均衡第五节 多重纳什均衡的筛选 一个博弈可能有多个均衡,但仍然存在不稳定性你预测出 现这个纳什均衡,因而有相应选择,我却以为会出现另一个, 乃有我的选择,此时的组合可能并不构成纳什均衡 博弈论并没有一个一般的理论证明纳什均衡结果一定能出现 如何保证纳什均衡出现? 一、帕累托优势标准:按照支付大小筛选纳什均衡 例:猎人博弈博弈论 第三章 混合策略纳什均衡第五节 多重纳什均衡的筛选 如何保证纳什均衡出现? 二、风险优势标准:风险小的NE优先 假设概率,比较期望支付大小u 例:虚拟博弈u 两个纳什均衡,哪个更优?u 假设 r=1/2, q=1/2u 给定q=1/2:甲采用上策略的期望支付为:9/2+0/2=4.5甲采用下策略的期望支付为:8/2+7/2=7.5u 给定r=1/2:乙采用左策略的期望支付为:9/2+0/2=4.5乙采用右策略的期望支付为:8/2+7/2=7.5u 期望支付越大,风险越小:甲采用下策略,乙采用右策略u 选择的纳什均衡为:(下策略,右策略)博弈论 第三章 混合策略纳什均衡第五节 多重纳什均衡的筛选 如何保证纳什均衡出现? 二、风险优势标准:风险小的NE优先u 风险偏离损失乘积比较法1. 甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4 2. 乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4 3. 风险优势标准方法:偏离A的损失VS偏离B的损失 11444. 结论(1)偏离B的损失更大:16(2)不偏离Bu 选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略)AB博弈论 第三章 混合策略纳什均衡第五节 多重纳什均衡的筛选 如何保证纳什均衡出现? 二、风险优势标准:风险小的NE优先u 风险偏离损失乘积比较法1. 甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4 2. 乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4 3. 风险偏离损失乘积比较法:偏离A的损失 VS 偏离B的损失 11444. 结论 (1)偏离B的损失更大:16 (2)不偏离Bu 选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略)AB博弈论 第三章 混合策略纳什均衡第五节 多重纳什均衡的筛选 如何保证纳什均衡出现? 二、风险优势标准:风险小的NE优先5. 风险偏离损失乘积比较法的缺陷:u 例:假设M远远大于m1. 甲:单独偏离均衡的损失(1)偏离A的损失: (M-m)-M/2=M/2-m (2)偏离B的损失:M-(M-m)=m2. 乙:单独偏离均衡的损失(1)偏离A的损失:0-0=0 (2)偏离B的损失:0-0=0 u 如果使用风险偏离损失乘积比较法:偏离A的损失VS偏离B的损失 (M/2-m)0=m0u 一种建议:甲偏离A的损失 VS 甲偏离B的损失 M/2-mmu 选择的纳什均衡为:A, 即(D,L)AB博弈论 第三章 混合策略纳什均衡第五节 多重纳什均衡的筛选 如何保证纳什均衡出现? 二、帕累托优势标准和风险优势标准的关系 如果帕累托优势标准和风险优势标准的选择冲突? 例:u 帕累托优势标准法:选择的纳什均衡为Au 风险优势标准: 1. 甲:单独偏离均衡的损失 (1)偏离A的损失: 6-5=1 (2)偏离B的损失:4-(-1000)=1004 2. 乙:单独偏离均衡的损失 (1)偏离A的损失:6-5=1 (2)偏离B的
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号