资源预览内容
第1页 / 共45页
第2页 / 共45页
第3页 / 共45页
第4页 / 共45页
第5页 / 共45页
第6页 / 共45页
第7页 / 共45页
第8页 / 共45页
第9页 / 共45页
第10页 / 共45页
亲,该文档总共45页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
生活中的博生活中的博弈论弈论博弈论博弈论与生活中的与生活中的几个事例几个事例一元与两元的故事一元与两元的故事美国美国19世纪有一个颇有成就的政治家,其幼年时是流浪街头世纪有一个颇有成就的政治家,其幼年时是流浪街头的孤儿。他经常在大街上向行人讨钱,但当有人让他在一块的孤儿。他经常在大街上向行人讨钱,但当有人让他在一块钱和两块钱之间选择时,他选择了一块钱。于是,许多人都钱和两块钱之间选择时,他选择了一块钱。于是,许多人都为了亲眼验证关于他的为了亲眼验证关于他的“犯傻犯傻”行为的传闻,专门来找他并行为的传闻,专门来找他并让他在一块钱和两块钱之间选择。他依然故我地只选择一块让他在一块钱和两块钱之间选择。他依然故我地只选择一块钱,于是来找他的人愈来愈多。钱,于是来找他的人愈来愈多。终于有一天,有一位女士问他:难道你不知道两块钱比一块终于有一天,有一位女士问他:难道你不知道两块钱比一块钱更多一些钱吗?钱更多一些钱吗?他如此回答道:如果我有一次选择了两块钱,就不会有人来他如此回答道:如果我有一次选择了两块钱,就不会有人来找我让我在一块钱与两块钱之间选择了,我也讨不到钱了。找我让我在一块钱与两块钱之间选择了,我也讨不到钱了。背后有没有科学原理?田忌田忌赛马比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马, 与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌赢了齐威王。在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。背后有没有科学原理?何为博弈论?博弈论(Game Theory)又名对策论,游戏论博弈论,英文为Game theory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。博博弈弈论论是是研研究究理理性性的的决决策策主主体体在在其其行行为为发发生生直直接接的的相相互互作作用用时时的的策策略略选选择择及及策策略均衡的理论。略均衡的理论。博博弈弈分分析析的的关关键键步步骤骤是是找找出出在在别别人人选选择择既既定定的的情情况况下下自自己己的的最最优优反反应应策策略略(给给自己带来最大收益的策略)。自己带来最大收益的策略)。博弈论研究对象博弈论研究对象学弈(孟子告子) :弈秋,通国之善弈也。使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?吾曰:非然也。 博弈论的产生和发展博弈论的产生和发展1.博弈在中国博弈在中国从孙子兵法到三十六计从孙子兵法到三十六计从田忌赛马到孙庞斗智从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从运筹帷幄到韬光养晦从曹刿论战到论持久战从曹刿论战到论持久战2.博弈论的开山之作博弈论的开山之作1943年年,冯冯诺诺依依曼曼和和摩摩根根斯斯顿顿发发表表博博弈弈论论和和经经济行为济行为的一书,的一书,标标志志着着博博弈弈论论作作为为一一门门独独立立科科学学的的开开始始,也也标标志志着着新新古古典典经经济济学学进进入入了了一一个个新新的的发发展展阶阶段段。3.1994年三位获诺奖的博弈论学者年三位获诺奖的博弈论学者John NashJohn HarsanyLeihaden Selten4.1996年年诺诺贝贝尔尔经经济济学学奖奖得得主主:詹詹姆姆斯斯莫莫里里 斯斯:主主要要贡贡献献:不不对对称称信信息息条件下的激励理论条件下的激励理论5. 2001年年诺诺贝贝尔尔经经济济学学奖奖得得主主:迈迈克克尔尔斯斯宾宾塞塞:在在不不对对称称信信息息市市场场分分析析方方面面所所做做出出开开创创性研究。性研究。 6.2005年二位获诺奖的博弈论学者年二位获诺奖的博弈论学者Robert AumannThomas Shelling博弈无处不在例例题:囚:囚徒困境模型徒困境模型 两人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一人供认或两人都供认。即使两人都不供认,也可以判他们犯盗窃物品的轻罪。 囚徒被分离审查,不允许他们之间或通信息,并交代政策如下:如果两人都供认,每个人都将因抢劫罪加盗窃罪被判8年监禁;如果两人都拒供,则两人都将因盗窃罪被判一年监禁;如果一人供认而另一个拒供,则供认这被认为有功而免受处罚,拒供者将因抢劫罪、盗窃罪以及拒供重判10年。 囚徒困境囚徒困境赢利表(利表(Payoff Table)Payoff Table)拒供供认拒供1年,1年10年,0年供认0年,10年8年,8年乙乙甲甲囚徒困境囚徒困境每个囚徒都会发现每个囚徒都会发现如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。如果对方供认,则自己供认将被判3年,而自己拒供则会被判5年,因此供认是较好的选择。 由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。攻守同盟?攻守同盟?很难达成:隔离审查,每个人都担心对方背弃盟约。很难达成:隔离审查,每个人都担心对方背弃盟约。练习题练习题例1:囚徒困境(prisoners dilemma ) 分析:给定分析:给定B B坦白的情况下,坦白的情况下,A A的最的最优战略是坦白;同样,给定优战略是坦白;同样,给定A A坦白的情坦白的情况下,况下,B B的最优战略也是坦白。如果的最优战略也是坦白。如果B B不坦白,不坦白,A A坦白的话被放出来,不坦白坦白的话被放出来,不坦白的话判一年,所以坦白比不坦白好;的话判一年,所以坦白比不坦白好;如果如果B B坦白,坦白,A A坦白的话判坦白的话判8 8年,不坦白年,不坦白的话判的话判1010年,所以,坦白还是比不坦年,所以,坦白还是比不坦白好。这样,坦白就是白好。这样,坦白就是A A的占优战略;的占优战略;同样,坦白也是同样,坦白也是B B的占优战略。结果是,的占优战略。结果是,每个人都选择坦白,各判刑每个人都选择坦白,各判刑8 8年。年。-1,-1-10,00,-10-8,-8 囚犯囚犯B B 坦白坦白 抵赖抵赖 A A 坦坦白白 抵抵赖赖囚徒困境的启示囚徒困境的启示“囚囚徒徒的的两两难难选选择择”有有着着广广泛泛而而深深刻刻的的意意义义。个个人人理理性性与与集集体体理理性性的的冲冲突突,各各人人追追求求利利己己行行为为而而导导致致的的最最终终结结局局是是一一个个“纳纳什什均均衡衡”,也也是是对对所所有有人人都都不不利利的的结结局局。他他们们两两人人都都是是在在坦坦白白与与抵抵赖赖策策略略上上首首先先想想到到自自己己,这这样样他他们们必必然然要要服服长长的的刑刑期期。只只有有当当他他们们都都首首先先替替对对方方着着想想时时,或或者者相相互互合合谋谋(串串供供)时时,才才可可以以得得到到最最短短时时间间的的监监禁的结果。禁的结果。经济学中的理性人成立吗?传统经济学的鼻祖亚当斯密在其传世经典国民财富的性质和原因的研究中这样描述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。” 这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。传统经济学秉承了亚当斯密的思想。传统经济学认为:人的经济行为的根本动机是自利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。个人理性与集体理性的冲突但是囚徒困境的结果,但是囚徒困境的结果,恰恰表明个人理性不能通恰恰表明个人理性不能通过市场导致社会福利的最优过市场导致社会福利的最优。每一个参与者可以。每一个参与者可以相信市场所提供的一切条件,相信市场所提供的一切条件,但无法确信其他参但无法确信其他参与者是否能与自己一样遵守市场规则与者是否能与自己一样遵守市场规则。佛家讲因果律,儒家讲究佛家讲因果律,儒家讲究“财自道生,利缘义取财自道生,利缘义取”。从囚徒困境看来,如果一味地想算计别人,。从囚徒困境看来,如果一味地想算计别人,算来算去,最后算计到自己头上来了。如果我们算来算去,最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑,那么将囚徒困境中的有期徒刑改为死刑,那么“机关机关算尽太聪明算尽太聪明, ,反误了卿卿性命反误了卿卿性命”用在这里是再恰用在这里是再恰当不过的了。当不过的了。现实中的囚徒困境现实中的囚徒困境、寝室里,灯泡坏啦!、招商引资中的“政策竞赛”、文革中的“竞相揭发”、贸易战第二个案例 夫妻间吵架(或者男女朋友)!一般来说,吵得厉害了,不是妻子回娘家躲一躲,就是丈夫到院子里抽支烟。请问这是为什么?这属于斗鸡博弈设想汤姆和吉米是两个顽皮的小孩,他们在小设想汤姆和吉米是两个顽皮的小孩,他们在小伙伴的鼓动下要进行一场关于勇气的比赛:两伙伴的鼓动下要进行一场关于勇气的比赛:两人分别从一条独木桥的两端冲向对方,谁退却人分别从一条独木桥的两端冲向对方,谁退却谁就是谁就是“小鸡小鸡”。显然,如果两个人都向前冲,。显然,如果两个人都向前冲,则两败俱伤,设支付水平为则两败俱伤,设支付水平为-2;如果一个勇进;如果一个勇进而另一个退却,则勇进者受到小伙伴的欢呼,而另一个退却,则勇进者受到小伙伴的欢呼,退却者受到嘲讽,设支付分别为退却者受到嘲讽,设支付分别为4和和-1。若两人同。若两人同时退却,则一起受到小伙伴的嘲笑,设支付为时退却,则一起受到小伙伴的嘲笑,设支付为0,因为两人一起受到嘲笑比起一人单独受到因为两人一起受到嘲笑比起一人单独受到嘲笑要好受些。嘲笑要好受些。斗鸡博弈斗鸡博弈(chicken game)(胆小鬼博弈胆小鬼博弈) 吉米吉米 退却退却 勇进勇进 退却退却 汤姆汤姆 勇进勇进0,0-1,44,-1-2,-2有两个均衡。实际会怎样?有两个均衡。实际会怎样? 这个博弈也有两个纳什均衡: (进,退),(退,进) 该例也有许多应用。有些公共产品的供给就属于此类问题。若村子里住的是两户富人,有一条路要修,一种可能的情况是,一家修路,另一家就不修;一家不修,另一家就得修。(总结一下,公共产品的供给可能是囚徒博弈,还有可能是斗鸡博弈,依具体产品而论)。 冷战期间,苏美两个军事集团在世界各地抢占地盘,也是一种斗鸡博弈。一般来说,如果一方已经抢占了一块地盘,另一方就设法占领另一块地盘,而不是与对手竞争同一块地盘。 还有警察与游行队伍的例子。游行队伍与警察越来越近,这时候,定要有一方退下来。如果警察不让步,游行队伍便会后退;反过来,如果游行队伍来势很猛,警察就得撤退。 当然,斗鸡博弈的一个重要问题是,究竟哪一方退下来,因为退下来虽比两败俱伤好,总归是一件丢面子的事情。若每一方都寄希望于对方退下阵来,两败俱伤的结局也可能出现。练习题练习题例例3:信息甄别:所罗门王的故事信息甄别:所罗门王的故事所所罗罗门门王王是是古古代代以以色色列列国国的的一一位位以以智智慧慧著著称称的的君君主主。一一次次,两两个个女女人人为为争争夺夺一一个个婴婴儿儿争争扯扯到到所所罗罗门门王王殿殿前,她们都说婴儿是自己的,请所罗门王作主。前,她们都说婴儿是自己的,请所罗门王作主。练习题练习题例例3:信息甄别:所罗门王的故事信息甄别:所罗门王的故事所所罗罗门门王王是是古古代代以以色色列列国国的的一一位位以以智智慧慧著著称称的的君君主主。一一次次,两两个个女女人人为为争争夺夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。所所罗罗门门王王稍稍加加思思考考后后作作出出决决定定:将将婴婴儿儿一一刀劈为两段,两位妇人各得一半刀劈为两段,两位妇人各得一半。这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。半。听罢这位妇人的求诉,所罗门王立即作出最终裁决听罢这位妇人的求诉,所罗门王立即作出最终裁决婴儿是这婴儿是这位请求不杀婴儿的妇人的,应归于她。位请求不杀婴儿的妇人的,应归于她。 什么是智猪博弈智猪博弈说的是,有两头非常聪明的猪(要不怎么叫智猪呢),一大一小共同生活在一个猪圈里。猪圈的一端有一个踏板,踏板连着开放饲料的机关。只要踏一下,在猪圈的另一端就会出现10个单位食物。经过精确的衡量,任何一头猪去踏这个踏板都会付出相当于两个单位食物的成本;每只猪都可以选择“踏”或者“不踏”踏板。 那么,大猪小猪分别会做那么,大猪小猪分别会做什么选择呢?什么选择呢?选择若小猪去踏,大猪若小猪去踏,大猪先候在槽边,则当先候在槽边,则当小猪赶到槽边时大小猪赶到槽边时大猪已经吃光了猪已经吃光了10个个单位食物,小猪不单位食物,小猪不仅什么都没吃到,仅什么都没吃到,反而付出了反而付出了2个单个单位成本位成本智猪们的选择智猪们的选择若大猪去踏,小猪若大猪去踏,小猪先等候在是食槽边,先等候在是食槽边,则大猪因时间耽搁则大猪因时间耽搁只食得只食得6个单位食个单位食物,小猪食得物,小猪食得4个个单位食物,大猪扣单位食物,大猪扣除成本后赢利除成本后赢利4单单位食物,小猪没有位食物,小猪没有成本因而赢利也为成本因而赢利也为4单位食物;单位食物;两只猪一起去踏,然两只猪一起去踏,然后一起回槽边进食,后一起回槽边进食,则大猪由于食的更快则大猪由于食的更快可吃下可吃下8个单位食物,个单位食物,小猪只能吃到个单小猪只能吃到个单位食物,扣除各自的位食物,扣除各自的成本,大猪实际赢利成本,大猪实际赢利6个单位食物,小猪个单位食物,小猪则赢利则赢利0个单位食物;个单位食物;两只猪都不去踏,两只猪都不去踏,则大家都只能赢则大家都只能赢利利0智智猪猪博博弈弈的的收收益益矩矩阵阵小猪小猪踏踏不踏不踏踏踏大猪大猪不踏不踏6,0 4,410,-2 0,0观察此博弈发现:小猪有优势策略观察此博弈发现:小猪有优势策略无论大猪踏或不踏,无论大猪踏或不踏,小猪选择不踏总是最合适的,但是大猪没有优势策略小猪选择不踏总是最合适的,但是大猪没有优势策略其结果是:大猪按,小猪等待,各得4个单位。这反映了什么问题?改变方案一:减量方案改变方案一:减量方案投食仅原来的一半分投食仅原来的一半分量。量。结果会怎样?改变方案一:减量方案改变方案一:减量方案投投食食仅仅原原来来的的一一半半分分量量。结结果果是是小小猪猪大大猪猪都都不不去去踩踩踏踏板板了了。小小猪猪去去踩踩,大大猪猪将将会会把把食食物物吃吃完完;大大猪猪去去踩踩,小小猪猪将将也也会会把把食食物物吃吃完完。谁谁去去踩踩踏踏板板,就就意意味味着着为为对对方方贡贡献献食食物物,所所以以谁谁也也不不会会有踩踏板的动力了。有踩踏板的动力了。如如果果目目的的是是想想让让猪猪们们去去多多踩踩踏踏板板,这这个个游游戏戏规规则的设计显然是失败的。则的设计显然是失败的。 改变方案二:增量方案改变方案二:增量方案投食为原来的一倍分投食为原来的一倍分量。量。结果会怎样?改变方案二:增量方案改变方案二:增量方案投投食食为为原原来来的的一一倍倍分分量量。结结果果是是小小猪猪、大大猪猪都都会会去去踩踩踏踏板板。谁谁想想吃吃,谁谁就就会会去去踩踩踏踏板板。反反正正对对方方不不会会一一次次把把食食物物吃吃完完。小小猪猪和和大大猪猪相相当当于于生生活活在在物物质质相相对对丰丰富富的的“共产主义共产主义”社会,所以竞争意识却不会很强。社会,所以竞争意识却不会很强。对对于于游游戏戏规规则则的的设设计计者者来来说说,这这个个规规则则的的成成本本相相当当高高(每每次次提提供供双双份份的的食食物物);而而且且因因为为竞竞争争不不强强烈烈,想想让猪们去多踩踏板的效果并不好。让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案改变方案三:减量加移位方案投食仅原来的一半分量,但同时将投食口移投食仅原来的一半分量,但同时将投食口移到踏板附到踏板附近。近。结果会怎样?改变方案三:减量加移位方案改变方案三:减量加移位方案投食仅原来的一半分量,但同时将投食口移投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。本不高,但收获最大。智猪博弈的启示智猪博弈的启示原原版版的的“智智猪猪博博弈弈”故故事事给给了了竞竞争争中中的的弱弱者者(小小猪猪)以以等等待待为为最最佳佳策策略略的的启启发发。但但是是对对于于社社会会而而言言,因因为为小小猪猪未未能能参参与与竞竞争争,小小猪猪搭搭便便车车时时的的社社会会资资源源配配置置的的并并不不是是最最佳佳状状态态。为为使使资资源源最最有有效效配配置置,规规则则的的设设计计者者是是不不愿愿看看见见有有人人搭搭便便车车的的,政政府府如如此此,公公司司的的老老板板也也是是如如此此。而而能能否否完完全全杜杜绝绝“搭搭便便车车”现现象象,就就要要看看游游戏戏规则的核心指标设置是否合适了。规则的核心指标设置是否合适了。搭便车者 智猪博弈深刻的反映了经济和社会生活中的免费搭便车智猪博弈深刻的反映了经济和社会生活中的免费搭便车问题。无论大猪踏或不踏,小猪都选择不踏;给定小猪问题。无论大猪踏或不踏,小猪都选择不踏;给定小猪不踏,大猪最好去踏。不踏,大猪最好去踏。有意思的是大猪选择踏在主观上是为了自己的利益,但有意思的是大猪选择踏在主观上是为了自己的利益,但在客观上小猪也享受到了好处。在经济学里,这头小猪在客观上小猪也享受到了好处。在经济学里,这头小猪被称为被称为“搭便车者搭便车者”。若全部的博弈主体都试图免费搭车,那么就可能陷入囚若全部的博弈主体都试图免费搭车,那么就可能陷入囚徒困境徒困境请列举请列举“搭便车搭便车”的现象的现象冲开水、搞卫生;股市上庄家与散户冲开水、搞卫生;股市上庄家与散户20世纪世纪70年代末年代末80年代初,美国市场上私人标签年代初,美国市场上私人标签(private label)的软饮料价格便宜、质量较差,因此)的软饮料价格便宜、质量较差,因此占有较低的市场份额。可口可乐公司和百事可乐公司占有较低的市场份额。可口可乐公司和百事可乐公司最初能容忍这些私人标签饮料的存在,因为它们是小最初能容忍这些私人标签饮料的存在,因为它们是小猪,威胁有限。可是没过多久,一家主要的私人标签猪,威胁有限。可是没过多久,一家主要的私人标签饮料供应商饮料供应商Cott公司通过挑衅性的定价和较高的质量,公司通过挑衅性的定价和较高的质量,从拥有较低市场份额的地区品牌,成长为一个拥有三从拥有较低市场份额的地区品牌,成长为一个拥有三分之一市场份额的、旗鼓相当的竞争者。此时,可口分之一市场份额的、旗鼓相当的竞争者。此时,可口可乐公司和百事可乐公司通过降低价格这种进攻性的可乐公司和百事可乐公司通过降低价格这种进攻性的行动,使私人标签软饮料的市场份额立即瓦解了。行动,使私人标签软饮料的市场份额立即瓦解了。改革与制度锁定如果一个制度不是一个好制度,那么就会有人试图推翻这项制度并建立新的制度。但是,改革是有成本的,需要流汗,甚至流血。总有一些人充当“大猪”的角色,为改革东奔西走,承担为改革而付出的代价,而另一些人就象小猪一样,没有为改革付出努力,却坐享了改革的成果,是“免费搭车者”。如果这个社会人人都想搭免费车,都不站出来向旧制度发难,那么并不美好的旧制度就会被长期锁定。这也许可以解释为什么有些制度明明不合理却又长期存在的现象。技术创新便车小企业通常模仿大企业的产品,等大企业通过广告打开市场后出售廉价模仿品。大企业作为“大猪”常会花钱进行研究开发、技术创新,而小企业作为小猪,常常等待大企业开发出新技术、新产品后模仿起技术和产品并生产和出售类似产品。经 济 如 局人 生 如 棋博 弈 之 道生 活 之 常运 用 之 妙存 乎 一 心耶鲁大学公开课-博弈论http:/v.youku.com/v_show/id_XMzc2OTAwNjQ4.html
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号