博弈论与竞争策略课件2-

,博弈论与竞争策略,博弈论与竞争策略,课堂游戏（一）,“幸存者”策略：移旗,在两个部落之间的地面插着21支旗，两个部落轮流移走这些旗。每个部落在轮到自己时，可以选择移走1支、2支或3支旗。（这里，0支旗代表放弃移走旗的机会，是不允许的；也不允许一次移走4支或4支以上的旗。）拿走最后1支旗的一组获胜，无论这支旗是最后1支，还是2支或3支旗中的一支。如果你先拿，你该如何做呢？,博弈论与竞争策略,课堂游戏（二）,纸币拍卖,我这有1块钱，下面请大家竞拍。出价最高的竞拍者可以自己所出价格获得这1块钱，但出价次高的竞拍者也要交出自己所报的数目，且什么都不会获得。你会为这1块钱出价多少呢？如果是100块呢？1万块呢？,博弈论与竞争策略,“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解” 保罗萨缪尔森,博弈论与竞争策略,“博弈论”的英语原文是Game Theory，直译过来就是游戏论、运动论或竞赛论。什么叫博弈？博弈的英文为game，即“游戏”。而在西方，game的意义不同于汉语中的游戏。在英语中，game即是人们遵循一定规则下的活动，进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中，game有竞赛的意思，进行game的人是很认真的，不同于汉语中游戏的概念。在汉语中，游戏有儿戏的味道。,博弈论与竞争策略,博弈论导论博弈与我们的生活,周末了，带女朋友看球赛还是跟女朋友去听音乐会？母女博弈囚徒困境与价格战,博弈论与竞争策略,囚徒困境,案情描述两犯罪嫌疑人囚徒A与囚徒B因犯非法持有枪械罪和被怀疑可能犯有一级谋杀罪被逮捕，检察官将他们分别关在两间牢房里进行审讯。检察官对囚徒A说，“我们的政策是坦白从宽，抗拒从严；如果你坦白而他不坦白，那么你将被无罪释放，他将会因一级谋杀罪被判死刑；如果他坦白而你不坦白，他将被无罪释放，而你将会因一级谋杀罪被判死刑；如果你们都坦白，你们都将会被轻判。”当然检察官对B说的话也是完全一样。但实际上，如果两个人都坦白，却会因涉及更多的罪案而都被判无期。而两人都不坦白，只能按非法持有枪械罪被分别判一年。若你是囚徒A或B，你将如何选择呢？,个体理性与集体理性的冲突,囚徒B,囚徒A,坦白拒不交待,坦白拒不交待,无期，无期,死刑，释放,释放，死刑,一年，一年,囚徒1：坦白囚徒2：坦白,博弈论与竞争策略,博弈论导论现代博弈论简单发展史,起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的博弈论与经济行为田忌赛马,博弈论与竞争策略,博弈论导论博弈论的五大要素（以情侣博弈为例）,行动、策略、策略空间支付、得益次序博弈均衡,决策主体：参与人、博弈方,博弈论与竞争策略,博弈论导论博弈的分类,合作博弈、非合作博弈单人博弈、两人博弈、多人博弈有限博弈、无限博弈零和博弈、常和博弈、变和博弈静态博弈、动态博弈、重复博弈（有限次-无限次）完全信息博弈、不完全信息博弈完美信息博弈、不完美信息博弈,博弈论与竞争策略,博弈论导论博弈的表示方法,如果博弈参与人和策略有限，则可有如下两种形式表示一个博弈：,博弈论与竞争策略,博弈论导论,每一个博弈都是一个你中有我，我中有你的情形，不同的博弈参与者可以选择不同的行动，但由于相互作用，一个博弈参与者的得益不仅取决于自己采取的行动，也取决于其他博弈参与者所采取的行动。博弈论的精髓在于基于系统思维基础上的理性换位思考，即在选择你的行动时还是考虑你的得益，但是你应当用他人的得益去推测他人的行动，从而选择最有利于自己的行动。,博弈论与竞争策略,静态博弈求解：均衡分析-纳什均衡,相对优势策略（relatively dominant-strategy）: 一种策略-在对手选定某个策略条件下博弈参与人的优势策略。求解方法：相对优势策略标记法。假设参与者1认为参与者2选择 “A”，则他应选？,参与者 2,参与者 1,博弈论与竞争策略,参与者1应该选择 “a” 参与者1对 “A”的最优反应是 “a”.,参与者 2,参与者 1,假设参与者2认为参与者1选择 “a”，则参与者2应该选择 “C” 参与者2对 “a”的最优反应是 “C”.,博弈论与竞争策略,假设参与者1认为参与者2选择 “B”，则参与者1应该选择 “a” 参与者1对 “B”的最优反应是 “a”.,参与者 2,参与者 1,假设参与者2认为参与者1选择 “b”，则参与者2应该选择 “C” 参与者2对 “b”的最优反应是 “C”.,博弈论与竞争策略,假设参与者1认为参与者2选择 “C”，则参与者1应该选择 “a” 参与者1对 “C”的最优反应是 “a”.,参与者 2,参与者 1,假设参与者2认为参与者1选择 “c”，则参与者2应该选择 “A” 参与者2对 “c”的最优反应是 “A”.,博弈论与竞争策略,结果,“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应.,此结果被称为纳什均衡: 在给定其他参与者策略情况下，没有一个参与者能通过单方面改变自己的策略而使自己的得益提高，从而没有人有积极性打破这种均衡。,参与者 2,参与者 1,博弈论与竞争策略,关键点：,纳什均衡我所做的是：给定你所做的，我所做的是最好的；你所做的是：给定我所做的，你所做的是最好的,博弈论与竞争策略,静态，一次博弈的应用,公司的广告（或价格）博弈,默克,肯德基,纳什均衡,博弈论与竞争策略,彩电价格大战,伯特兰德寡头垄断（同质产品，价格竞争）,海信,长虹,纳什均衡,博弈论与竞争策略,智猪博弈,猪圈中有一头大猪一头小猪，猪圈一端有个按钮，每按一下猪圈另一端食槽中会有10个单位猪食进槽，但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽，大猪吃到9单位食物，小猪只能吃到1单位；如小猪先到，小猪吃4单位而大猪吃6单位；如果同时按并同时到食槽，则大猪吃7单位而小猪吃3单位食物。,小猪,大猪,纳什均衡,博弈论与竞争策略,性别之战-情侣博弈-协调博弈,女,男,纳什均衡,一对恋人准备在周末晚上一起出去玩，男的喜欢看球赛，但女的比较喜欢听音乐会。当然，两个人都不愿意分开活动，不同的选择给他们带来的满足由下表：,纳什均衡,博弈论与竞争策略,协调博弈,企业B,企业A,此协调博弈有两个纳什均衡,产业标准（软盘、CD的大小等）国家标准（电压、交通法等）,博弈论与竞争策略,回到囚徒困境,是否有方法脱离这种困境，从而使博弈方（寡头垄断企业）协调和合作成功呢？若囚徒困境博弈重复进行下去？在重复博弈中，囚徒的困境可以有合作的结果。,囚徒B,囚徒A,坦白拒不交待,坦白拒不交待,无期，无期,死刑，释放,释放，死刑,一年，一年,囚徒1：坦白囚徒2：坦白,重复博弈,博弈论与竞争策略,生活中的重复博弈,如果你去菜场买菜，当你对菜的质量、重量等有疑虑时，卖菜的阿姨常会讲：“你放心，我一直在这儿卖呢！” 在车站和旅游点等人群流动性大的地方，不但商品和服务质量差，而且假货横行，因为商家和顾客间“没有下一次”。在公共汽车上，两个陌生人会为一个座位争吵，可如果他们相互认识，就会相互谦让。在社会联系紧密的人际关系中，人们普遍比较注意礼节和道德，因为他们需要长期交往，并且对未来的交往存在预期。,博弈论与竞争策略,重复博弈广告博弈,两个企业 (Kelloggs & General Mills) 的经理想最大化利润策略是广告活动静态、一次博弈无限重复博弈有限重复博弈,博弈论与竞争策略,静态、一次广告博弈,通用面粉,凯洛格,博弈论与竞争策略,一次广告博弈的均衡,纳什均衡,通用面粉,凯洛格,劣策略：不管其他参与人采取什么策略，都能导致最低收益的策略理性参与人永远不会选择劣策略许多博弈中参与者都没有占优策略，但仍可能通过劣策略的重复剔除进行分析，这种方法称劣策略重复剔除法,博弈论与竞争策略,如果企业每年都进行这种一次博弈，并且永远进行下去，这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下，共谋起作用吗？,触发策略 “如果对手在过去没有做过广告，我就不做；一旦对手作广告，自此以后，我就用高强度的广告活动来惩罚他” 事实上，只要对手在过去没有过“欺骗”行为，各个企业都会同意“合作”。因为欺骗行为会引发以后所有时期的惩罚。,无限重复博弈,博弈论与竞争策略,假设General Mills采用了这种触发策略，Kelloggs的利润是多少呢?,合作 = 12 +12/(1+i) + 12/(1+i)2 + 12/(1+i)3 + = 12 + 12/i,相当于每年年底得到￥12的永久年金,欺骗 = 20 +2/(1+i) + 2/(1+i)2 + 2/(1+i)3 + = 20 + 2/i,通用面粉,凯洛格,博弈论与竞争策略,Kellogg从欺骗行为中获得的好处:,欺骗 - 合作 = 20 + 2/i - (12 + 12/i) = 8 - 10/i 假设i = .05 欺骗 - 合作 = 8 - 10/.05 = 8 - 200 = -192 欺骗没有好处. 在无限次重复博弈中共谋是纳什均衡!,通用面粉,凯洛格,博弈论与竞争策略,关键点,当博弈无限重复没有确定的“终结之日”时，共谋作为纳什均衡就能够维持下去这需要: 有能力监督对手的行动有惩罚叛徒的能力和名声低利率在未来进行博弈的机会多,市场条件: 厂商数目很少稳定的需求稳定的成本,博弈论与竞争策略,如果博弈有限重复进行，共谋起作用吗?,有限重复博弈,假设广告博弈被重复两次,通用面粉,凯洛格,纳什均衡,博弈论与竞争策略,用逆向归纳法，结论是：不。,在第二阶段，博弈是一次博弈，因此在这最后阶段，均衡是高强度的广告活动. 由于每个人都知道第二阶段的结果，因此，第一阶段就变成了最后阶段. 两个企业在两个时期的均衡策略都是高强度的广告活动. 如果博弈重复已知的有限次数，同样的结果依然成立,动态博弈求解：倒推法,倒退法的逻辑基础：先行动的居中人在前面阶段选择行动时，必然会考虑后面行动局中人的会如何行动，因此，只有在博弈最后一个阶段的博弈方才不会受到后续阶段的牵制，才能做出明确的选择；但后面阶段博弈方的选择确定后，前一阶段博弈方的行动也就容易确定了。,动态博弈纳什：倒推法,男,女,球赛,球赛,球赛,音乐,音乐,音乐,(2, 1),(0, 0),(-1, -1),(1, 2),先动优势-后动优势,动态博弈中，博弈方行动有先有后，若博弈方先行动得益大于其后行动得益的情况，称为先动优势；后行动得益比先行动得益大的情况叫做后动优势先动优势：“先下手为强”，动态情侣博弈等后动优势：“谦让是福”、猜拳博弈、切蛋糕等先动优势并非先行动者得益大于后行动者得益，后动优势也并非后行动者得益大于先行动者得益。,策略性行动,回到之前的进入博弈：尽管在A犹豫是否要进入的阶段，B威胁说只要A进入，它就选择商战，但最终A选择进入时，B却会选择容忍，因此，其之前的威胁是不可信的。博弈研究局中人互动行为，博弈的结果取决于博弈各方的行动，因此，在博弈过程中，一些局中人为达到某种目的，往往采取策略性行动，即某些能影响对手行动的行为（诱使对手采取有利于自己的行动或阻止对手采取不利于自己的行动）。策略性行动要求：可观察性；不可逆性，否则无效。,策略性行动,策略性行动:承诺(commitment)、威胁(threat)和允诺(promise) 承诺是一种无条件的策略性行动，如在B行动的阶段，A却对B说“在下阶段我将采取行动X”，这意味着未来阶段无论B如何行动，A都将采取行动X，A的行动是无条件的威胁和允诺是条件依存的策略性行动，若A对B说，“除非你的行动符合我的条件，否则我将采取行动报复你”，这是威胁；若说， “如果你的行动符合我的条件，我将采取对你有利的行动”，则是允诺。策略性行动要求