当前位置：文档库 › 博弈论讲课囚徒困境

博弈论讲课囚徒困境

“囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（甲和乙）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判3年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判5年；如果都不坦白则因证据不足各判１年。

这就是二人博弈的支付矩阵也叫做双矩阵

博弈三要素；1，谁参与这个博弈（甲乙）二人博弈局中人或参与人2可供参与人选择的行动或策略（坦白抵赖），3 博弈中各种对局下各参与人的盈利或得益（参与人的支付）支付不是付出而是得到（判刑年数）

这种二人博弈是一种完全信息的静态博弈；博弈最基本的分类有两个一个是按照博弈各方是否同时决策分为静态博弈和动态博弈同时决策或者同时行动的博弈属于静态先后或序贯决策或行动的博弈属于动态即使决策或行动有先后但是只要参与者在决策时都还不知道对手的决策或行动是什么也算是静态博弈

另一分类是按照大家是否清楚各种对局情况下每个参与人的得益分为完全信息博弈和不完全信息博弈两种分类组合起来一共就有四大类博弈-----下面就具体来讲一下这个囚徒困境博弈既然两个囚犯最好的结果是都不招供，两人都只被判1年，那么，两个囚犯都选择不招供就好然而，人算不如天算，“囚徒困境”之所以称为“困境”正是因为这个博弈的最终结局恰恰是最坏的结果，即两个囚犯统统招供，结果都被判有期徒刑5年。为什么最后甲乙都会坦白呢？我们从博弈论来分析一下；对一个博弈来说，游戏规则非常地重要，适宜的规则才能够达到目的。在我们的日常生活中莫不如此，规则制订者往往利用条件制定出有利于自身的规章制度。

不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，不坦白的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判一年，不坦白的话判五年，坦白还是比不坦白好。结果，两个嫌疑犯都选择坦白。即是说，不管甲坦白或抵赖，乙的最佳选择都是坦白。反过来，同样地，不管乙是坦白还是抵赖，甲的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑五年，。这对他们个人来说都是最佳的，即最符合他们个体理性的选择。照博弈论的说法，这是惟一的纳什均衡点。

ps:纳什均衡：纳什均衡是指所有参与人的最佳战略组合；囚徒困境所反映出的深刻问题是，个人理性与集体理性的矛盾，也就是说，在一个集体里，有可能每个人都是理性的选择，但对于整个集体来说却是不理性的。各个局部都寻求利益的最大化，而整体利益却不是最优，甚至是最差。

"囚犯困境"在经济学上有很多应用，也有力地解释了一些经济现象。

一．电信价格竞争

。这就是此博弈最终所出现的纳什均衡。价格战博弈模型是典型的囚徒困境现象。

在以前，在企业的价格战中，企业之间也会多有沟通，甚至结成价格联盟，理论上，几乎所有的价格联盟都会遭到失败，原因就在于协定（类似囚犯的攻守同盟）不是一个纳什均衡，没有成员有兴趣遵守。那么是不是不可能有合作成功了？理论上，如果是无限期的合

作，双方考虑长远利益，他们的合作是会成功的。但只要是有限次的合作，合作就不会成功。比如合作１０次，那么在第九次博弈参与人就会采取不合作态度，因为大家都想趁最后一次机会捞一把，反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作，那么就很可能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到，从第一次开始大家都不会采取合作态度。

如我国家电销售商为使消费者多买自己产品，时常竞相降价、引发“价格大战”，其结果是“各败俱伤”，不仅谁也得不到最大利益。而且利润日益走低甚至赔本。可是如果他们在较高价格上形成某种默契，就都会得到不错的利润。还有许多其他行业的价格竞争都是典型的囚徒困境现象，如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。当然还是我们消费者受益这就不说了

还有冷战时期超级大国起先不合作，都想凭军事实力压倒对方，结果被拖入昂贵的军备竞赛并面临核屠杀的危险，后来有了一些合作（如签订限制战略武器协议）才有所缓解股市“博弈”双方的多数也处在一种“囚徒困境”中。对于股市中博弈双方来说，当股市涨到最高点时，无论对散户，还是对机构来说，任何一方的最大利益在于“我卖，而你没卖，我获得最大盈利”，而对于双方来说最理想的状态是“大家都不卖，把股市推向一个更高点位，大家都有更多利润空间”。

二.什么样才能跳出狭隘逻辑思考的圈圈呢？

要达到“集体利益”的话，就要跳出狭隘逻辑思维的怪圈，我觉得有两个因素讲得很不错一是人文情感、二是社会发展观，

（1）人文情感

让我们先回到“囚徒困境”，从“人文情感”角度来说，假设甲和乙互相之间有着充分的信任，有着牢固的情谊和以大局为重的思想，那么他们两个就会相信对方都不会背叛自己（抵赖），同时他们也不会为了仅仅1年刑期的区别而背叛对方。那么在这个基础上，他们就会获得“集体利益”最大化。这时候“最佳解”就出现了。

但是这时还有一个问题，就个人而言，如果他们其中一个背叛对方，就可以获得释放，得到“个体利益”最大化，那么“集体利益”最大化就使得他们的“个体利益”不能最大化了？

关于这个问题，首先，如果我们把这个案例放到现实中看，其实这时“个体利益”也是最大化了，因为要注意到我假设了甲和乙“有着牢固的情谊”。比方说，甲是你，乙是你父母、妻子或儿子，这种情况下我们追求“个体利益”最大化的同时也得到了“个体利益”最大化。

由此可见，“充分的信任，牢固的情谊和以大局为重的思想”这些东西对“集体利益”最大化至关重要，类似这样的人文情感的东西在现实生活中有很多的体现。大了来说，对国家，就是常说的意识形态、政治；就像以前的许许多多的革命烈士宁死不屈死都不坦白这就是对党对革命事业的忠诚。小了来说，对企业，就是企业文化、愿景；再小一点来说，就是个人，就是人与人之间的信任，比如友情、爱情、亲情。

我们拿大家比较感兴趣的爱情来谈谈，这也也可以套用“囚徒困境”。

我们总能看到这么些言论，“对女人来说，最好多认识男人，因为每个人都不是十

全十美的是吧有钱的花心专一的又没钱老实点的不懂得情调懂得浪漫的又不是很老实，所以女生最好选择一个男人作男朋友的同时，继续和多个男人保持不疏不密的关系（所谓的重点选拔，广泛培养），不要牺牲自己的青春来支持一个男人，在一个男人身上“获利”（金钱、权力）后，也要在另一个更优秀的男人身上，如此‘进步’”，这种类似“投资”的爱情在现实生活中确实存在，或许那个女人是刻意这么做的，或许她只是潜意识在不断最求“个人利益”最大化而这么做。

同样，男人们也会听到长辈、父母们这样那样的建议，无非是叫我们学会爱情也要现实，会做最优选择，相处时要学会有心眼，不要把钱都给老婆管了，要让老婆支持你的事业，获得财富，同时也要搞点外遇，美色不能少了.....

我们也都知道，如果男女双方都做到了足够“聪明”，大家都这么想的，采取了“最优方案”，那么他们获得了物质上的好处，也都能满足自己的需要，但这就却丧失了爱情。这种事例在生活中，比比皆是。我们看电影都知道小三的故事大多都是悲剧。

因此，两人要天长地久、幸福美满，就要有着深厚的感情，有着充分的信任，不管在一起还是分开了都要两个人站在一条船上，共同努力，既像辛劳的民工一样一点一滴地建立信任，又像无畏的勇士般坚定的守卫着两者间的感情。而不是自作聪明地追求所谓的“个体利益”最大化。当然了，作家李碧华说过；女人总是要吻上很多很多的青蛙，才有一个变成王子，中间的好多吻，花得很冤枉，但也有些女人，总是坚信自己遇到了王子，而往往吻过了，才发现那不过是一只青蛙。我们来说一下第二个因素

（2）社会发展观

建立“人文情感”从而使得“囚徒困境”中“集体利益”最大化，需要社会发展作为基础。简单的说，建立信任，那要整个社会环境是诚信的，是一个有坚固的信用的社会。

回到“囚徒困境”，假设甲和乙互相之间有着充分的信任，有着牢固的情谊和以大局为重的思想，忽然乙因为某种原因，背叛了甲，放弃了情谊和诚信，让甲“个人利益”受到最大损失，而自己“个体利益”最大化。

如果在一个较落后的社会，背信弃义的一方的确会获得“个体利益”最大化，而坚守原则的一方会蒙受灭顶之灾，比如在清末年间满朝腐败之时，贪官逍遥法外，清官往往受人排挤陷害；而在一个较发达的社会里，背信弃义的一方会受到道德的谴责和法律的惩罚，坚守原则的一方则会受到尊重，这时候从发展的观点看来，甲乙的情况可能就得调换，比如在德国，连过马路闯红灯都会导致保险费率加大。

这就是为什么我们千百年来都在不断追求制度的完善，这就是为什么我们在呼吁国家建立信托机制。

浅谈博弈论中的囚徒困境的解决方法

浅谈博弈论中的囚徒困境的解决方法摘要：囚徒困境是博弈论中的一个重要范例，这个问题涉及各个领域。本文通过三个简单的实例，来谈谈解决的方法。案例一：一个面馆的囚徒困境我曾经在路边一个小店里吃面，由于当时客人不是很多，就顺便与小老板聊了起来。通过老板的介绍听出了一些门道。以前面馆开店的时候请了一个师傅，开始的时候为了调动他的积极性他们采用按销售量分成，一碗面给5毛钱提成。这样的话，客人越多他挣得也就越多，为了吸引更多的顾客，他在碗里放很多的肉来吸引回头客，一碗面才6块钱，本来就靠薄利多销，他放的肉多，面馆自然也赚不到钱。后来呢，就换了一个结算方式，给厨师发固定的工资，这样客人多少跟他没有什么关系，但是新的问题又出现了，这次他在碗里放肉放很少，基本上把所有的客人都赶走了。客人少了，他就轻松了啊反正他拿的是固定的工资。通过这个案例我们可以了解到面馆的老板与厨师在工资的分配上存在一定的分歧，由于没有处理好，使得双方都处在不利的结局。解决方法：面馆的老板应该对厨师明确，每碗面的元材料是固定的，大师傅的工资还是按照销售量提成走，但是前题是每个月使用的原材料不能超额，否则只有基本工资。或者就规定每碗面里就放多少克肉。此外，还有一个更简单的办法就是：面馆的小老板亲自放肉。因为关键的资源一定要掌握在关键的人手里。经过以上的分析，我们可以得知解决的方法：1.工资加提成的制度确实能调动员工的积极性；2.权利下放可以，但是要有度；3.员工的工资提成不能只和销量挂钩，应该和老板的利润挂钩。4.有效的沟通、激励，平时给员工传达精神的奖励，让员工认为自己也是公司的主人。案例二：小餐馆的囚徒困境在天津新建的一片经济适用房社区里有两家小餐馆，他们都是经营当地的家常炒菜及快餐。因为这里是新开发的经济适用房，而周边像小饭馆这样的生活配套设施很缺乏，所以附近的建筑工人都是在这两家小饭馆解决三餐。这两家餐馆因为在口味、价格、菜的品种等都基本相同，所以一直以来这两家面对都是这些人，营业额都差不多，而附近的建筑工人们对于吃饭也没有什么特殊的爱好。好景不长，就在今年的夏天，两家餐馆的其中一家，暂且称为A

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境” 摘要：“囚徒困境”模型是博弈论中的经典范例，它是1950年Tucker提出的，其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握，成为解释生活现象的有力工具。其实“囚徒困境”模型随着博弈论的深入发展，具有各种不同的形式，通常分为：完全信息的静态博弈，完全信息的动态博弈，不完全信息的静态博弈及不完全信息的动态博弈四种形式。本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。关键词：博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。它的基本模型是：警察抓住了两个合伙犯罪的罪犯，由于缺乏足够的证据指证他们的罪行，所以希望这两人中至少有一人供认犯罪，就能确认罪名成立。为此警察将这两个罪犯分别关押以防止他们串供，并告诉他们警方的政策是“坦白从宽，抗拒从严”：如果两人中只有一人坦白认罪，则坦白者立即释放，而另一人则将重判5年徒刑；如果两个同时坦白认罪，则他们将各判3年监禁。当然罪犯知道如果他们两人都拒不认罪，则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益，第二个数字是囚徒2的得益) ：囚徒2 囚徒 1 （表1）假定两个罪犯熟悉彼此，这便是一个同时行动的完全信息静态博弈。容易看出，由于对

于每个囚徒而言，无论对方选择什么策略，坦白都是自己的最优策略，所以(坦白，坦白) 是博弈的Nash均衡。二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行，比如犯罪团伙会被警方多次审讯，日常生活中买卖会重复进行，国际间的战争此伏彼起。而且人们也发现基本博弈的重复进行并非基本博弈的简单累加，比如商业中的回头客问题。下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。首先观察“囚徒困境”的有限博弈，以T记基本博弈的重复次数。博弈重复进行所耗时间会比较长，支付的时间价值必须考虑，记r为折现因子。在有限博弈的情况下，可简化在r = l 的情况下讨论，并采用动态博弈的逆向归纳法进行研究：先分析t = T阶段两博弈方的选择，这仍然是一个基本的囚徒困境博弈，此时前一阶段的结果已成为事实，又无后续阶段，因此不难得出结论，这一阶段的结果是(坦白，坦白)，双方得益( -3 ，-3)。现在回到t = T -1阶段，理性的博弈方对于后一阶段的结局非常清楚，其结果必然是(坦白，坦白)，因此不管现阶段的博弈结果是什么，双方在本阶段以后的最终得益都是在本阶段得益的基础上各加上-3，此时的得益矩阵是：囚徒2 囚徒 1 （表2）容易看出，坦白仍是两博弈方的严格优超策略，即(坦白，坦白) 是T - 1阶段的唯一的纯Nash均衡。以此往上类推，每阶段“囚徒困境”博弈的结果都是博弈双方采用坦白，所以T次重复博弈的子博弈精炼Nash均衡是每个博弈阶段双方都采用坦白。再考虑“囚徒困境”博弈重复无数次。因为无限博弈没有最终阶段，所以不能运用逆向归纳法求解。考虑博弈双方都采用“冷酷战略”：( 1 ) 开始阶段选择抵赖；( 2 )选择抵赖直到有一方选择了坦白，为了报复对手的背叛，以后都选择坦白。假定囚徒j 严格执行上述冷酷战略，考察囚徒i 的最优策略是否为冷酷战略：如果i 在博弈的某个阶段首先选择了坦白，他在该阶段得到0，而不是-1，但他的这次背叛会遭到囚徒j的永远惩罚，因此i 在随后每个阶段的支付都是-3 。如果下列条件满足，给定j没有选择坦白，i将不会选择坦白： 22 0+r(-3)+r(3)-1+r(-1)+r(-1) -+≤+ ……，即： 31 11 r r r -≤- -- 解上述不等式得：r≥1／3 (这个条件容易满足)。就是说，如果r ≥1／3，给定j 坚持冷酷战略并且j没有首先坦白，i不会选择首先坦白。进一步假定j首先选择坦白，那么i 是否有积极性坚持冷酷战略以惩罚j的不合作行为？如果i 坚持冷酷战略，他随后每个阶段的支付是-3，但如果他选择其他战略，他在任何单一阶段的支付都不会大于-3，因此，无论r是多大，i都有积极性坚持冷酷战略。在博弈重复无数次的情况下，只要r>1／3，子博

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考二、囚徒困境的解释如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。实际上囚徒困境在我们的实际生活中也有很多，下面举两个进行说明

三、经济学例子：关税战两个国家，在关税上可以有以两个选择: 提高关税，以保护自己的商品。（背叛）与对方达成关税协定，降低关税以利各自商品流通。（合作）当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）四、商业例子：广告战商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。此二公司可以有二选择：互相达成协议，减少广告的开支。（合作）增加广告开支，设法提升广告的质量，压倒对方。（背叛）若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。除了这些还有的很多类似的例子，比如说公共产品的提供，商家的价格战等等，在这里就不多赘述了。五、“囚徒困境”现象的意义和启示通过以上几个关于囚徒困境的例子，特别是作为经济管理学院的学生，我们可以将博弈论的一些知识运用好，更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中，我们应该认识到“看不见的手”还有更多内涵，有待我们去发掘。本文主要通过对该理论的分析，从中发现对企业经营管理活动的有义启示。第一，在市场竞争过程中，一名优秀的经营者，无论做任何决策还是考虑问题应该有战略眼观，特别是在做出对企业乃至行业今后发展的竞争策略时，从长远出发，做正确的决断。第二，保存对手就是保存自己。在市场竞争中，让竞争对手发展就是自己发展，本着求同存异的思想，共谋发展，避免恶性竞争，避免两败俱伤的情况。第三，市场竞争不是纯粹的竞争，在义和利之间应该如何取舍，是一位有战略眼观的企业家该做的第一个选择。 2杜兰：走出“囚徒困境”《通信企业管理》[J] 2003年第4期，第31页

博弈论中的几个经典问题.doc

几个博弈论中的经典问题博弈论（ GameTheory ），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。几个重要的概念 1、策略 (strategies) ：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。 2、得失 (payoffs) ：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff ）函数。 3、次序（ orders ）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡 (Nash Equilibrium) ：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人 A 采取其最优策略a*, 局中人 B 也采取其最优策略 b*, 如果局中人 B 仍采取b*, 而局中人 A 却采取另一种策略a，那么局中人 A 的支付不会超过他采取原来的策略a* 的支付。这一结果对局中人 B 亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是 " 坦白从宽，抗拒从严 " ，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

博弈论之囚徒困境

博弈论之囚徒困境阿普顿是普林斯大学的高材生，毕业后被安排在爱迪生身边工作，他对依靠自学而没有文凭的爱迪生很不以为然。一次，爱迪生要阿普顿算出梨形玻璃泡的容积，阿普顿点点头，心想：这么简单的事一会几就行了。只见他拿来梨形玻璃泡，用尺上下量了几遍，再按照武样在纸上画好革田，列出了一道算式，算来算去，算得满头大汗仍没算出来。一连换了几十个公式，还是没结果，阿普顿惠得满脸通红，狼狈不堪。爱迪生在实验室等了很久，觉得奇怪，便走到阿普顿的工作问，看到几张白纸上密密麻麻的算式．便笑荚说：“您这样计算太浪费时间了。”只见爱迪生将一杯水倒连玻璃泡内，交给阿普顿说：“再找个量筒来就知道答案了。”阿普顿茅塞顿开，终于对爱迪生敬服．最后成为爱迪生事业上的好助手。有时候。科学并不一定意味着烦琐的计算与剥量，而是一种有浓厚艺术气息的思维方式。前者固然可以得出正确的结论，但是后者同样可以用一种出入意表的方式曲径通幽。这种方式，与我们在生活中运用博弈科学有异曲同工之妙。大量的教学模型吓不倒我们，因为我们可以对它们置之不理。有一个脑筋息转弯问题是这样的：在什么情况下零大干二，二大干五，五又大干零’答案是：在玩“石头．剪刀．布”游戏的时候。博弈．就是用这种游戏思维来突破看似无法改变的局面，解决现实的严肃问题的策略。在博弈中，每个参与者都在特定条件下争取其最大利益，强差一者来必胜券在握，弱者也未必永无出头之日。因为在博弈中，特别是多十参与者的博弈中，结果不仅取决干参与者的实

力与策略，而且还取决于其他参与者的制约和策略。事实上，博弈过程本来就不过是一种日常现象。我们在日常生活中经常薷要先分析他人的意田从而做出合理的行为选择，而所谓博弈就是行为者在一定环境条件和规则下，选择一定的行为或策略加以实施并取得相应结果的过程。博弈论首先是我们思索现实世界的一套逻辑，其次才是把这套逻辑严密化的数学形式。博弈论的目的在于巧妙的策略，而不是解法。我们学习博弈论的目的．不是为了享受博弈分析的过程，而在于赢得更好的结局。说到底，博弈论毕竟只是一个分析问题的工具，用这个工具来简化问题，使问题的分析清晰明了也就够了。博弈的思想既然来自现实生活，它就既可以高度抽象化地用教学工具来表述，也可以用日常事例来说明，并运用到生活中去。在斯大林时代的苏联，有一位乐队指挥坐火车前往下一个演出地点。正当他在车看当晚就要指挥演奏的作品乐谱时。两名克格勃(KGB，苏联国家安全警察。实际是政治特务将他作为间谍逮捕了。他们以为那乐谱是某种密码，这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲，却无济于事。在乐队指挥被投入牢房的第二天，审问者自鸣得意地走进来说：“我看你最好还是老实招了吧，我们已经抓住你的朋友柴可夫斯基了．他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了，只判你10年。”笑过之后，每个人都会思考其中所蕴涵的东西。但是如果认为这个笑话仅仅讽刺了克格勃特务的无知与无耻，那是不够的。事实上，克格勃们的花招，是想运

博弈论中的囚徒困境在生活中的应用

博弈论中的囚徒困境在生活中的应用囚徒困境最早出现在1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·（AlbertTucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。若二人都互相检举（互相“背叛”），则二人同样判监2年。如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：（1）若对方沉默、背叛会让我获释，所以会选择背叛。（2）若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。一，囚徒困境之于异地恋

论囚徒困境

简析博弈论中的囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。经典的囚徒困境警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择： ?若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。 ?若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。 ?若二人都互相检举（互相“背叛”），则二人同样判监2年。用表格概述如下：甲沉默（合作）甲认罪（背叛）乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势策略”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

经典的囚徒困境

经典的囚徒困境 1950年，由就職於兰德公司的梅里尔·弗勒德（Merrill Flood）和梅爾文·德雷希爾（Melvin Dresher）擬定出相關困境的理論，後來由顧問艾伯特·塔克（Albert Tucker）以囚徒方式阐述，並命名为「囚徒困境」。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但沒有足够证据指控二人入罪。於是警方分开囚禁嫌疑犯，分别和二人见面，并向雙方提供以下相同的选择： ?若一人認罪並作证检控對方（相關術語稱「背叛」對方），而對方保持沉默，此人将即時獲释，沉默者将判監10年。 ?若二人都保持沉默（相關術語稱互相「合作」），则二人同樣判监半年。 ?若二人都互相检举（互相「背叛」），則二人同樣判監2年。用表格概述如下：解說如同博弈論的其他例證，囚徒困境假定每個參與者（即「囚徒」）都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，

此策略稱為「嚴格劣勢」，理性的參與者絕不會選擇。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短？兩名囚徒由於隔絕監禁，並不知道對方选择；而即使他们能交谈，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇： ?若對方沉默、我背叛會讓我獲釋，所以會選擇背叛。 ?若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。二人面對的情況一樣，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是兩種策略之中的支配性策略。因此，这場博弈中唯一可能达到的纳什均衡，就是雙方参与者都背叛對方，結果二人同樣服刑2年。这場博弈的纳什均衡，顯然不是顧及團體利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，兩人都只會被判刑半年，总体利益更高，結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設，二人均為理性的個人，且只追求自己個人利益。均衡狀況會是兩個囚徒都选择背叛，结果二人判监均比合作為

博弈论中经典案例--“囚徒困境”

博弈论中经典案例--“囚徒困境” 博弈论中有一个经典案例--“囚徒困境”。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年;若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年;若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。囚犯可以做出如下选择：1、供出他的同伙(即与警察合作，从而背叛他的同伙)，2、保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。囚徒困境模型的几个现实例子囚徒困境的例子在现实生活中很多。比如国家与国家之间的军备竞赛，显然，各国都不把大量的财富花在可能永远都用不上的军备上是最佳选择。可是，如果别的国家不把钱花在军备上，我们花，那么我们会在两国外交和贸易中占得优势，拥有国际影响力，在未来战争中赢得胜利。如果别国把钱花在军备上，我们也花，那么我们至少可以不吃亏。所以，不管别的国家把钱花不花在军备上，我们把大把大把的钱花在军备上都是优势选择。所以，我们会把钱花在军备上。显然，别国也会这样想。结果是各国都会把大把大把的钱花在军备上，而且还互相攀比，想要胜过对方，占得优势，以便给对方造成压力。这就造成了军备竞赛，你花一百亿，我花一百五十亿。你花一百五十亿啊，那么我花两

囚徒困境(博弈论的经典案例)

囚徒困境（博弈论的经典案例）学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例--囚徒困境，非常耐人回味。囚徒困境，说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。----那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上

意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。当然，在现实世界里，信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中，其结果对双方都毫无益处。还有各国的贸易保护主义的永恒倾向。----但是，无论在自然界还是在人类社会，合作都是一种随处可见的现象。那么，问题就出现了：到底是何种机制促使生物体或者人类进行相互合作呢？----这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家，对合作的问题久有研究兴趣。为了进行关于合作的研究，他组织了一

博弈论经典案例“囚徒困境”以及其拓展

博弈论经典案例“囚徒困境”以及其拓展 05-06-13 10:57 发表于：《没有范的世界》分类：未分类博弈论（game theory）对人的基本假定是：人是理性的（rational，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。 “囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。在经济学方面的实例: 一．电信价格竞争根据我国电信业的实际情况，我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争，一开始的价格都是P0。A（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市场份额；B（中国联通）则刚刚成立不久，翅膀还没有长硬，是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政府扶植起来鼓励竞争的，所以B得到了政府的一些优惠，其中就有B的价格可以比P0低10％。这一举动，还不会对A产生多大的影响，因为A的根基实在是太牢固了。在这样的市场分配下，A、B可以达到平衡，但由于B在价格方面的优势，市场份额逐步壮大，到了一定程度，对A造成了影响。这时候，A该怎么做？不妨假定： A降价而B维持，则A获利15，B损失5，整体获利10； A维持且B也维持，则A获利5，B获利10，整体获利15；

浅析囚徒困境与纳什均衡

浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，

我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法

博弈论之“囚徒困境”与酒店管理

博弈论与酒店管理一、什么是博弈论之“囚徒困境” 公案：两个嫌疑犯（A和B）作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白各判8年，如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年，如果都不坦白则因证据不足各判1年。分析：假定A选择坦白的话，B最好是选择坦白，因为B坦白判8年而抵赖却要判十年；假定A选择抵赖的话，B最好还是选择坦白，因为B坦白不被判刑而抵赖却要被判刑1年。即是说，不管A 坦白或抵赖，B的最佳选择都是坦白。反过来，同样地，不管B是坦白还是抵赖，A的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑8年。结论：囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖，各判刑1年，显然比都选择坦白各判刑8年好得多。当然，A和B可以在被警察抓到之前订立一个“攻守同盟”，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。二、酒店经营中的“博弈”思维引言：现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。案例：昆明酒店业的冬天 1988年云南省确定旅游业在国民经济中的地位后，在1999年成功举办了世界园艺博览会，极大提升云南旅游知名度的同时，也带动了一系列酒店的兴起。随着游客大幅增加和政府逐渐重视，从1997年到1999年，昆明星级酒店一共73家，其中五星级酒店6家。 2003年，官方统计数据显示：昆明拥有正规饭店530多家，共5万多个标准间，可容纳11万人住宿，其中星级饭店110多家，有五星级酒店5家，四星级酒店16家，三星级酒店33家。四星、五星级的高级酒店就有几十家，星级酒店规模和档次远高于同等规模的城市。盲目建设的背后，引发的是酒店业的疯狂价格战和酒店业的业绩下滑，并由此带来的行业大调整。经过’99昆明世博会期间的剧增和短期繁荣后，昆明酒店业迅速进入了大面积亏损的低迷期。酒店业濒临崩溃，星级宾馆价格低廉，五星级酒店一晚260元。行业竞争之惨烈，超乎想象。 “260元，这是什么价格？在上海，也就是在波特曼吃顿早餐罢了。”昆明市饭店行业协会秘书长杨艾军说起这个话题，就显得痛心疾首。“’99世博会之前的昆明，酒店住房异常紧俏。杨艾军说，曾经有一个团队的导游，因为无法解决团员的住宿，跪在一家酒店的大堂痛哭流涕。”可惜这样的好年景现在是一去不复返了，昆明酒店竞相削价导致的恶性竞争，使得整个行业面临崩盘的危机。应对：“提质增效”运动之后，为了提顿行业颓势，整个城市的酒店开展声势浩大的“提质增效”运动，业内的所有相关环节，都在媒体上发布行业自律公约。被价格战打得焦头烂额的昆明旅游业，不得不停下手来，重新构架自己的价格体系，试图遏止几乎是全行业参与其间的恶性价格竞争。在1999年世博会之前，整个昆明的住宿企业只有不到100家，星级饭店也只有几十家，而且几乎家家都能盈利。以1999年为一道明显的分水岭，之前的昆明住宿企业，平均房价在350元以上，而在此之后，平

《管理经济学》-博弈论与囚徒困境

南开大学现代远程教育学院考试卷 2020年度春季学期期末(2019.9) 《管理经济学》主讲教师：卿志琼一、请同学们在下列（20）题目中任选一题，写成期末论文。 1、竞争与效率的比较分析 2、谈谈你在工作或者生活中如何运用管理经济学的基本理论与方法。 3、阐述边际效用递减规律，并举例说明。 4、运用供求法则分析某一商品或要素价格的决定与未来价格趋势。 5、需求价格弹性、需求交叉弹性与企业的产品定价策略分析。 6、消费者均衡条件与应用。 7、生产三阶段与企业的管理决策。 8、阐述机会成本与企业决策，并举一例子说明。 9、短期成本函数与长期成本函数的含义与比较。 10、量本利分析的含义与应用。 11、规模经济与规模不经济的含义与应用。 12、论生产要素报酬递减递减规律对企业资源配置的启示。 13、自然垄断与行政垄断的比较，举例说明。 14、完全竞争市场的特点与企业短期停止营业点决策。 15、寡头垄断市场厂商的策略行为。 16、论完全竞争与完全垄断市场的条件与长期均衡点比较。 17、垄断竞争市场的产品差异化与非价格竞争。 18、企业的定价方法与实践。 19、论资本预算决策的原则与方法——以**为例。 20、博弈论与囚徒困境——以**为例二、论文写作要求 1、论文题目应为授课教师指定题目，论文要层次清晰、论点清楚、论据准确； 2、论文写作要理论联系实际，同学们应结合课堂讲授内容，广泛收集与论文有关资料，含有一定案例，参考一定文献资料。 3、第4题、6题、8题、10题、11题、18题、19题、20题，可以加副标题。如第4题：运用供求法则分析某一商品或要素价格的决定与未来价格趋势——以天津房价为例。三、论文写作格式要求：论文题目要求为宋体三号字，加粗居中；正文部分要求为宋体小四号字，标题加粗，行间距为1.5倍行距；论文字数要控制在2000－2500字；

博弈论案例分析1

一、经济学中的“智猪博弈”（Pigs’payoffs）故事背景：猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？试试看。改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。原版的“智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小猪”也有），一度十分努力的大猪也不会有动力了----就像“智猪博弈”

从“囚徒困境”模型谈博弈论与企业管理

称为20世纪人类最杰出的贡献之一。博弈在人类社会历史中普遍存在，博弈论既是一种新的社会历史观，也是一种随着其理论与应用迅速的发展，博弈论已成为众多领域的基本分析方法。 1.现代企业管理充满了博弈的思想论(Crame Theory)又称对策论，起源于本世纪初，1994年诺依曼和摩根斯坦恩合著的《博弈论和经济行为》奠定了。简单地说，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间决策年来博弈论受到高度的重视和青睐，博弈论作为分析和解决冲突和合作的工具，在管理科学、国际政治、生态学等领泛的应用。论文百事通界大战以来，各国的经济、经济政策以及世界经济环境发生了深刻的变化，生产规模不断扩大和集中，垄断和寡头垄生活中各种力量的联合和对抗不断强化，以及各国政府对经济生活干预强化等等，都使得当今世界经济内部的企业之之间、企业和工会组织之间、政府和企业之间、政府和消费者之间的相互影响、相互依存和相互制约不断加强。面对注重经济生活中各个方面、各个个体之间的相互影响和制约为研究前提的博弈理论便充实在现代企业管理的各个环 2.博弈论在现代企业管理中的应用-----“囚徒困境”模型 2.1 “囚徒困境”现象徒困境”的具体内容如下:两个嫌疑犯作案后被警察逮捕,分别关在不同的屋子里审讯,警察告诉他们,如果两个人都坦白刑8年；如果两个人都抵赖,每人各判刑1年；如果其中一人坦白,另一人抵赖的话,坦白的人释放,抵赖的人判刑10年，我们知道每个囚徒都有两种战略: 坦白或者抵赖。在这个博弈中,纳什均衡是(坦白,坦白)。尽管从总体上看,(抵赖、两个人都有益的结果,但是事实上现实生活中的结果却并非如此。 2.2“囚徒困境”与价格策略徒困境”模型是博弈论中的经典范例，其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握，成为解释生活现实生活中许多的经济、政治、军事、社会以及日常生活中的博弈现象都可以用此博弈来解释。例如，我们熟悉的国伏的价格大战。们的生活中经常会遇到各种各样的价格大战，今天我降价，明天你让利，价格大战此起彼伏，没完没了。由于过度的家基本上没有利润，甚至亏损，结果最终影响企业自身的长远发展。最经典的例子是2000年的彩电价格联盟事件。彩电巨头在深圳召开价格联盟会议，要求各联盟成员不得降价，否则要受到处罚，但墨迹未干，与会成员就纷纷违反因为联盟中没有一个成员会相信对手真的会认真承诺自己的协议。在这里，他们就是面临着一个“囚徒的两难选择”问然是都不降价对于各彩电巨头整体是最好的选择，但他们的理性开始作祟了，作为理性人可能会想到在自己遵守诺言的商家降价，其结果必然是自己的市场被对手占领，那么不如自己先降价，就可以抢占先机。所以，最终的选择就是那么彩电价格联盟便就此宣告破产。何避免这种恶性的价格战呢？即如何使各联盟成员不会违反协议，这可能就要有使得各方不会违背自己承诺的足够理发，博弈双方总想占对方的便宜，背叛对方。那么，要想使各方都老老实实的遵守协议，首先就要有严厉的惩罚措施，我们都知道新加坡是一个花园之国，国家的环保工作成绩斐然，这其实与新加坡的法律是有很大关系的，拿随地吐前,在新加坡如果有人随地吐痰、扔垃圾，对不起了，罚款500新元,这可相当于2309.95元人民币！！！另外，除惩罚措施就是进行社会公益性服务,即被分派到公园、海边等公共场所捡垃圾，一般服务时间为几个小时。所以现在，随意吐痰、仍垃圾的现象了，新加坡人这种意识已经完全“内化”了。在价格博弈中，我们首先要让对手明白你采取的叛会受到惩罚，以及惩罚的严重性，从而有效地防止对手背叛，引出对手的合作。可以认为策略应具有报复性。 3.博弈论在现代企业管理中的重要性今世界，网络、通信和信息技术飞速发展，特别是互联网技术的普及和应用，正改变着世界。企业运营所处的环境发业之间的互补性、依赖性和制约性增强，合作变得更得十分必要。我国经济体制改革以来，企业和个人在经济活动中日益增强。随着全球经济一体化趋势加快以及我国加人WTO，各跨国公司纷纷抢滩中国市场，国内市场国际化竞争环境也更加复杂、多变，要想在激烈的市场竞争中立于不败之地，企业不能仅凭实力，更要注重谋略，在现代企业管弈论正发挥着不可替代的重要作用（作者单位：贵州大学管理学院）

博弈论讲课 囚徒困境