文档库 最新最全的文档下载
当前位置:文档库 › 经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题
经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题

5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。

“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

假设前提

假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?”

推理过程

从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。

3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。

不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。

同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。分析

1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。

不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。

首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。

如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓!

再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5

号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金

币给他们。这样,结果又当如何?

通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的

奶酪?”可以料想,一旦1号所提方案和其所想的不符,就会有人大闹……当

大家都闹起来的时候,1号能拿着97枚金币毫发无损、镇定自若地走出去吗?

最大的可能就是,海盗们会要求修改规则,然后重新分配。想一想二战前的希

特勒德国吧!

而假如由一次博弈变成重复博弈呢?比如,大家讲清楚下次再得100枚金

币时,先由2号海盗来分……然后是3号……

最可怕的是其他四人形成一个反1号的大联盟并制定出新规则:四人平分

金币,将1号扔进大海…这就是穷人平均财富,将富人丢进海里的仇富机械平

均理念。

制度规范行为,理性战胜愚昧!

如果假设变为,是10人分100枚金币,投票50%或以上才能通过,否则他

将被扔入大海喂鲨鱼,依此类推。50%是问题的关键,海盗可以投自己的票。因此如果剩下两个人,无论什么方案都会被通过,即100,0。

往上推一步,3个人时,倒数第三个人知道只剩两个人时的分配情况,因

此它会团结最后一个人,给他一个金币

“往前推一步。当前加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一

枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案

(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。

P4的情况差不多。他只要得一票就可以了,给P2一枚金币就可以让他投

票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的

推理方法只不过他要说服他的两个同伴,于是他给在P4方案中什么也得不到的

P1和P3一枚金币,自己留下98枚。

依此类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案

中什么也得不到的P2、P4、P6和P8一枚金币。

结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。

在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,

事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,

拉拢“挑战者”分配方案中最不得意的人们。

真地是难以置信。P1看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。而P10,看起来最安全,没有

死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连

一小杯羹都无法分到,却只能够保住性命而已。

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

浅析运筹学在实际生活中的应用

2011年5月

目录 摘要 (3) 一、引言 (3) 二、运筹学概述 (4) 三、运筹学的发展 (4) 四、运筹学的理论体系 (5) (1)规划论 (5) (2)决策论 (6) (3)运输问题 (6) (4)存储论 (6) (5)图论 (7) (6) 排队论 (7) (7)博弈论 (7) 五、运筹学的应用所涉及的领域 (8) (1)市场销售 (8) (2)生产计划 (8) (3)库存管理 (8) (4)运输问题 (9) (5)财政和会计 (9) (6)人事管理 (9) (7)城市管理 (9) 六、运筹学国内外应用现状 (9) 七、结论 (11) 八、结语 (11) 参考文献 (11)

浅析管理运筹学在实际生活中的应用 摘要:随着经济的快速发展和社会的进步,社会各行各业之间的竞争日益激烈,尤其表现为对资源的争夺。因此,在有限的资源下获得最大的利益是每个竞争者所考虑的问题,这也是经济学和运筹学所着重解决的问题。运筹学就是以数学为主要手段、着重研究最优化问题解法的学科。作为一门实用性很强的学科,运筹学可以用来很好的解决生活中的许多问题。运筹学有着广泛的应用,对现代化建设有重要作用。正因为如此,运筹学在企业决策领域中有着广泛的应用。众所周知,运筹学研究的根本目的在于对资源进行最优化配置,用数学的理论与方法指导社会管理,提高生产效率,创造经济效益。而企业投资的根本目的也是在资源的优化配置和有限资源的有效使用的基础上,达到既定目标,实现企业利润最大化。然而,随着市场竞争的日趋激烈,决策是否有效对于企业生存发展的影响愈来愈大。正确的决策可以使企业获利并促进企业的发展,而错误的或者无效的决策只能使企业无利可获甚至亏损,阻碍企业的发展。而运筹学、经济学、博弈论等决策性的科学可以引导投资者选择最佳投资组合策略,为决策者在投资决策过程中提供一些有价值的思路。用来解决人们用纯数学方法或者现实实验无法解决的问题,对企业正确决策的形成有着积极地促进作用。 关键词:管理运筹学;决策;应用;博弈论;理论体系;效益 一、引言 人们无论从事任何工作,不管采取什么行动,都希望所制订的工作或行动方案,是一切可行方案中的最优方案,以期获得满意的结果,诸如此类的问题,通常称为最优化问题。运筹学就是以数学为主要手段、着重研究最优化问题解法的学科。求解最优化问题的关键,一是建立粗细适宜的数学模型,把实际问题化

小议博弈论在日常生活中的应用

小议博弈论在日常生活中的应用 摘要:博弈过程本来就是一种日常现象。我们在日常生活中经常需要先分析他人的意图从而做出合理的行为选择,选出一种最优策略再加以行动。博弈融合在我们生活的点点滴滴之中,时时与我们相伴,所以,接下来的本文要为我们举例及讨论一些博弈论在生活中的应用。了解生活中的一些博弈事件后,希望我们日后能以理论结合实践,能从博弈论的理论角度出发,在实践中加以应用。 关键词:博弈、选择、策略、日常生活 正文:0引言 许慎在《说文解字》中说:“弈,围棋也!”班固的《弈旨》说:“北方之人谓棋为弈。”杨雄的《方言》也说:“围棋,自关东齐鲁之间谓之弈。”无论是六博还是围棋都是一种游戏,由此看,博弈最初的本意就是一种游戏。然而,随着博弈在社会生活中的发展与应用,现代数学中有博弈论,表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。 在现实生活中的个体、团体或其他组织,面对一定的环境条件,在一定的规律约束下,依靠掌握的信息,同时或先后一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并各自从中取得相应结果或受益,这个过程便是博弈的过程。博弈论的应用范围非常广

泛,市场竞争、环境保护、公共资源的开发与利用、各种经济比赛等都属于博弈现象。 1博弈论中的两个基本概念 (1)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。 (2)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 2博弈论在日常生活中的几个应用 (1)个人选择困境 “人生如棋,一步下错,全盘皆输。”这句话主要表达人的一生中的某些抉择的重要性。所以,我们每一次的选择何尝不是一种博弈呢?记得某位老师曾和我们说过这样一种观念——世界存在的一种三维空间,即是在未来的某一时刻存在着无数个你,有当画家的你、当作家的你、当科学家的你、当教师的你等等等等无数的你,然而,就是因为你某一瞬间的决定,杀死了无数个你自己。所以,选择即是与自己博弈的一种形式。譬如,填高考自愿,在当时的一种环境条件下,考虑了各方面的原因,根据自己所掌握的信息,各种纠结后做出了我们最后的选择。所以,可以说,经过这么一场与自己博弈的过程,

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

生活中的博弈论论文

生活中的博弈论 这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣的。其中含有很浓的智慧气息,趣味横生。下面就是我关于这门课的小论文。 我们首先就会问,什么是博弈论?其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。生活中每个人,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,博弈论经过了这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其对于理性人来说懂得如何博弈就显得越发重要。 下面我说一下我个人的想法。博弈其实就是一种游戏,是如何做出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通的游戏是一样的,其实这并不奇怪,其实博弈本身的含义就是博弈参与者在一定的规则条件下选择相应的策略以期获得足够的利益的过程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个三方博弈的过程。 为了能够了解博弈的含义,那么下面我们来看一下经典的博弈模型。 需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困境”。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

用博弈论的眼光来看日常生活中的事例

经 济 博 弈 论 作 业 —日常生活中有趣的小博弈 学院:经济学院 班级:09经济一班 姓名:朱广艳 学号:127生活中的小游戏——博弈无处不在

日常生活中的一切,均可从博弈中得到解释,大到即将进行的美国总统大选,小到宿舍提水事件。因为生活的本质,就是在进行一场游戏。博弈论的知识不仅能在学术界中光彩夺目,在其他领域例也得到充分地利用,在日常生活中我们可以凭借博弈论的思想来分析进而解决问题。博弈论是研究理性的行动者相互作用的形式理论,然而在生活中更多的游戏不仅仅是单人博弈,也是双人或多人的博弈。比如:商场谈判、政治斗争、恋爱结婚……都是这类博弈。以下例子就说明了这个问题。 情侣博弈: 某一天我觉得可能是女朋友的生日,但又不能肯定:如果是女朋友的生日的话,①我可以送一束花,女朋友会特别高兴,我的效用增加5个单位,②我不送花,但女朋友会埋怨你忘了她的生日,我的效用降低2个单位;如果不是女朋友的生日的话,①我可以送女朋友一束花,女朋友感到意外的惊喜,我的效用增加3个单位,②我不送花,结果生活同往常一样,可视为我的效用增加0单位。在这个博弈里,可以看到,“自然”可以有两种策略:确定今天是女朋友的生日或确定今天不是女朋友的生日,但不论“自然”采取何种策略,我的最好行动都是买花。买花是我的占优战略。博弈距阵如下(自然的得益皆为0): 自然 小偷和保安: 犯罪和防止犯罪是小偷和保安之间进行博弈的一场游戏。保安可以加强巡逻,或者休息。小偷可以采取作案、不作案两种策略。如果小偷知道保安休息, 他的最佳选择就是作案;如果保安加强巡逻,他最好还是不作案。对于保安,

如果他知道小偷想作案,他的最佳选择是加强巡逻,如果小偷采取不作案,自己最好去休息。当然,小偷和保安都不可能完全知晓对方将采取的行动,因此他们都将估计对方采取某种行动的概率,从而决定自己要采取的行动。结果是,他们将以一定的概率随机地采取行动,这叫“混合策略”。(假定小偷在保安休息时一定作案成功,在保安巡逻时作案一定会被抓住)如下图表示: 小偷 此矩阵可以表示,保安巡逻,小偷不作案,双方都没有收益也没有损失;保安巡逻,小偷作案,保安因抓到小偷受到上级领导的表彰,得到效用2单位,小偷被判刑丧失效用2单位;保安休息,小偷不作案,保安休息的很愉快得到效用2单位,小偷没有收益也没有损失;保安休息,小偷作案,保安因失职被处分而丧失效用1单位,小偷犯罪成功获得效用1单位。这个博弈是没有纳什均衡的。 电信价格: 根据我国电信业的实际情况,可以构造电信业价格战的博弈模型。假设次博弈参加者为电信运营商A与B,他们在电信某一领域展开竞争,一开始价格都为P0。A是中国电信老牌企业,实力雄厚,占据了绝大多数的市场份额,B中国联通则是刚刚成立不久,翅膀还没长硬,是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政府扶植起来鼓励竞争的,说以B得到了政府的一些优惠,其中就有B的接个可以比P0低5%。这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。在这样的市场分配下,A、B可以达到平衡,但是有一B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成影响。 这时候A该怎么做?不妨假定:

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

价格战中博弈论的浅析

价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流管理(采购与供应链1班) 学号:1040407122 姓名:曾维乐 二〇一一年十二月十八日

价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。 关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

博弈论经典案例《智猪博弈》

在经济学中,在经济学中,智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭 便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之 间的距离。 如果改变一下核心指标,猪圈里还会出现同样的小猪躺着 大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小 猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡

献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然 是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小 猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效 果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费 宀 完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最 大。 原版的智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规 则的设计者是不愿看见有人搭便车的,政府如此,公 司的老板也是如此。而能否完全杜绝搭便车”现象,就要看游戏 规则的核心指标设置是否合适了。

生活中的博弈论例子

生活中的博弈论有那些例子 那讲工作上的事假如你做的策划被上司偷了那你是要向更高级的领导告状还是忍受这也算一个博弈论问题你要是告状,也许能够伸冤,但也会若到上司他可能会给你下绊子但不上诉他也许会再偷,你的工作就白废了 还有物价方面假如几个店铺联合起来自然能够把东西卖的比较贵但只要其中一个降价其他店的客人就会全跑到那家去那另外几家也会被迫降价店铺联合本来是最好的赚钱方法但店铺间一般是敌对关系为防备有人订低价,引走客人所有的店铺都会尽可能低价其实我们学校门口的网吧刚上演了一出这个好戏真是有感触啊!!!!! 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 1.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略怎样才是“合理” 应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运

博弈论案例分析

博弈论案例分析 一、经济学中的“智猪博弈” (Pigs’payoffs) 故事背景:猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略,答案是:小猪将选择“搭便车”策略,也就 是舒舒服服地等在食槽边; 而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在,因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗,试试看。改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。对于游戏规则的设计者来说,这个规则的成相当高(每次提供双份的食物) ;而且因为竞争不强烈,想让猪们去多踩踏板的

生活中的博弈论教案

生活中的博弈论教案

授课课题:生活中的博弈论 学时:7 课题1(1课时) 一、教学目标: 1、知识与技能 1)了解博弈论的基本组成部分。 2)了解博弈论的发展历史与重要人物。 3)理解经典模型“囚徒困境”,学会运用所学的知识去理解生活中的一些类似现象。 2、过程与方法 1)通过参与课堂上的博弈游戏,了解到博弈论在现实生活中的普遍存在性。 2)通过现实生活案例分析,学会初步运用博弈论知识的方法,即倒推的思想方法。 3、情感态度价值观 1)通过集体参与的游戏,激发学生学习的兴趣,使学生对探索社会的行为规律有更强的欲望。 2)通过生活中案例的分析,提高学生的社会认知度,增强学生的道德观念。 二、学情分析 授课的班级为本市高中高一年龄段的学生,该阶段的学生的思维正在由形象思维到抽象思维转化,在认知上由感性认知到理性认知过渡,因此在教学内容上,主要以理解为主,结合生活中具体的事例,少一些枯燥乏味的理论知识与专业术语。在教学方法上要以寻求多样化,不要太过于单一。 三、教学重难点 重点:了解博弈论基本组成,在游戏中学会根据策略改变自身的策略,以达到取胜的目的。 难点:学生体验发现博弈论在生活中的普遍存在性,学会运用所学知识解读生活中的案例。

讲述经典模型“囚徒困境”,结合博弈论的三要素,多角度分析这一类模型。给出在这个模型下的基本矩阵模式,可以方便大家思考、选择最佳的策略。 分别考虑甲和乙的策略选择,筛选出最优的策略和最劣的策略,最终选择最优的策略,得到最终的结果。 从这个经典模型当中,我们知道,现实生活中到处都有着背叛,本来两个人都选择沉默,这样可以获得双赢。但是因为人心中的自私,不得不去选择告发。因此在我们的生活当中,我们在与人交往当中,一定要相互信任,不要让自己的自私毁了一切,也就是害人之心不可有,但是防人之心不可无。总之,我们要避免出现这样一个情况。 课题2(2课时)

论文-博弈论方法在经济学中

经济生活中的博弈论应用 摘要:博弈,这个原来只是在学术圈出现的名词,如今已经越来越多地走进了我们的生活。博弈论是运筹学的一个重要分支,其中,非合作博弈(non- cooperative game)是现代博弈理论中的核心内容和重要基础,下面通过对经典案例囚徒困境和智猪博弈的分析,对纳什均衡相关定义的研究,得到了在经济决策中行为人如何决定最优决策的方法。在此基础上,以纳什均衡作为理论支撑点,结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。 关键词:博弈论;均衡点;得益矩阵;纳什均衡

目录 一.引言 (3) 二.博弈论与纳什均衡的主要内容 (3) 2.1博弈论的主要思想 (3) 2.2博弈论的分类 (4) 2.3纳什均衡 (4) 2.4 纳什均衡的分类 (4) 三.案例分析 (5) 3.1 囚徒困境(1950年,图克) (5) 3.1.1案例分析 (5) 3.1.2案例应用 (6) 3.2 智猪博弈(1950年,约翰.纳什) (6) 3.1.1 案例分析 (7) 3.1.2 案例应用 (7) 四.价格战博弈 (8)

一.引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)以及冯·诺伊曼(V on·Neumann)。1928年冯·诺伊曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学期的基础和理论体系。1950-1951,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,以此为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。 二.博弈论与纳什均衡的主要内容 2.1博弈论的主要思想 书上是这样定义的:博弈是指一些个人或者组织面对一定的环境条件,在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施,进而各自取得相应结果的结果。现代科学将这种“对策论”、“对局理论”称之为博弈论,主要研究公式化了的激励结构间的相互作用。从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的

枪手博弈在经济生活中的应用

枪手博弈在经济生活中的应用 摘要:博弈,英文名叫Game theory,在博弈中有很多经典的博弈模型,在这里,我们重点讨论其中的一个——枪手博弈。本文试图分析枪手博弈的原理,并通过matlab建模求解,给出在不同概率下的不同策略组合,最后从博弈论的角度重新解读《三国演义》,通过具体的例子,阐述对博弈论的思考与分析。 关键字:枪手博弈;matlab;三国演义 正文 1、问题的提出: 在美国西部的一个小镇上,有三个快枪手彼此敌对。有一天,他们在街上相遇,立马就握住了枪把,把枪指向了对方,气氛紧张到了极点,一场生死决斗即将上演。三个枪手对于彼此之间的实力都很了解:A枪法精准,十发八中;B枪法也不错,十发六中;C的枪法最差劲,十发四中。那么,问题来了:假如三人同时开枪,谁活下来的机会大一些? 你可能会说:当然是A了,他枪法最好,实力最为强大,自然更容易活下来。但结果可能与你的预想不太一样,更合乎逻辑的推论是,枪法好的可能被干掉,而枪法差的反而更容易活下来。这是为什么呢?事实上,在这个游戏中博弈发挥了巨大了作用。 2、博弈论概述: 什么是博弈呢?博弈论,英文为Game theory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断)人们的决策行为。博弈是一种势态,在该势态中,两个或更多的参与人都在追求他们各自的利益,没有人能够支配结果。 博弈给人一种高大上的感觉,听起来很玄妙、很复杂。但是别忘了它的英文名叫Game theory。事实上,博弈就是从对游戏的研究中诞生的,而且仍然不断从其获得灵感。那好,让我们回到游戏,看看游戏中人该采取什么策略?

社会生活中的博弈论考试作业

社 会 生 活 中 的 博 弈 论 姓名: 学院: 专业: 学号: 一.什么是非合作博弈?什么是合作博弈?分别举出两个例子;并说明为什么随着人类文明的发展,合作博弈的情况会越来越多?

答:非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型,这是一种具有互不相容味道的情形。非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。 例1:话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

相关文档