文档库 最新最全的文档下载
当前位置:文档库 › 博弈论案例分析

博弈论案例分析

博弈论案例分析
博弈论案例分析

博弈论案例分析

博弈论分析

一、经济学中的“智猪博弈”(Pigs’payoffs)

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多

劳者多得。每次的收获刚好消费完。

对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。

许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。

二、囚徒困境博弈

在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。

表囚徒困境博弈 [Prisoner's dilemma]

B 坦白 B 抵赖

A 坦白–8, –8 0, –10

A 抵赖–10, 0 –1, –1

我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)

是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。

要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。

话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判 10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均

衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。

不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境” 这样的例子。如价格战博弈、军奋竞赛博弈、污染博弈等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略 (strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。

“重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?

事实上,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报。我把它叫做“以其人之道,还治其人之身”。

“一报还一报”的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下

一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。

三、价格战博弈

现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论 (vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

四、污染博弈:

假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。

五、贸易战博弈论

这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y 能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家

都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。

博弈论--这是一个热得烫手的概念。它不仅仅存在于数学的运筹学中,也正在经济学中占据越来越重要的地位(近几年诺贝尔经济学奖就频频授予博弈论研究者),但如果你认为博弈论的应用领域仅限于此的话,那你就大错了。实际上,博弈论甚至在我们的工作和生活中无处不在!在工作中,你在和上司博弈,也在和下属博弈,你也同样会跟其他相关部门人员博弈;而要开展业务,你更是在和你的客户以及竞争对手博弈。在生活中,博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。

诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。

弈中最优策略的产生

艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。

社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。

显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。

对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选 C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C 得零分。因此,无论对方选C或D,对A来说,选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇,即A,B都选D时,结果是各得1分。这个结果在矩阵中并非最优。困境就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。在数学上,这个一次性决策的矩阵没有最优解。

如果博弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,对策者没有一次会合作。

如果博弈在多人间进行,而且次数未知,对策者就会意识到,当持续地采取合作并达成默契时,对策者就能持续地各得3分,但如果持续地不合作的话,每个人就永远得1分。这样,合作的动机就显现出来。多次对局下,未来的收益应比现在的收益多一个折现率W,W越大,表示未来的收益越重要。在多人对策持续进行下去,且W比较大,即未来充分重要时,最优的策略是与别人采取的策略有关的。假设某人的策略是,第一次合作,以后只要对方不合作一次,他就永不合作。对这种对策者,当然合作下去是上策。假如有的人不管对方采取什么策略,他总是合作,那么总是对他采取不合作的策略得分最多。对于总是不合作的人,也只能采取不合作的策略。

艾克斯罗德做了一个实验,邀请多人来参加游戏,得分规则与前面的矩阵相同,什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。

第一轮游戏有14个程序参加,再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。艾克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即"善良的";第二,对于对方的背叛行为一定要报复,不能总是合作,即" 可激怒的";第三,不能人家一次背叛,你就没完没了的报复,以后人家只要改为合作,你也要合作,即"宽容性"。

为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是:第一,"一报还一报"仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是"不善良的",后15名中,只有1个总是合作的是"善良的"。可激怒性和宽容性也得到了证明。此外,好的策略还必须具有的一个特点是"清晰性",能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。"一报还一报"就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。

[编辑]合作的进行过程及规律

"一报还一报"的策略在静态的群体中得到了很好的分数,那么,在一个动态的进化的群体中,这种合作者能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作?为了回答这些疑问,艾氏用生态学的原理来分析合作的进化过程。

假设对策者所组成的策略群体是一代一代进化下去的,进化的规则包括:一,试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。第二,遗传。一个人如果合作性好,他的后代的合作基因就多。第三,学习。比赛过程就是对策者相互学习的过程,"一报还一报"的策略好,有的人就愿意学。按这样的思路,艾氏设计了一个实验,假设63

个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。

实验结果很有趣。"一报还一报"原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。另外,有一些程序在进化过程中消失了。其中有一个值得研究的程序,即原来前15名中唯一的那个"不善良的"哈灵顿程序,它的对策方案是,首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛。这个程序一开始发展很快,但等到除了"一报还一报"之外的其它程序开始消失时,它就开始下降了。因此,以合作系数来测量,群体是越来越合作的。

进化实验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。"一报还一报"在两个人对策时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的,因为它让对方得到了高分。哈灵顿程序就不是这样,它得到高分时,对方必然得到低分。它的成功是建立在别人失败的基础上的,而失败者总是要被淘汰的,当失败者被淘汰之后,这个好占别人便宜的成功者也要被淘汰。

那么,在一个极端自私者所组成的不合作者的群体中,"一报还一报"能否生存呢?艾氏发现,在得分矩阵和未来的折现系数一定的情况下,可以算出,只要群体的 5%或更多成员是"一报还一报"的,这些合作者就能生存,而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后蔓延到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。这就说明,社会向合作进化的棘轮是不可逆转的,群体的合作性越来越大。艾克斯罗德正是以这样一个鼓舞人心的结论,突破了"囚犯困境"的研究困境。

在研究中发现,合作的必要条件是:第一、关系要持续,一次性的或有限次的博弈中,对策者是没有合作动机的;第二、对对方的行为要做出回报,一个永远合作的对策者是不会有人跟他合作的。

那么,如何提高合作性呢?首先,要建立持久的关系,即使是爱情也需要建立婚姻契约以维持双方的合作。(火车站的小贩为什么要骗人?为什么工作中要形成小组制度?换防的时候一方总是要小小地进攻一下的,在中越前线就是这样)第二、要增强识别对方行动的能力,如果不清楚对方是合作还是不合作,就没法回报他了。第三、要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作。第四、能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方采取合作态度。第五、不要嫉妒人家的成功,"一报还一报"正是这样的典范。第六、不要首先背叛,以免担上罪魁祸首的道德压力。第七、不仅对背叛要回报,对合作也要作出回报。第八、不要耍小聪明,占人家便宜。

艾克斯罗德在《合作的进化》一书结尾提出几个结论。第一、友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合

作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。第二、预见性也不是合作的前提,艾氏举出生物界低等动物、植物之间合作的例子来说明这一点。但是,当有预见性的人类了解了合作的规律之后,合作进化的过程就会加快。这时,预见性是有用的,学习也是有用的。

当游戏中考虑到随机干扰,即对策者由于误会而开始互相背叛的情形时,吴坚忠博士经研究发现,以修正的"一报还一报",即以一定的概率不报复对方的背叛,和 "悔过的一报还一报",即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强,"悔过的一报还一报"效果越好,"宽大的一报还一报"

效果越差。

[编辑]艾克斯罗德的贡献与局限性

艾克斯罗德通过数学化和计算机化的方法研究如何突破囚徒困境,达成合作,将这项研究带到了一个全新境界,他在数学上的证明无疑是十分雄辩和令人信服的,而且,他在计算机模拟中得出的一些结论是非常惊人的发现,比如,总分最高的人在每次博弈中都没有拿到最高分。(刘邦和项羽的战争)

艾氏所发现的"一报还一报"策略,从社会学的角度可以看作是一种"互惠式利他",这种行为的动机是个人私利,但它的结果是双方获利,并通过互惠式利他有可能覆盖了范围最广的社会生活,人们通过送礼及回报,形成了一种社会生活的秩序,这种秩序即使在多年隔绝,语言不通的人群之间也是最易理解的东西。比如,哥伦布登上美洲大陆时,与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为,比如无偿损赠,也通过某些间接方式,比如社会声誉的获得,得到了回报。研究这种行为,将对我们理解社会生活有很重要的意义。

囚徒困境扩展为多人博弈时,就体现了一个更广泛的问题──"社会悖论",或"资源悖论"。人类共有的资源是有限的,当每个人都试图从有限的资源中多拿一点儿时,就产生了局部利益与整体利益的冲突。人口问题、资源危机、交通阻塞,都可以在社会悖论中得以解释,在这些问题中,关键是通过研究,制定游戏规则来控制每个人的行为。

艾克斯罗德的一些结论在中国古典文化道德传统中可以很容易地找到对应,"投桃报李"、"人不犯我,我不犯人"都体现了"tit for tat"的思想。但这些东西并不是最优的,因为"一报还一报"在充满了随机性的现实社会生活里是有缺陷的。对此,孔子在几千年前就说出了"以德报德,以直报怨"这样精彩的修正策略,所谓"直",就是公正,以公正来回报对方的背叛,是一种修正了的"一报还一报",修正的是报复的程度,本来会让你损失5分,现在只让你损失3分,从而以一种公正审判来结束代代相续的报复,形成文明。

但是,艾氏对博弈者的一些假设和结论使其研究不可避免地与现实脱节。首先,《合作的进化》一书暗含着一个重要的假定,即,个体之间的博弈是完全无差异的。现实的博弈中,对策者之间绝对的平等是不可能达到的。一方面,对策者在实际的实力上有差异,双方互相背叛时,可能不是各得1分,而是强者得5

分,弱者得0分,这样,弱者的报复就毫无意义。另一方面,即使对局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取背叛的策略能占便宜。艾氏的得分矩阵忽视了这种情形,而这种赌徒心理恰恰在社会上大量引发了零和博弈。因此,程序还可以在此基础上进一步改进。

其次,艾氏认为合作不需预期和信任。这是他受到质疑颇多之处。对策者根据对方前面的战术来制定自己下面的战术,合作要求个体能够识别那些曾经相遇过的个体并且记得与其相互作用的历史,以便作出反应,这些都暗含着"预期"行为。在应付复杂的对策环境时,信任可能是对局双方达成合作的必不可少的环节。但是,预期与信任如何在计算机的程序中体现出来,仍是需要研究的。

最后,重复博弈在现实中是很难完全实现的。一次性博弈的大量存在,引发了很多不合作的行为,而且,对策的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。比如,资本积累阶段的违约行为,国家之间的核威慑。在这些情况下,社会要使交易能够进行,并且防止不合作行为,必须通过法制手段,以法律的惩罚代替个人之间的"一报还一报",规范社会行为。这是艾克斯罗德的研究对制度学派的一个重要启发。

[编辑]博弈论案例分析

[编辑]案例一:博弈论在企业人力资本投资中的应用[1]

一、引言

一个企业能否在市场中取得经济优势,依赖于企业科技优势、产品的市场适应性等等,而这一切又源于人才优势。因此,一个企业面临着如何尽可能地保持自己人力资源的优势,如何吸引优秀人才加入企业添加新动力,如何有效培训使己有员工获得技能的提高,如何使员工适应外部环境变化的要求,如何有效挽留公司的核心人才等等。但是统计调查显示,我国的培训现状不尽如人意。总体来看,我国企业培训管理的制度化、规范化程度有待加强,培训计划执行不力,培训效果跟踪与评价环节薄弱,培训对改善员工绩效的效用没有发挥,培训结果与员工晋升没有太大影响等。造成这种现状的原因固然是多方面的,其中一个主要原因就是人力资本投资收益的滞后性和不确定性,担心员工“硬了翅膀就飞走”,得不偿失。企业是否增加人力资本投资,员工是否留任企业,都是利益的博弈,结果是选择有利于自己的战略。本文用博弈论对企业人力资本投资作分析,说明企业应当进行人力资本投资和投资后应采取措施保证人力资本投资收益的获取。

二、概念和假定

1.概念界定

①人力资本。人力资本是通过投资于已有人力资源而形成的、以复杂劳动力为载体的、能实现价值增值的可变资本。

②企业人力资本投资。企业人力资本投资是指企业通过一定的投入(货币、资本或实物)获得人力资源,增加企业员工的知识、技能、健康水平,提高企业管理、文化水平和企业形象,从而提升企业人力资本存量,使企业经济效益提高的一

种投资行为。

2.基本假设

①经济人。经济人假设是指无论是组织还是个人,追求自身利益的最大化。

②完全信息。完全信息是指信息是完全通畅的,不存在滞塞,而且客观存在的信息的获取是不需要成本的。

③物质资本充足。商品的生产总是物质资本和人力资本结合在一起进行的。

要使生产高效率的进行,物质资本和人力资本必须保持适当的比例。

三、人力资本投资与员工个人的博弈分析

本文从企业与员工之间的角度作人力资本投资的完全信息静态博弈分析,重点分析企业是否增加人力资本投资以及投资后如何行动。

假定在完全信息的条件下,企业和员工都是理性的。企业可以选择对员工培训或不培训。根据企业的选择,员工会做出留下或是转投其他企业的选择。假设企业不对员工进行培训是员工的收入为d,当企业选择培训,假设分摊到员工个

人的培训费用为c,经过培训后多支付员工的薪水为e(e可以为零,即经过培训后不增加员工薪水),经过培训后员工为企业带来的收益增加值为b。又假设员工离职去另一单位获得的报酬为a。这里为了分析更简单一些,假设员工经过培训与未经过培训跳槽的收入一样,都为a。有时候培训后由于员工技能提高跳槽会获得更多的收入,但是并不影响下面的分析。企业培训博弈分析如表1所示: 当b-c-e<0时,即企业对员工培训后得到的收益增加值小于支出时,不管员工做出

如何决策,企业都不会得到任何的收益增加值,因此企业是不会对员工进行培训投入的。

当b-c-e>0时,该博弈成立并可能会出现两种均衡:如果此时员工选择留下所获得的收益d+e大于其选择跳槽时所获的收益a时,理性的员工必定会留在原来的企业,企业也必然会选择培训投入,这也是这个博弈中双方的最优决策;如果此时员工选择留下所获得的收益d+e小于其选择跳槽时所获的收益a时,理性的员工必定选择跳槽,此时企业损失为c,损失最惨重。对企业而言,如果知道这样做令员工跳槽的话,那么企业还不如刚开始就不培训,那样蒙受的损失会少些。这里需要指出的是,一个员工是否跳槽并不简单的取决于对方企业开出的薪酬。影响因素有很多,比如员工个性是否与企业匹配、员工个人发展前景、员工兴趣与岗位的匹配等等。上述表格中,企业如果不对员工进行培训,那么员工留下或离职取决于现有收入d和跳槽企业的薪酬a。

如果d>a,员工留下:反之员工跳槽

总之,员工是否留任企业,是一种利益的博弈,并且企业与员工之间存在着信息的不对称,企业必须采取先发行动传递信号减弱员工离任的动机,只要企业能留住员工,人力资本投资就会给企业带来巨大的经济效益。

[编辑]案例二:博弈论在企业经营活动的应用策略[2]

哈佛商学院波特教授的竞争五种力量,给出了我们思考行业市场竞争状况和态势时一种全面而详细的分析方法,其中一种力量是潜在进入者的威胁。

那么,根据市场类型(完全竞争市场、垄断竞争市场、完全垄断市场和寡头垄断市场),由于多数行业市场属于垄断竞争市场,就存在现有企业和新进入者之间的进入和退出博弈,这取决于彼此结构性的进入障碍、对关键资源的控制度、规模经济效应及现有企业的市场优势的因素。

如果你是现有行业的垄断者和一定程度的影响者,阻止潜在进入者进入市场或遏止现有企业恶性竞争的博弈策略有:

1.扩大生产能力策略

垄断者为阻止潜在进入者进入市场,垄断者可能对潜在进入者进行威胁。但垄断者的这种威胁是否能达到阻止进入的目的,取决于其承诺。所谓承诺(Promise),是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。那么,一种威胁在什么条件下会变得令人可信呢?一般是,只有当对局者在不实行这种威胁会遭受更大损失的时候,与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。发表声明是容易的,仅仅宣称将要做什么或者标榜自己是说一不二的人也都缺乏实质性的意义。因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本或代价,才会使威胁变得可信。

2.保证最低价格条款的策略

所谓“保证最低价格”条款策略,即可采取限制性定价策略,通过收取低于进入发生时的价格来防范进入。如某商店规定,顾客在本商店购买这种商品一定时期内(如一个月),如果其他任何商店以更低的价格出售同样的商品,本店将退还差价,并补偿差额的一定百分比(如10% )。例如,如果你在该商店花5 000元购买了一架尼康相机,一周后你在另一家商店发现那里只卖4500元,那么你就可以向该商店交涉,并获得550元的退款。

又如假定一个将存在两期的市场。在第1期只有一个厂商,面临两种选择:

①制定一个垄断高价60元,可获1 000元的利润,但会使潜在企业认为该行业有利可图,从而选择在第2期进入;而一旦该市场有两个企业存在,将会使市场价格下降到30元,企业利润降为200元。这样,两期的总利润是1000+200=1200元。

②制定低价40元,潜在企业如果进来,价格降到20元,两个企业的利润都将

是0。

故此时潜在企业将不会进入。这样,第二期的价格可以确定一个垄断高价60元,因此总利润将为600+1000=1600元。

对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款对消费者是承诺,对竞争者是警告,无疑是企业之间竞争的一种手段。

保证最低价格条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的。这一承诺隐含着企业A向企业B发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。

3.限制进入定价策略

限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入,潜在进入者看到这一低价后,推测出进入后价格也会那么低甚至更低,因而进入该市场终将无利可图而放弃进入。

4.掠夺性定价策略

掠夺性定价是指将价格设定为低于成本来达到驱逐其他企业的目的,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权力时可能得到补偿,即在驱逐其他企业后,再制定垄断高价以弥补前期的损失。这也是一种价格报复策略。掠夺性定价与限制定价之间的差异在于限制定价是针对那些尚未进入市场的企业,是想较长一段时间内维持低价来限制新企业的进入,而掠夺性定价则将矛头指向已经进入的企业或即将来临之际。如你产能过剩,在新企业进入时可以进行产能扩张,将商品大幅降价防堵其进入。

5.广告战博弈

有些商品只有在使用后才知道其质量真正如何,我们把这种商品称为经验品。只有生产那些高质量经验品的企业才会选择做巨额广告,而低质量的企业将不会做广告。原因是高质量经验品会有大量的回头客,而低质量经验品则鲜有人再次光顾。

另外现有厂商之间产量、价格竞争的博弈,尚有古诺模型、伯川德模型可以描述。博弈理论在宏微观层面对企业参与竞争、制定竞争策略均有指导意义。著名营销专家希顿曾说,企业家的艺术就是对企业的策略性经营和管理,博弈作为策略,企业在当今激烈的市场竞争中需要博弈!

[编辑]案例三:博弈论在企业管理中的应用[3]

一、博弈论在企业决策中的应用

1.博弈论成果与经营决策

博弈论的研究成果可直接运用于现代企业的经营决策之中。在市场经济条件下,企业之间的竞争日益加剧,行业内的竞争逐渐表现为几个大型集团之间的直接对抗。从博弈定义来看,这类问题都可归结为博弈问题。因此企业运用博弈论中的决策模型进行决策,将使决策过程更加合理化。当今社会,各个方面的竞争性和对抗性日益加剧,人们对自身行为、理性决策和对效率的追求日益增高,现代企业管理充满了博弈的思想。

2.博弈论与企业最优决策

在社会经济生活中,企业或个人为了自身利益的最大化,面对市场会做出自己的最优决策,不同的市场情形会影响经济主体人的决策行为。在完全竞争市场条件下,企业会根据给定商品的市场价格计算出生产和供应到市场上的商品的数量,以实现最大的利润。而寡头市场的情形要比完全竞争市场复杂得多。企业大量面对的是信息不完全的市场,企业不知道面对强大的竞争对手该如何做出抉择,市场的时效性要求企业必须在信息不完全的情况下做出决策。在这样的决策中存在着三个合理的假设。

第一,理性的“经济人”。每一个行为主体都依据自身利益的最大化作为行动的出发点。

第二,每一个行为主体做出的决策都不是在真空的世界中。现实的世界使得一个人的生存必须以他人的生存为前提。这种相互依赖的关系使得一个行为主体的决策会对其他行为主体产生重要的影响,其他行为主体的决策也会直接影响着这个行为主体的决策结果。

第三,寡头市场的情形。也即一个行业里面只有少数几家企业,甚至只有两三家企业,每一方的市场份额都很大。由于竞争对手很少,每一个主体的行为产生的后果受对手行为的影响都很大。那么这样的决策就带有了博弈的色彩。

3.博弈均衡理论与企业决策

企业决策要充分考虑均衡,博弈论的精髓在于其中的任何一个理性决策者,必须考虑在其他局中人反应的基础上来选择自己最理想的行动方案。所谓均衡,即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结局,它可能不是局中各方及整体的利益最大化,但它是在已给定信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。近来,人们越来越重视博弈论在市场竞争过程中的作用,人们正在通过调整决策,避免冲突以寻求合作,实现共赢,规避双输。

二、博弈论在构建和谐企业中的应用

博弈论的研究成果,提高了人们对竞争和冲突这一社会现象的认识,对于我们在现实生活中如何运用合作的理念,创建和谐企业具有重要的启示和作用。企业作为社会的组成单元,在构建社会主义和谐社会中承担着义不容辞的责任。对企业来说,“和谐”的基本特征应当表现为依法治企、科学发展、协调有序、安

全环保、公平诚信、服务社会,并建立一个长效的协调机制,其核心在于通过促进企业内外环境的“和谐”,达到企业的经济效益与社会效益相统一,最终实现企业健康、协调、可持续发展。

1.处理好个人、集体和国家的利益关系

在市场经济中,个人、企业和政府都会追求自己的利益,在各自的运转环境中,实际上都处于博弈状态,各自都是在现实生活环境中的博弈一方,冲突和矛盾是难免的。随着国有企业改革的不断深化,在股份制改造和现代化企业制度建设过程中,轮岗、下岗、合并、重组等问题所引发的分工、收入、保障的差距越来越成为矛盾的焦点。掩盖这种利益的差别,否认博弈的现实并不能解决问题。所以,需要客观地看待这些差别。

2.处理好博弈与规则透明、诚实守信的关系

规则透明和诚实守信是博弈各方达成协议的基础,规则透明是互信的条件。管理者要想取得人们的信任,政策必须公开、公正。对于企业,企业管理者要取得职工的信任和拥护,企业要在市场上立得住、站得稳,必须讲诚信、讲公平、讲公正。如果所要的结果不是通过透明、可信的规则取得的,必然不会与职工群众达成共识,企业氛围也不会是和谐的、稳定的。

3.处理好博弈过程中利益各方的关系

和谐企业建立的基础是企业各方面的共赢,博弈各方达成的协议虽然未必是利益均等,但应该是各方面都能接受的。建立和谐企业,需要从根本上、制度上解决问题,而制度的建立、措施的完善应建立在科学的基础上,建立在各方都能接受的共赢的基础上,而不是企业方想怎样做就怎样做。如果不能保证各方共赢,必然得不到其他方面的支持,那它必然是不稳定的、不和谐的,甚至会导致更多、更严重的问题。

4.处理好经济利益之外的博弈关系

和谐不完全建立在经济利益上,除此之外仍然有很多人文因素影响着社会的和谐。因此,企业管理者的充分沟通、理解职工的非经济期望和需求,给予人文关怀,对于促进和谐社会的形成有着不可忽视的作用。

三、博弈论在企业价格战中的应用

在现实生活中,我们经常会遇到各种各样的价格大战,如彩电大战、冰箱大战、空调大战等,这些大战的受益者首先是消费者。在这里,厂家价格大战的结局是一个“纳什均衡”,而且价格战的结果是谁都没赚到钱,因为博弈双方的利润正好是零。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对于厂商而言意味着自杀。从中我们可以引申出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个零利润结局;二是如果不采取价格战,作为一种敌对博弈论其结果有两种,一种是企业采取正常价格策略,另一种是采取高

价格策略形成垄断价格。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,没一个厂商或者消费者是按照别人已定的价格来进行决策。在这种均衡中,企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

生活中的博弈论论文

生活中的博弈论论文 摘要: 生活、博弈、无处不在、利益、老鹰、报价价位、得与失 正文: 博弈无时不在,无处不在,日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可能读者会认为,贸易争端用博弈论来分析是可以的,但对自己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏? 实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝,上帝现在有两种策略,让人生病或不生病。人一旦生病,就不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略来对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。 “自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。 生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴;你不送花,太太会埋怨你忘了她的生日;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜;你不送花,结果生活同往常一样。 在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。 夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。 根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。 夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里号啕大哭。 在竞争激烈的商业界,博弈更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。 事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。 如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具是

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论小论文

经济学中的“智猪博弈”(Pigs’payoffs) ———“智猪博弈”模型构建造 关键词: 最佳策略指标改变打破智猪博弈困境搭便车协调博弈企业 战略资源配置 古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 现在以经济学中的一个有趣的例子展开本篇论文. 智猪博弈.它是双方实力不相等情况下的博弈,通过分析可以得出结论,是实力强的一方采取主动策略,实力弱的一方要采取等待的策略. 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹.那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

博弈论论文-共谋与防共谋案例

农村土地流转市场中三大主体博弈关系分析 摘要:以农村土地流转市场中相关利主体之间的博弈关系, 构建两人或多人博弈模型,基于博弈关系进行理论分析,分析农村土地流转市场中的社会行为,为改进农村土地流转提出对应的建议,完善农村土地流转市场。 关键词:农村土地流转、博弈、共谋与防共谋 一、农村土地流转 伴随我国工业化、信息化、城镇化和农业现代化进程,农村劳动力大量转移,农业物质技术装备水平不断提高,农户承包土地的经营权流转明显加快,发展适度规模经营已成为必然趋势。中共中央办公厅、国务院办公厅2014年11月印发《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》,《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》。 实践证明,土地流转和适度规模经营是发展现代农业的必由之路,有利于优化土地资源配置和提高劳动生产率,有利于保障粮食安全和主要农产品供给,有利于促进农业技术推广应用和农业增效、农民增收,应从我国人多地少、农村情况千差万别的实际出发,积极稳妥地推进。为引导农村土地(指承包耕地)经营权有序流转、发展农业适度规模经营,现提出如下意见。当前农村土地流转的主要类型为土地互换、出租、入股、合作等方式。流转土地要坚持农户自愿的原则,并经过乡级土地管理部门备案,签订流转合同。 二、集体土地流转市场中的利益主体 城乡统筹一体化进程中,在集体土地流转市场制度创新的完整过程中起着重要作用的利益主体有:乡镇政府、农村集体经济组织、农地转出方和农地转人方。 集体土地流转市场能否顺利进行是由国家(乡镇政府作为国家的代理人)、集体经济组织(包括村、组)、农地转出方与农地转入方四方相关利益主体进行博弈的结果,博弈过程是主观意愿根据其了解的情况逐步认识,最终做出结果作为理性的“经济人”,他们根据各自的利益目标,会作出不同的判断和选择,相应的得到各自的报酬。当某一方做出某项决策时,事先会受到他人决策的影响,同时反过来也会影响其他几方的行为。集体土地流转市场制度变迁在很大程度上是相关利益主体共同博弈的结果,利益主体之间的博弈结果,提出了对制度变迁的需求,需求导致了新制度的产生。根据集体土地流转市场相关利益主体之间表现出的博弈关系,进行博弈分析,有助于全面了解利益主体的策略选择,解释现行集体土地流转市场制度存在的不足,为相关管理部门和利益主体进行制度创新供决策参考。

博弈论论文

博弈论课程论文生活中的博弈论 学院: 姓名: 学号:

生活中的博弈论 摘要:本文从实际生活入手,主要是把生活中所会出现的一些问题、一些选择用博弈论的思想进行分析。有时候看起来很简单的问题,其实深究起来并不是那么简单,不能只看表面,要仔细分析每一个问题参与者的心理,做出多种情况的假设,才能做出最有利的选择。 关键词:博弈,心理,生活,假设 一、博弈论简介 博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。 基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 类型: (1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题[1]。 (3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。 动态博弈:指双方的行动有先后顺序并且后行动者可以知道先行动者的策略。 二、博弈例证

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考 二、囚徒困境的解释 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。 实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明

三、经济学例子:关税战 两个国家,在关税上可以有以两个选择: 提高关税,以保护自己的商品。(背叛) 与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。) 四、商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。 两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。 此二公司可以有二选择: 互相达成协议,减少广告的开支。(合作) 增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 除了这些还有的很多类似的例子,比如说公共产品的提供,商家的价格战等等,在这里就不多赘述了。 五、“囚徒困境”现象的意义和启示 通过以上几个关于囚徒困境的例子,特别是作为经济管理学院的学生,我们可以将博弈论的一些知识运用好,更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中,我们应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战略眼观,特别是在做出对企业乃至行业今后发展的竞争策略时,从长远出发,做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企业家该做的第一个选择。 2杜兰:走出“囚徒困境”《通信企业管理》[J] 2003年第4期,第31页

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论论文

博弈论论文 Prepared on 22 November 2020

博 弈 论 姓名:XXX 学号:XXXXXXXXXXX 专业班级:XXXXXXXXXXXXX 博弈论课堂回顾与总结 还记得当时在纠结抢什么选修的时候,朋友说博弈论好呀!老师经常让我们玩游戏,而且可以学到很多东西。于是乎我就在朋友的强力推荐下抢到了大学的最后一门选修课——博弈论。时光匆匆,转眼12周过去,博弈论课程也接近尾声,在这我以这篇文章回顾总结一下这十三周的课堂与收获。 课堂总结: 博弈论的第一课老师给我们讲了博弈论的定义,让我们首次认识和了解博弈论: 1、博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。 2、博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们

的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。3、博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。4、基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 在随后的课堂里,老师分别给我们讲了:纳什均衡、囚徒困境、重复博弈、一次博弈、一报还一报(以牙还牙、以眼还眼、悔过的一报还一报、以怨抱怨、以德报怨、以直报怨)、人质困境(多个人的囚徒困境)、酒吧博弈(非线性预测)、枪手博弈(先发优势与后发制人)、智猪博弈、斗鸡博弈、协和谬误等。老师详细讲解了它们的定义、条件、破解、策略以及运用。 例如: 一.酒吧博弈(非线性预测) 前提条件限制:要做出正确的预测必须知道他人的抉择,过去的历史是“任意 的”,未来就不可能得到一个确定的值。 现实启示:1.从一非线性系统整体来说,其变化经济不可预测 2.对于一个混沌系统中个体来说,在无法预测过程中也可采取恰当策 略,并可趋吉避凶,即少数者策略 二. 囚徒困境: 基本精神是背叛,处于囚徒困境时,没有什么十全十美的办法能让自己在困境 中逃脱,只能尽量做到自己不受侵害,两利相对取其重,两害相对取其轻 如何设计:1.博弈双方信息沟通流畅 2.博弈双方互不信任

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

价格战中博弈论的浅析

价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流管理(采购与供应链1班) 学号:1040407122 姓名:曾维乐 二〇一一年十二月十八日

价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。 关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

生活中的博弈论论文

生活中的博弈论 这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣的。其中含有很浓的智慧气息,趣味横生。下面就是我关于这门课的小论文。 我们首先就会问,什么是博弈论?其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。生活中每个人,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,博弈论经过了这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其对于理性人来说懂得如何博弈就显得越发重要。 下面我说一下我个人的想法。博弈其实就是一种游戏,是如何做出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通的游戏是一样的,其实这并不奇怪,其实博弈本身的含义就是博弈参与者在一定的规则条件下选择相应的策略以期获得足够的利益的过程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个三方博弈的过程。 为了能够了解博弈的含义,那么下面我们来看一下经典的博弈模型。 需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困境”。

生活中的博弈论例子

生活中的博弈论有那些例子 那讲工作上的事假如你做的策划被上司偷了那你是要向更高级的领导告状还是忍受这也算一个博弈论问题你要是告状,也许能够伸冤,但也会若到上司他可能会给你下绊子但不上诉他也许会再偷,你的工作就白废了 还有物价方面假如几个店铺联合起来自然能够把东西卖的比较贵但只要其中一个降价其他店的客人就会全跑到那家去那另外几家也会被迫降价店铺联合本来是最好的赚钱方法但店铺间一般是敌对关系为防备有人订低价,引走客人所有的店铺都会尽可能低价其实我们学校门口的网吧刚上演了一出这个好戏真是有感触啊!!!!! 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 1.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略怎样才是“合理” 应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运

博弈论经典案例《智猪博弈》

在经济学中,在经济学中,智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭 便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之 间的距离。 如果改变一下核心指标,猪圈里还会出现同样的小猪躺着 大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小 猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡

献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然 是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小 猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效 果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费 宀 完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最 大。 原版的智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规 则的设计者是不愿看见有人搭便车的,政府如此,公 司的老板也是如此。而能否完全杜绝搭便车”现象,就要看游戏 规则的核心指标设置是否合适了。

相关文档