文档库 最新最全的文档下载
当前位置:文档库 › 有趣的博弈论

有趣的博弈论

有趣的博弈论
有趣的博弈论

最近有看经济学方面的一些书,发现里面有很多有趣的东西,其中一个最大的发现就是博弈论。其实在平时生活中我们何曾没有使用过其中的理论,只是我们没有意识到而已。以前看《美丽心灵》时并没有好好地去研究一下纳什的背景,所以里面的情节都记得不是很清楚了。不过里面的演讲台词对我来说是这部电影里唯一的亮点。纳什是一位数学家,可是他却获得诺贝尔经济学奖。虽然纳什本人处于梦境一般的精神状态,但这并没有阻止他成为当代最优秀的数学家。或许只是因为天才总是不如寻常的吧,正如有人说过的“或许在平常人眼中的疯狂,于天才看来却是正常的行为,也是生命中博弈的一种方式。而平常人的正常,倒有可能被天才认为是疯狂之举。”他在得奖发言中如下“Thank you. I've always believed in numbers and the equations and logics that lead to reason. But after a lifetime of such pursuits,I ask, "What truly is

logic?Who decides reason?"My quest has taken me through the physical, the metaphysical, the delusional--and back.And I have made the mostimportant discovery of my career, the most important discovery of my life:It is only in the mysterious equations of love that any logic or reasons can be found. I'm only here tonight because of you [his wife, Alicia]. You are the reason I am. You are all my reasons. Thank you.

下面是叶德磊教授在华东师范大学做的关于博弈论的讲演

从日常生活看“博弈论”

“博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域。可以说,“博弈论”已经改变了经济学的传统轮廓线。从对“博弈论”简要、通俗的介绍中可以发现,我们身边充满了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学,也理应属于社会学、政治学、心理学、历史学等,这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。

一、博弈及其分类

“博弈论”就是分析博弈行为和博弈决策的一门科学。

今年的诺贝尔经济学奖,已于前不久为“博弈论”研究专家罗伯特·奥曼和托马斯·谢林所获得,1994年度和1996年度的诺贝尔经济学奖,也分别由纳什、泽尔滕、海萨尼、莫里斯和维克瑞等“博弈论”专家分享。如此众多的“博弈论”研究专家的频频获奖,凸现了“博弈论”在主流经济学中日益重要的地位。

“博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域。可以说,“博弈论”已经改变了经济学的传统轮廓线。

“博弈论”的英语原文是Game Theory,直译过来就是游戏论、运动论或竞赛论。譬如在足球比赛中,双方都想在努力巩固防守的同时,积极进攻以置对方于“死地”。这种行为就是一种博弈。“弈”在汉语中是下棋的意思,下棋中的双方行为特征也如同足球比赛中双方的行为。当然,扩展开来讲,企业之间的竞争、国家之间的角力等等,都是“游戏”,只是游戏的内容不同而已。

我国古代有个“田忌赛马”的故事,说的是齐威王与大将田忌各出三匹马,一对一比赛三场,由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0:3告负。后来田忌的谋士孙膑给田忌出主意,让最差的马去与齐威王最快的马比,而让最优的马去赢齐威王次优的马,让次优的马去赢齐威王最差的马,这样便以2:1取胜。但我们还可进一步设想,如果齐威王知道了田忌的花招后,便会在以后的比赛中也更改出马的次序,当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢?这便是“博弈论”更深一层次研究的问题了。

2002年度获奥斯卡大奖的影片《美丽心灵》中主角的原型,便是“博弈论”中纳什均衡的创立者——约翰·纳什。影片中有这样一个情节:在美国普林斯顿大学的酒吧里,4个男生正商量着如何去追求一位漂亮女生,当时还正在大学读书的纳什却在朦胧的“博弈论”思维逻辑引导下喃喃自语:“如果他们4个人全部去追求那漂亮女生,那她一定会摆足架子,谁也不睬。然后再去追其他女孩子,别人也不会接受,因为没人愿意当…次品?。但如果他们先追其他女生,那么漂亮女生就会感到被孤立,这时再追她就会容易得多。”在纳什眼里,追求女生就是一场“博弈”,而“博弈”是要遵循一定规则的,是需要“博弈”策略的。

我们再从经济决策上来看“博弈论”。假如你是一个公司的老总,你在决定是否将自己的产品降价以及降价多少时,必须首先要考虑至少以下几个方面的问题:消费者将会增加购买吗?大概会增加多少购买量呢?其他同种产品的厂家也会降价吗?等等。你只要是理性的话,一定会在对这些问题考虑的基础上来作出你的决策。所以说,“博弈论”主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,理性的行为主体如何决策、以及这种决策的均衡等问题的。在这里,决策均衡是一个经济学概念,意味着最佳决策或最佳决策的组合。因为只要决策是最佳的,相关的行为主体就不会去改变它,从而它处于稳定、均衡的状态。再简而言之,“博弈论”就是分析博弈行为和博弈决策的一门科学。

我们可以从不同角度对博弈进行分类:

一是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。企业之间的联合定价就属于合作博弈,而经常挑起价格战的企业采用的便主要是非合作博弈。在合作博弈中往往包含着非合作博弈,如石油输出国组织是合作博弈的产物,但其中为了各自利益的超产和争吵又属于非合作博弈。

二是分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零,各种赌博就属于零和博弈。例如4个人参与一场赌博,其中3个人输了总共1000元,那么另外一个人必然赢了1000元。期货交易市场的参与者之间的关系也属于零和博弈。人们平常所说的“损人利己”实际上也包含有零和博弈的意思。常和博弈则是指所有博弈方的得益总和等于非零的常数。例如若干人分配一份总额既定的财产乃典型的常和博弈。变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。如在同

一个股票市场,面对同样的大盘走势,伴随着投资者的投资策略不同,有可能大部分人赚钱而小部分人亏钱,也有可能小部分人赚而大部分人亏,甚至还有可能所有人都赚或都亏。

三是分为静态博弈与动态博弈。所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。譬如,在投标活动中,投标人投出标书一般虽有先后,但因为所有投标人在开标前都不知道其他投标人的标价,因此可看作同时选择策略,采取行动。体育竞赛中,双方出场阵容的选择也属于静态博弈。动态博弈则是指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。如A企业降价后,B企业也跟着降价;足球比赛中,一方换上一名攻击性前卫后,另一方针对性地换上一名后卫;如此等等。

四是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。

二、“博弈论”中的经典案例

“博弈论”中一些经典案例,不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然。

“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。

1、囚徒困境

假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。

对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。

囚徒困境现象在现实生活中比比皆是。记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。但你如果不占用公共楼道,别人也会占用。每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。但占用的结果却最终损害了大家的利益。

前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。

2、智猪博弈

假设猪圈里有一大一小两只猪,猪圈的一头有一个猪食槽,另一头有一个控制猪食供应的按钮,揿一下按钮会有10个单位的猪食进槽。若小猪去揿,大猪先吃,大猪可吃到9个单位,小猪揿好后奔过来,则只能吃到1个单位;若大猪去揿,小猪先吃,小猪可吃到6个单位,大猪吃到4个单位;若同时去揿,奔过来再同时吃,大猪可吃到7个单位,小猪吃到3个单位。在这种情况下,不论大猪采取何种策略,小猪的最佳策略是等待,即在食槽边等待大猪去揿按钮,然后坐享其成。而由于小猪总是会选择等待,大猪无奈之下只好去揿按钮。这种策略组合就是名闻遐迩的“纳什均衡”。它指的是,在给定一方采取某种策略的条件下,另一方所采取的最佳策略(此处为大猪揿按钮)。

智猪博弈现象在日常生活中也是司空见惯的。如大股东行使监督上市公司的职责,而小股东则坐享这种监督带来的利益,即所谓“搭便车”;爱清洁的人经常打扫公共楼道,其他人搭便车;山村中出外跑运输、做生意的人掏钱修路,其他村民走修好的路;等等。

3、斗鸡博弈

两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。

这类博弈也不胜枚举。如两人反向过同一独木桥,一般来说,必有一人选择后退。在该种博弈中,非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人,或者看上去有点醉醺醺、傻乎乎的人,往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个“斗鸡博弈”,吵到最后,一般地,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火。冷战期间,美苏两大军事集团的争斗也是一种“斗鸡博弈”。在企业经营方面,在市场容量有限的条件下,一家企业投资了某一项目,另一家企业便会放弃对该项目的觊觎。

当然,“博弈论”中还有其他一些著名案例,这里无法一一加以剖析。上述的三大案例、尤其是前两大案例,已经成为经济学中的专用名词,成为经济学中对许多问题进行分析的分析支架。

三、博弈策略

博弈策略的成功运用须依赖一定的环境、条件,在一定的博弈框架中进行。

谈到博弈策略问题,可以说在我国传统文化中,包含有许多精妙的博弈策略。许多成语及成语典故,就是对博弈策略的令人叫绝的运用和归纳。如围魏救赵、背水一战、暗渡陈仓、釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等等。当然,博弈策略的成功运用须依赖一定的环境、条件,在一定的博弈框架中进行。

在博弈中,人们经常采用威胁策略,但其他博弈方也会采取对威胁的辨别和反威胁策略。经济学家泽尔腾就将不可置信的威胁剔除出去,解决了一个博弈中可能存在多个“纳什均衡”的问题,从而使人们能方便地预测博弈的结果。举一个通俗的例子来说,父母不同意女儿所交的男友,威胁女儿说:“如果你再同他交往,我们就与你断绝关系。”但这样的威胁往往是不可信的。对爱情执着的聪明女儿会置父母的不可置信的威胁于不顾,继续与男友交往甚至最终与之结婚,父母最后也会承认那个当初他们并不喜欢的女婿。这个结果便是剔除了不可置信的威胁后的“纳什均衡”,“博弈论”中称其为“子博弈精炼纳什均衡”。

“博弈论”研究还发现,在重复博弈中,如果博弈的次数是无限的,博弈方会选择相互合作的策略。因为如果一家企业采取不合作的低价倾销策略,其他企业也会采取相同的策略进行报复性竞争,长期下去,这些企业都将完蛋。企业深谙此理后,便会在相互默契中将价格维持在一个合适水平,尽量避免长期性、大规模的低价杀伤战。美国水表生产的四大巨头企业(班琪表业等)在长达几十年的时期内都维持了这种定价方面的良好合作关系,成为“博弈论”中经常被提及的案例。

但如果重复博弈的次数较少,则合作就不可能实现。如生产彩电的某企业已决定转产而不再生产彩电,它就不会与其他彩电企业继续价格方面的合作,而可能对库存品低价甩卖,因为别的彩电企业对它没有报复的机会了。一些人在快调离原单位或快退休时的拙劣表现,也属此列(包括所谓的“59岁现象”)。

再举一个生活中的例子:如果你去菜场买菜,当你对某种菜的质量、口味等有疑虑时,卖菜的阿姨常会讲:“你放心,我一直在这儿卖呢!”这句朴实的话中其实包含了华丽的“博弈论”思想:我卖与你们买是一个次数无限的重复博弈,我今天骗了你,你们今后就不会再来我这儿买了,所以我不会骗你的,菜的质量、口味肯定没问题。而你在听了阿姨的上述一句话后,常常也会打消疑虑,买菜回家。

在博弈中,人们掌握的信息经常是不完全的,这就需要在博弈进行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时,老虎摸不准这个大动物究竟有多大本领,因而躲在树林里偷偷观察,这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子,老虎走出树林,逐渐接近毛驴,就是想获得有关毛驴的进一步信息。一天,毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是最优策略选择。又过了一些天,老虎又来观察,并对毛驴挨得很近,往毛驴身上挤碰,故意挑衅它。毛驴在忍无可忍的情况下,就用蹄子踢老虎,除此之外,别无它法。老虎最终了解到毛驴的真实本领后,就扑过去将它吃了。在这个故事里,老虎通过观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目。事实上,毛驴的策略也是正确的,它知道自己的技能有限,总想掩藏自己的真实技能。老虎吃掉毛驴的策略,在“博弈论”中就是所谓的“精炼贝叶斯均衡”。

人们常提到的“上有政策、下有对策”,其实是对管理者与被管理者之间的动态博弈的一种描述,面对上边的政策,下边寻求对策是正常的、必然的。从“博弈论”的角度讲,上边的政策制定必须在考虑到下边可能会有的对策的基础上进行,否则,政策就不会是科学、合理的。

从以上对“博弈论”简要、通俗的介绍中可以发现,我们身边充满了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学,也理应属于社会学、政治学、心理学、历史学等,这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。

《博弈与社会》读后感

《博弈与社会》读后感 各位读友大家好,此文档由网络收集而来,欢迎您下载,谢谢 《博弈与社会》读后感 原创:何徐任 《博弈与社会》这本书是大二时教授《经济学原理》的老师推荐的,老师曾无数次在课堂上提起过“博弈论”这个概念,对于这个概念我的初步认识是:博弈论的全称是“非合作博弈理论”——这是我从百度百科中得到的。“非合作博弈理论”?!在我第一次接触到这个概念时,不自觉的在心里默念了好多遍,说实话,心里充满了不解——难道博弈论是在讨论如何不合作吗?带着这个疑惑,我开始看起了《博弈与社会》这本书,从书中寻求解释。 该书开篇便向我们抛出了两个问题——协调问题与合作问题。 张维迎说:“人是群居动物,群体人

具有社会属性”。这个不难理解,毕竟人类在历史长河中从来都不是具有“个体优势”的生物,为了生存我们不得不选择聚集在一起——生活在“社会”中而不是“孤岛”里,这也让生活在其中的我们无法“独善其身”。简单地说,即你的“所思所想”不仅仅取决于自己还会受到群体的影响;你的“所作所为”不仅影响自己还有他人——这就是我们的“社会属性”。 人的社会属性意味着生活在群体中的个体将不得不与其他人频繁打交道,这个过程必然涉及彼此之间的合作与协调,而如何解决合作与协调问题,是这个社会运行的基础——决定了这个社会能否顺畅的运行。 该书在开始探讨博弈论前向我们抛出这两个问题,用意十分明显——能否深刻的认识协调与合作问题,是我们掌握后续博弈论知识的前提和基础。为什么这样说呢?因为特定的博弈论是以特定的社会作为载体的——也就是说关于

博弈论的一切讨论都是以一个特定的社会为背景展开的。因此,在揭开博弈论的神秘面纱前,搞懂这个特定的社会是如何运行的将是必要的,这让我们能够更好的去理解和接受后续的博弈理论。可以说,这本书的结构安排对一个博弈论领域的小白是十分友好的,很适合初学者阅读。 当然仅仅讨论载体是远远不够。载体——特定的社会、主体——博弈的双方、以及两者之间的交互关系——博弈知识,这是博弈论的三大构成部分,它们一起组成一套完整的知识理论体系。 书中把博弈论主体定义为:理性人——有限理性的人。 所谓理性人,就是在给定的条件下,总是追求自身利益的最大化。用张维迎的话说,便是“可以为了追求自己的利益做出最好的选择”。虽然在现实世界中不可能存在完全理性的人——理性人是不现实的。然而理性人假设的存在却是有一定道理的:张维迎的解释是“人都是趋

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例一一“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢 “挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方 案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就_ 大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5 号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何? 通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡 在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。 从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。 诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。 1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。 纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。 那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。 纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。 纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,

从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。 纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。 有些博弈的纳什均衡点不止一个,如下述夫妻博弈中有两个纳什均衡点。 丈夫和妻子商量晚上的活动,丈夫喜欢看拳击,而妻子喜欢欣赏歌剧,但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点:要么一同去看歌剧,要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中,其最后的结果难以预测。在夫妻博弈中,我们无法知道,最后结果是一同欣赏歌剧还是一同看拳击。 是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点,但至少存在一个混合策略均衡点。 这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。 我们下面将在警察与小偷的博弈中给出混合策略的说明。 在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的治安,现在我们假定,小镇的一头有一家酒馆,另一头有一家银行,再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方

进化博弈论读书心得

进化博弈论读书报告 汪波 1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS ),随着1978年, Taylor 和Jonker 发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull 著作了《Evolutionary Game Theory 》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics 》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。 一、进化稳定策略最初的模型 进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。 最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略I 、J ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为0w ,再假设整个群体中选择I 的概率为p ,()w I 、()w J 分别表示选择相应策略带来的适应度,而(,)E I J 表示个体选择策略I 而对手选择J 时的收益,其他(,)E I I 等表示类同的意义。 若每一个个体都参与到竞争当中,则有 0()=+(1-p )(,)(,)w I w E I I p E I J + (1-1) 0 ()=+(1-p )(,)(,)w J w E J I p E J J + (1-2) 稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的 适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变 异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。若 I 是进化稳定策略,则()()w I w J >,且1p ,所以当I J ≠,有 (,)(,)E I I E J I > (1-3) 当(,)(,)E I I E J I =时有 (,)(,)E I J E J J > (1-4) 满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别E SS 的标准条件。 上述的策略是在纯策略情形下考虑的,当策略I 是从一个可能策略集合中随机的选择而

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

对博弈论的一点认识——学习《经济博弈论》有感

2010年第9卷第9期 产业与科技论坛2010.(9).9 Industrial &Science Tribune 对博弈论的一点认识 ———学习《经济博弈论》有感 □孙 鑫 【摘要】本文通过对《经济博弈论》一书的学习,探讨了博弈论在日常生活中的广泛应用和实用性,并通过房价博弈的举例, 说明了博弈论的基本思想可以帮助我们用全新的视角解决实际问题。 【关键词】博弈论;博弈;读书报告 【作者简介】孙鑫(1978 ),女,上海社会科学院信息研究所助理研究员 对《经济博弈论》一书的学习,激发了笔者对博弈论领域的浓厚兴趣, 通过对相关文献和书籍的阅读,对这一领域有了一些粗浅的认识,我们身边充满 了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。博弈论并非高深知识,它与我们的生活息息相关。 一、博弈论的广泛应用和实用性“博弈即一些个人、对组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。”博弈由英文“game ”翻译过来,过去每每听到博弈一词,都觉得这是一个高深莫测、充满神秘色彩的领域,如今通过了系统的学习, 才终于可以对“博弈”有一些粗浅的理解。 博弈论的英文名称为Game Theory ,也翻译为对策论、游戏论。作为一门现代学科体系,博弈论早在 半个世纪以前就已经出现, 但长期以来并没有受到足够重视,除了少数博弈论专家以外,很少有人知道 它。可是, 近年来却受到高度的重视和青睐。1994年三位致力于博弈论基础理论研究的经济学家共同 获得了诺贝尔经济学奖, 使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定。此后1996年,诺贝尔经济学奖又由博弈论和信 息经济学家莫里斯和维克瑞获得,这进一步肯定了博弈论在经济学中的重要地位,同时也从一个侧面体现出博弈理论已经渡过了成长期,步入了成熟期。为什么目前博弈论在经济学中的地位上升得这么 快,博弈论在经济学中的应用,和经济学的结合的程度会发展得这么快呢? 首先,现代经济活动的规模越来越大,对抗性、 竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济 决策的“博弈性”越来越强。在这种情况下,以给定环境条件下的个体理性行为分析为基础的局部均衡理论或一般均衡理论,比较静态分析,以及以它们为基础的经济理论,在解释现实经济问题时必然越来越力不从心。而将研究投注于传统经济学研究中忽略掉的,或为了简化讨论避而不谈的,经济活动中各个方面行为或决策时相互之间的反应或反作用,也就是策略和利益的互动性和互相依赖关系的博弈论,却不存在传统经济学理论中由于上述忽略和回避造成的经济模型脱离实际的缺陷,因此在许多情况下它所得出的结论更加符合经济现实和更加具有应用性,对参加经济互动的各方或国家政府的决策互动有更强的指导作用。这正是为什么当忽略经济活动中普遍存在的相互依存和相互作用的传统西方经济学在理解当今世界各种经济现象、预测经济、制订有效政策方面屡屡失灵之后,博弈论却日益受到重视,能够飞速发展的最根本的原因。 其次,一方面也是由于社会经济活动中竞争不断加剧的原因;另一方面则是信息技术和社会经济信息化的发展,使得人们认识信息的作用和规律的要求不断提高,从而促进了信息经济学的发展要求。 · 131·

博弈论读后感范文

博弈论读后感范文 博弈论读后感篇一: 博弈论的目的是在于巧妙的策略,而不是揭发,我们学习博弈论的目的不是享受博弈论的分析过程,而在于赢得更好的结局。 博弈论读后感篇三: 《博弈论》是我很久之前买的书,翻了一下就丢在一边,最近几天因和同学互相洗刷不赢,我决定认真读一下这本书,一读才知道,生活中充满了博弈,我也渐渐地被它所吸引。书的封面写着:学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。我的目的也是它,让我在生活中获得更好的结局,至少让我有副好口才。 博弈论是研究人们如何进行决策、以及这种决策如何达到均衡的科学。简单来说就是,每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑他的决策行为可能对其他人造成的影响,以及其他人的反应行为可能带来的后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 现实生活中的很多现象都可以从博弈论的角度来理解,比如2006年的超级女生冠军是尚雯婕,有人提出疑问:他没有安又琪出众的外表,没有李宇春倾倒观众的舞台魅力,没有谭维维”无可挑剔“的唱功。那她凭什么夺冠?而这就反

映出疑问者对博弈论的不了解。这个冠军本来就不是尚雯婕一个人得到的,而是主办方湖南电视台、天娱传媒、参赛的女生们、电视观众、媒体、各女生的”fans“等方方面面共同博弈的结果。 有人还认为在整个比赛过程中还出现了非合作博弈与合作博弈的可能:某些得分较低女生的”fans“,联手对付得分较高的女生;得分最高的选手联合肯定无望出线的选手以巩固地位,防止次高选手反超。 然而博弈论也有其局限性,因为它的基本假设就是:人是理性的。而现实生活中人们在决策时往往是有限理性的。尽管如此,人们仍然可以用博弈论和信息经济学的思想方法来分析解决问题。 回到正题,我怎样才能把博弈论运用到实际生活中? 囚徒困境,当我们处在囚徒困境的时候我们的策略处于占优策略,博弈在所有参与者选择占优策略的基础上达到均衡。而对于参与者中的”我“来说,可以利用信息不对称,抛给对方选择,选择分为有益、无益无害、有害,加大选择风险。比如当我们处于劣势时,报复的方式就能起到有效地震慑的作用。而参与者的选择多半是无益无害的,即便有益的部分很吸引人,但人们总是不愿承担风险的,因为有害的伤害是巨大的。

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

关于妙趣横生博弈论的读后感

博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。下面是有妙趣横生博弈论的读后感,欢迎参阅。 博弈小术语:收益矩阵、均衡、纳什均衡、零和 博弈论,也称互动的决策论。它的基本假设之一是人是理性的。但现实并非如此,人不可能具有完备的知识也不可能时时理性。尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。 每一次的人际交往都可以简化成两个基本选择:合作或背叛。比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。当一次性博弈出现时,人们往往会选择背叛。这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。而当博弈的终点不可知时,就又是另一回事了。 在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。 当然,如果在开头就有一些“善意”的人出来表明合作态度对提高合作机会也是有帮助的,不管这些“善意”的人是出于何种目的。一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。至于时间的长短,关键是看博弈的终点是否明确。这在上面也提到了,如果终点明确,人们就会倾向于在最后一次背叛。而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。如此反复推演,合作从一开始就很难形成。注意上面的论述是基于没有惩罚机制的基础。 有一个很有意思的实验,是由爱克斯罗德完成的。这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。结果表明,“前15名中只有第名是非善意的程序,最后15名只有一个善意的,夺魁的是“一报还一报策略”。 这个实力不凡的“一报还一报策略”就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。这种策略体现的是“善良、可激怒、宽容、简单”等好品质。虽然该策略在每次对局中分数都不能超过对手,但它的总分却是最高的。它赖以生存的基础很牢固。而那个非善意程序的成功是建立在别人的失败之上。可以想像,如果赋予这些程序以进化的基因,久而久之,非善意程序的存活率将下降。 近日整理书橱时,我偶然看到了在东北财经大学学习研究生课程时所学的《博弈论》这本书。当时我们很幸运,学院特意选了东北财经大学优秀教师史永东教授来讲授这门课。史教授是当时东北财经大学最年轻的教授(时年 35 岁, 32 岁时就破格晋升为教授),他把一门很深的学问给我们讲得惟妙惟肖,非常生动。直至今日随手翻阅时,仍能清楚地记起他讲课时激情洋溢的风采,但如今重新阅读这本书却有了不同的感受,当时是为了掌握其中的理论,现在则可以比较从容地去体会其中的道理了。

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

《博弈论》读书笔记

博弈论 1、博弈论的四要素: (1)、参与人或局中人 (2)、参与方争夺有利资源和利益 (3)、参与者有自主选择的策略 (4)、参与者拥有一定量的信息 2、懒惰而又聪明的人:适合担当领导职务,因为他的决策力 不会因为琐碎的小事而打扰,不会因为勤奋而导致神经性紧张。 勤奋而又聪明的人:适合担当参谋职务。 懒惰而又愚蠢的人:,不会产生危害,可以委以小任。 勤奋而又愚蠢的人:必须开除,因为这种人会在错误的道路上一路狂奔。 3、正和博弈,负和博弈,零和博弈。 正和博弈:正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。 负和博弈:负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失。 零和博弈:指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。 4、对手和自我同等重要。只有强大的对手才会让你变得更加 优秀。 5、冯诺依曼(用黑板擦证明定理的人):冯·诺依曼(John von Neumann,1903~1957),20世纪最重要的数学家之一,在现代计算机、博弈论和核武器等诸多领域内有杰出建树的最伟大的科学全才之一,被称为“计算机之父”和“博弈论之父”。

6、博弈论的经济价值: (1)、从博弈双方的合作与否分为:合作博弈、非合作 博弈。 (2)、从时间的序列性可分为:有序进行的称动态博弈、同时进行的称静态博弈。 (3)、从信息的暴露程度上分为:完全信息博弈和不完 全信息博弈 7、纳什均衡:Nash equilibrium ,又称为非合作博弈均衡, 是博弈论的一个重要术语,以约翰·纳什命名。 所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略 组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则 该策略组合就是一个纳什均衡。 8、囚徒困境:囚徒困境(prisoner's dilemma ):两个被捕的囚徒之间 的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也 是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个 人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中 的价格竞争、环境保护等方面,也会频繁出现类似情况。 产生原因:囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来 利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼 此出卖虽违反最佳共同利益,反而是自己最大利益所在。 9、如何打破囚徒困境:最优的策略叫做tit for tat,一报还一 报策略。即决策方在第一轮选择合作,其后每轮决策与对手 的上轮决策相同,对手合作,我下轮就合作,对手背叛我下 轮就背叛。这样的报复性决策其实目的是为了警告对手,让 对手趋于多选择合作。 10、人质困境:在一群人面对威胁或损失时,“第一个采取行动”的决定 是很难做出的,因为它意味着将付出惨重代价。这个困境便就叫做人质 困境。 现在用这个困境阐述一个不同的观点,确切地说,就是惩罚经常压倒回报而处于 上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定,不过,这个 做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐吓可能是一种代价 小得多的替代选择。

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论读书笔记

以前没发现,但在学习了博弈论基础的知识后,很容易的发现,博弈如同空气般,围绕在我们身边,无处不在。生活中的大小事怎么个博弈法,通过下面一个例子来说明生活中的博弈。 刚刚过去的双十一光棍节,众多电商电商提前燃起"双十一"网购战火,我们是否跟风疯狂购物还是理性看待促销噱头?买衣服的时候,跟老板砍价,砍多少?你跟你朋友玩剪子——石头——布的时候,出剪子?石头?布?“家家有本难念”,就是司空见惯的夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。用博弈的方式模拟出来,博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。而在竞争激烈的商业界,博弈就更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础;…………这些就是博弈。或许你很难想象,一天24小时,你都在博弈。有人说,听你乱说,睡觉不博弈了吧?不,是的,在你睡觉的时侯,都无法逃避博弈这个问题。因为在一定程度上,你大脑有意识无意识地选择做不做梦,这可能就是一个博弈问题了。 看来,我们的生活真的就是跟博弈问题息息相关。而在这样一个复杂的博弈战场上,我们怎么能使得自己在博弈场上获得最大的利益就是一门很大的学问了。所以,博弈论是一门很有用的学科。通过读书学习让我又懂得了一问学问。

按书中分类,博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。 博弈论原本为游戏理论,这一理论涉及的‘游戏’范围更广:人际关系的互动、球赛或麻将的出招、股市的投资等等,都可以用博弈论巧妙地解释,可以说,红尘人世,莫不博弈。”这就是《每天读点博弈论》中句子,说明了在人的一生中处处存在着博弈,只看你是如何去做罢了。 在整本书中,我感触最深的就是“信息博弈,比的就是信息”。信息在现今的社会中,是非常重要的,每天从睁开眼睛开始,就开始接触信息,小到每天的对话,大到报纸新闻,近到邻里之间,远至古今中外,信息无处不在。那我们在这些信息中如何捕获自己所需的信息?如何使自己获得最大的利益? 俗语说:车到山前必有路,船到桥头自然直。我以前理解成,无论多少难做的事情,到最后总会有办法的,可是却从没想过,为什么最后总会有办法解决呢?这本书中写到:收集信息不仅是解决问题的一个步骤,而且有时起到极为关键的作用。比如,当各种方法都尝试过,当问题成了一团乱麻,一切都僵住了。这时,最好的办法是再问

博弈论经典案例《智猪博弈》

在经济学中,在经济学中,智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭 便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之 间的距离。 如果改变一下核心指标,猪圈里还会出现同样的小猪躺着 大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小 猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡

献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然 是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小 猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效 果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费 宀 完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最 大。 原版的智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规 则的设计者是不愿看见有人搭便车的,政府如此,公 司的老板也是如此。而能否完全杜绝搭便车”现象,就要看游戏 规则的核心指标设置是否合适了。

相关文档