文档库 最新最全的文档下载
当前位置:文档库 › 纳什均衡定义

纳什均衡定义

纳什均衡定义
纳什均衡定义

纳什均衡定义:

假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

囚徒困境(prisoner's dilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。来源囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。主旨囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。“囚徒困境”定义是1950年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢半年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

2)纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。

假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1]),则此策略组合被称为纳什均衡

纳什均衡所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,经济学定义所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

特性:存在性在同时博弈中(纯策略的)纳什均衡可能存在,也可能不存在。

唯一性在纳什均衡存在的条件下,它既可能是唯一的,也可能不唯一。

最优性如果纳什均衡存在,则它既可能是最优的,也可能不是最优的。

经典案例囚徒困境1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

囚徒困境博弈

A╲B坦白抵赖

坦白-8,-80,-10

抵赖-10,0-1,-1

关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。重要影响纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。2.扩展了经济学研究经济问

题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。

青蛙现象:把一只青蛙直接放进热水锅里,由于它对不良环境的反应十分敏感,就会迅速跳出锅外。如果把一个青蛙放进冷水锅里,慢慢地加温,青蛙并不会立即跳出锅外,水温逐渐提高的最终结局是青蛙被煮死了,因为等水温高到青蛙无法忍受时,它已经来不及、或者说是没有能力跳出锅外了。青蛙现象告诉我们,一些突变事件,往往容易引起人们的警觉,而易致人于死地的却是在自我感觉良好的情况下,对实际情况的逐渐恶化,没有清醒的察觉。我们的组织和社会生存的主要威胁,并非来自突如其来的事件,而是由缓慢渐进而无法察觉的过程形成。人们目光短浅,只看到局部,而无法纵观全局,对于突如其来的变化,可以从容面对,对于悄悄发生的大的变化,而无法察觉,最终会带给我们更加严重的危害!

.刺猬法则:两只困倦的刺猬,由于寒冷而拥在一起。可因为各自身上都长着刺,于是它们离开了一段距离,但又冷得受不了,于是凑到一起。几经折腾,两只刺猬终于找到一个合适的距离:既能互相获得对方的温暖而又不至于被扎。刺猬法则主要是指人际交往中的“心理距离效应”。

八.手表定律:手表定律是指一个人有一只表时,可以知道现在是几点钟,而当他同时拥有两只时却无法确定。两只表并不能告诉一个人更准确的时间,反而会使看表的人失去对准确时间的信心。对于一个人不能同时选择两种不同的价值观,否则他的行为将陷于混乱。在人生的每一个十字路口,我们都要面对“鱼与熊掌不能兼得”的苦恼。在面对矛盾选择的时候,我们推荐使用“模糊心理”。所谓“模糊心理”,就是在一个很难决策的情况下,以潜意识的心理为主要基调,做出符合潜意识心理的选择。心理学研究表明,“模糊心理”实际上是人在成长过程中不断积累的一种心理沉积。也许你并不能说出一条明确的原因,但是通过心理的潜意识,一般情况下可以做出最符合个体心理需求的决定。这里说的潜意识,实际上就是我们常说的第一印象。“模糊心理”在矛盾选择面前,能够提供给我们最安全的心理保护,因而是值得提倡的。核心理念:更多选择、更多标准会让人无所适从。应用要诀:明确目标、不受干扰;懂得取舍,该放则放。

纳什均衡

纳什均衡简介 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以 约翰·纳什命名。在一 个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组 合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。 纳什均衡的得来 关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在 普林斯顿大学攻读博士学位时完成 的。实际上,博弈论的研究起始于1944年冯·诺依曼( Von Neumann)和 奥斯卡·摩根斯坦 (Oscar Morgenstern)合著的《博弈论和经济行 为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下, 证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而 对“合作博弈 (Cooperative Game)”和“ 非合作博弈”做了明确 的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 纳什均衡例子 博弈论中一个著名的例子就是囚徒困境。 囚徒困境是一个 非零和博弈,说的是两个嫌疑犯 甲和乙私人民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉 两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。 博弈矩阵囚犯甲 招供不招供 囚犯乙招供判刑五年 甲判刑十年;乙判刑三个月 不招供

浅析囚徒困境与纳什均衡

浅析囚徒困境 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。 但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。 然而如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。比如在楼市的囚徒困境中,政府能适当调控房价,给予购房者房价稳定合理的承诺,那么楼市的囚徒困境是有可能破解的。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出

纳什均衡

1.纳什均衡:给出对方的策略,你所选的是最优的(至少不比其它策略差),如果每个局 中人都是这样,那么所构成的策略组合(对局),就称为纳什均衡。 2.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 3.边际产量:当其他要素不变时,可变要素增加一个单位所带来的总产量的增加量。 4.生产成本:经营一个企业,为达到利润最大化,必须支付一些资金来维持运营,如建造 厂房,采购机器及原料,雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准:如果一种变化可以改善某些人的处境,同时对其他人都没有伤害。则这种 变化是好事,应该给予实行。 6.恩格尔系数:是食品支出总额占个人消费支出总额的比重。一个家庭收入越少,家庭收 入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 8.价格管制:是指政府对新药定价以及上市药品价格上涨实施严格的管制,企业不能自由 定价,而是由政府和制药企业谈判决定新药的价格。 9.软着陆:当一个国家经过强劲的经济增长后,仍维持缓和的增长,并未因此转入衰退, 即使“软着陆”。 10.硬着陆:一个国家的经济在高速增长的同时伴随着高度通货膨胀,使得经济迅速从增高 长直接走入低增长甚至衰退。 11.通货膨胀:平均物价水平持续上扬的状态,通货膨胀率通常是以消费者物价指数(CPI) 的变化率来表示。指数上升→物价上升,货币购买力下降。 12.再贴现率:一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”:通过一定的 方式把发生在未来(或不同时间)的费用和效益转化为现值的方式就叫贴现。 13.机会成本:在资源一定的情况下,多生产一个单位的某种产品,就要以少生产若干单位 的另一种产品为代价。这种放弃若干单位另一种产品生产的代价,就是生产某种成品的机会成本。 14.需求价弹性价格:指在市场需求曲线的任何一点,价格每变动1%所导致的需求量变动 的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数(生产成本):企业在每个时期投入的各种生产要素的数量与获得的产出品的 数量之间的关系。 16.均衡及均衡价格:均衡:供给和需求达到平衡的状态。均衡价格:供需平衡时的价格。 有时被称为市场出清价格。 17.资源的概念及分类:指用于生产能满足人类需要的东西的那些物品或劳务。分类:自由 资源和经济资源 18.恩格尔曲线:某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征:需求的特征:需求的不确定性、需求的最高优先性、需求的不 可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征:高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些: (一)一般经济学因素:1.经济发展水平;2.价格水平(1)是否实施医疗保障制度(2)医疗保障制度下保障的范围(3)医疗保障制度的报销制度和自付比例等(二) 社会人口学因素(三)流行病学因素(四)临床医生和药师因素(五)医药技

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

纳什均衡不动点

纳什均衡的存在性与多重性 对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。所以,倘若某个概念所对应的事物并不存在。那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。 有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。 博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。 纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。 本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

答疑]动态博弈与子博弈精练纳什均衡

我们已经了解了完全信息静态博弈的内容。这时候,参与人同时行动,或者不同时行动,但是后动的人观察不到先动的人的任何有关其行动的信息,这于同时行动等价。这时候,任何一个参与人选择行动的时候,没有任何可以依据的信息。 当博弈成为动态的时候,参与人先后行动,后动者可以观察到先动者的行动,因此,后动者选择他的行动的时候,可以依据观察到的信息作选择。因为先动者可能采取的行动是若干个,所以后动者就有可能观察到同样多的信息。因此,这时后动者选择的已经不简单的行动,而是一套完整的行动计划——这套行动计划指出,在观察到不同的信息时该怎样随机应变选择自己的行动。因此,现在后动者的选择变量就是行动计划,我们就把一套完整的行动计划叫做一个策略。 以下图为例,参与人1先动,之后参与人2行动,参与人2可以观察到参与人1的选择。参与人的选择就是L或者R,这既是他的行动有时他的策略,因为参与人1行动时可能出现的信息只有一种情况——空信息集——因为他先动,这时什么信息也没有。1行动之后,1的行动可以被2观察,因此2可能观察到的信息就有可能是L或者R,因此,2的行动会根据这些信息作出。2的一套完整的行动计划应该告诉他,在观察到L时选择什么,观察到R时选择什么,由此我们也可以看出,如果2把行动的选择委托给另外的人,这个人可以根据2的行动计划处理任何可能发生或者面对的形式。这样,2的行动计划——我们称为策略,就有四种可能: 1,观察到L时,选F,观察到R时,选F。我们用一个有序二维向量(F,F)表示。 2,观察到L时,选F,观察到R时,选C。我们用一个有序二维向量(F,C)表示。 3,观察到L时,选C,观察到R时,选F。我们用一个有序二维向量(C,F)表示。 4,观察到L时,选C,观察到R时,选C。我们用一个有序二维向量(C,C)表示。 总结:参与人1的行动是L或者R,由于是先动,没有信息,所以策略也就是行动。 参与人2的行动是F或者C,由于是后动,有信息,策略是建立在信息上的完整行动——计划,有四个策略:(F,F),(F,C)(C,F)(C,C)。 参与人1 L R 参与人2 参与人2 F C F C 6 4 5 8 6 1 ‐10 ‐3

浅析囚徒困境与纳什均衡

浅析囚徒困境 令狐采学 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的

经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。 但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。 然而如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

团队管理中的纳什均衡

团队管理中的纳什均衡 众所周知,团队就是由每一位个体员工和管理者个体组成的一个共同体,该共同体能够集中每个个体的知识、智慧和技能优势,促进个体之间的高度互补与工作协调,并形成团队优质,解决问题,实现共同目标,而纳什均衡则是指定博弈、对策和游戏中的一种情形,一种给定博弈、对策和游戏对手的最佳选择,自己的最佳选择,即每个人都从利己的角度出发做出最佳选择,选择对自己最有利的策略,而不考虑社会福利或其他对手的利益,这种策略组合由所有局中人的最佳策略组合构成,在缺乏有效外力推动的情况下,没有人会主动改变自己的策略以便获得更大利益。在团队管理中,如果团队成员之间的选择是在非完全信息对称的情况下做出的,则团队建设就很有可能遇到纳什均衡。下面我们试分析之。 企业文化与个人追求 企业文化是作为一个组织的企业内部的全体员工的共同价值观和道德准则,共同的精神追求和行为规范,从人本逻辑上来讲,企业文化则是企业家文化,而企业家文化的形成和确定,则必然打上企业家个人的价值取向烙印,即企业家自己的所谓最有利的选择。而团队成员在某种特定的企业文化氛围里边也有着每个人的追求,即所谓的

他所做的对自己最有利的选择,如果团队成员的选择与企业家的选择是一致的,这构成一种合作均衡,否则,团队成员的选择与企业的选择不同甚至完全相反,这就形成了纳什均衡。如在市场经济条件下,一家企业文化的价值追求体系是效率公平,则每一个团队在这种特定选择中,彼此的最佳选择就是追求效益最大化,更快更好地完成团队目标,其结果是企业目标的顺利实现;相反如果一家企业文化的价值追求体系是伦理公平,讲求平均主义,则每一个团队及其成员则会在这种给定选择中,彼此的最佳选择就是追求不劳而获,减少劳动量,甚至是高效能人才的大量流失和闲置,其结果是企业目标的落空。 团队精神与团队冲突团队 精神要求团队每个成员的行为能够积聚团队的整体优势,形成合力,解决问题,向团队目标迈进,而团队冲突则是由于团队成员在交往中产生意见与分歧,出现分歧,对抗导致彼此间关系紧张的局面,如果团队成员都能把团队精神视作其他成员的行为出发点和落脚点,那么该成员则也会做好他的最佳选择--做团队精神的捍卫者和实践者,从而达成每一个成员的最佳选择;相反如果团队成员认为其他成员完全站在对抗和竞争的立场上与之对话,那么该成员也必然会站在同样的立场上做出选择,其结果导致团队冲突升级,如果在冲突升级过程中没有任何成员做出重新的以团队精神为导向的选择,那么团队精神就会沦为乌有,团队也会走向解体。 职责分工与利益分配 在团队管理中,进行岗位的职责分工并进行相对应的利益分配是

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ① 其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以 如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵

浅析囚徒困境与纳什均衡

浅析囚徒困境 欧阳学文 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,

我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法

纳什均衡的重要影响及其问题局限

研究领域:微观经济学 纳什均衡的重要影响及其问题局限 高红阳 (东北师范大学传媒科学学院,吉林长春 130117;吉林大学管理学院博士生,吉林长春 130022) 摘要:纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,其对经济学以及其他社会科学甚至自然科学产生了重要影响。尽管纳什均衡理论及其应用得到了空前的肯定,但近年来纳什均衡分析却遭到了前所未有的质疑。论文从理性前提、犯错误、多重性、静态分析、动态分析、期望效用等六个角度论述了目前理论所存在的问题局限,而且将学界尝试解决上述问题的有限理性、好像理性、颤抖手均衡、聚焦均衡、风险占优均衡、帕累托最优均衡、防联盟均衡、相关均衡等方法一并加以讨论阐述。 关键词:纳什;纳什均衡;局限 博弈论(game theory)研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,纳什均衡(Nash Equilibrium)是博弈解的一般名称,是当前博弈理论体系的核心概念。从1994年纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)三位博弈论专家获得诺奖,博弈论一直是十余年来学界最活跃的研究领域之一,被经济学、政治学、生物学、军事学等许多学科奉为重要的方法论基础。 1纳什均衡的重要影响 1.1纳什及纳什均衡的得来 纳什1928年生于美国西弗吉尼亚州。关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。图克(Tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 1.2纳什均衡的重要影响 纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面(谢识予,1999): (1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。 (2)扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济

浅谈纳什均衡

浅谈纳什均衡 第一次接触到纳什均衡是在电影《美丽心灵》里边,主人公约翰·纳什经过不断探索和创新提出了他梦想的原创理论——纳什均衡定律。 关于纳什均衡的来源,有一段有趣的小故事。约翰·纳什假设有四男五女,其中有位女士长得非常漂亮以至于所有的男士都去追求这个女士。由于漂亮女士的天生孤傲,她拒绝了所有人的追求。于是这四个男士退而求其次,去追求另外四个女士。而这四个女士都不想作为第二个选择,所以都拒绝了这四个男士,公共利益为零。这时,约翰·纳什就想道:如果这四个男士一开始都不去追求那位漂亮女士而是直接去追求那四个不那么漂亮的女士,那么毫无疑问都会成功,这时公共效益达到最大。不管信还是不信,这个故事便是纳什均衡的最初来源了。 亚当·斯密,现代经济学之父,曾经提出:在竞争中,个人的野心往往会促进公共效益。但是约翰·纳什在普林斯顿大学发表的博士论文彻底推翻了统治了经济学界100多年的亚当·斯密的重要理论。经过一段时间后,纳什的理论像是一个炸弹爆炸在了各相关学界,引起了相当大的轰动。约翰·纳什也由于他的原创理论获得了1994年的诺贝尔经济学奖。 随着时间的推移,纳什的理论逐渐进入到博弈学领域,并且成为博弈学界不可或缺的支撑理论。 纳什均衡的定义:假设有n个局中人参与博弈,给定其他人策略

的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态。 标准定义,在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1, si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1, sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 关于纳什均衡最经典的案例莫过于囚徒困境了,关于这个经典案例已经分析得太多太多,这里就不详细介绍了。 那么就通过生活中的例子来简单加入纳什均衡定理吧。话说马上就要期末考试了,有小A同学和小B同学两位刻苦学习的好孩子。他们相约一起复习,假设两人对各个学科的掌握情况不一致,小A对《经济学原理》比较熟络,而小B则更加擅长于《博弈与实践》课程。于是他们两个就打起了小算盘:如果小A和小B都自己复习自己所掌握

纳什均衡点

纳什均衡点 纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。 如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。 [编辑本段]例子 经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。于是,两人同时陷入招供还是不招供的两难处境。如果两人均不招供,将最有利,只被判刑三年。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。 囚犯甲的博弈矩阵 囚犯甲 招供不招供 囚犯乙招供判刑五年甲判刑十年;乙判刑一年 不招供甲判刑一年;乙判刑十年甲判刑三年 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。 [编辑本段]学术争议和批评 第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发

博弈论与纳什均衡

《博弈论与纳什均衡理论》 姓名张贺祺 学号 2010010404 专业政治经济学 指导老师张秉云

摘要 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 关键字:博弈论;纳什均衡;合作博弈;非合作博弈

目录 摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) (一)博弈论的主要思想 (4) (二)博弈论的分类 (5) 三、经典案例 (7) (一)博弈论的经典案例 (7) (二)纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) (一)博弈论的重要影响 (8) (二)纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论 一、引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈论(Game Theory):亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 二、博弈论与纳什均衡的主要内容 (一)博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,因此对

博弈类型及其表述形式

博弈类型及其表述形式 1 博弈的分类 博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图 1.1。合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。 合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。 图1.1 博弈的分类 非合作博弈的分类主要从两个角度进行划分。一是参与者的行动顺序。 从这个角度博弈

相关文档