文档库 最新最全的文档下载
当前位置:文档库 › 博弈论期末考试

博弈论期末考试

博弈论期末考试

考试题目:

1.在剪刀石头布博弈中,如果参与人1的最优策略反映为(0.6,0.3,0.1)则参与人2的最优策略反映是什么?

2.考虑下面的贝特兰德双头垄断模型在非对称信息下的情况,两企业产品存在差异。对企业i的需求为q i=a?p i?b i?p j,两企业的成本为0。b i可以为b?也可以为b l,b?>b l>0。对任意的i,有P b i=b?=θ,P b i=b l=1?θ,并与b j无关。每个企业只知道自己的b i,但不知道对方的,以上均为共同知识。此博弈中的行动空间、类型空间、推断以及效用函数各是什么?双方的战略空间各是什么?此博弈对称的纯战略贝叶斯纳什均衡应该满足哪些条件?求出均衡解。

3.两个合伙人希望能完成一个项目,在项目结束时,每个合伙人能得到收益V,但结束前则一无所得,尚需R的成本。两合伙人都不能承诺只靠自己的力量完成,于是有:在阶段1,参与人A选择贡献c1,如果贡献使得项目能完成,则博弈结束,每个人都得到V价值;如果不行(c1

4.求下图中所有纯策略纳什均衡、子博弈精炼纳什均衡以及精炼贝叶斯均衡。

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论课件 1

1 Lecture 1 Introduction to Game Theory,Extensive &Normal Form,Mixed Strategies and Beliefs 2

2 Readings ?Watson: Strategy_ An introduction to game theory –Ch 1‐5:1rd ed p.1-40; 3rd ed p.1‐46. ?Introduction;The Extensive Form;Strategies &the Normal Form;Beliefs,Mixed Strategies and Expecte d Payoffs;General Assumptions and Methodology.?Appendix A:Review of Mathematics p.409‐420.3

2 Outline ?Introduction. ?Extensive form representation. ?Strategies. ?Examples. ?Normal form representation.?Mixed strategies. ?Beliefs. ?Expected payoffs. ?General assumptions. 4

2 Game Theory ?Mathematical models of strategic situations : –Each agent’s behavior affects the well-being of other agents.?Perfect competition and monopoly are not strategic situations. –In perfect competition no agent considers the specific action of any other individual agent. –In monopoly the monopolist doesn’t worry about specific consumer’s actions.(Chooses price/quantity based on overall demand.)?Duopoly (2firms producing)is strategic. –Each firm considers the other’s action when deciding on its own. 5

论经济博弈论

论经济博弈论 “博弈即一些个人、对组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。”博弈由英文“game”翻译过来,过去每每听到博弈一词.都觉得这是一个高深莫测、充满神秘色彩的领域,如今通过了系统的学习,才终于可以对“博弈”有一些粗浅的理解。博弈论的英文名称为Gm,ne Theory,也翻译为对策论、游戏论。作为一门现代学科体系,博弈论早在半个世纪以前就已经出现,但长期以来并没有受到足够重视,除了少数博弈论专家以外,很少有人知道它。可是,近年来却受到高度的重视和青睐。1994 年三位致力于博弈论基础理论研究的经济学家共同获得了诺贝尔经济学奖,使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定。此后1996年,诺贝尔经济学奖又由博弈论和信息经济学家莫里斯和维克瑞获得,这进一步肯定了博弈论在经济学中的重要地位,同时也从一个侧面体现出博弈理论已经渡过了成长期,步人了成熟期。 一、博弈论的发展进程 博弈论思想虽然有着悠久的历史,但是作为一门系统的学科来说还相当的年轻。近代以来,在学术研究的过程中许多学者逐渐认识到了博弈论的重要作用,对博弈理论进行了探索研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(W aldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Coumot)和波特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产茸决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反应函数。但是作为一种理论来说,1944年,冯·诺依曼(VonNeumann)和奥·摩根斯坦(Morgenstem)合著了《博弈论与经济行为》在总结了以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提较系统的博弈理论,因此这被认为是博弈理论初步形成的标志。50年代初,纳什(J.Nash)的两篇非合作博弈论奠基性论文发表之后。博弈论飞速发展。作为博弈论的一部分,非合作博弈比合作博弈的发展更加迅速,在经济学等其他学科中的应用也更为广泛。提起博弈论,现在差不多总是指非合作博弈论。50年代以来,纳什(Nash)、泽尔腾(Sehen)、海萨尼(Harsanyi)等人是

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论泽尔腾简介

莱茵哈德?泽尔腾简介 一、人物生平 莱茵哈德?泽尔腾(Reinhard Selten),德国人,1930年10月10日出生于德国的布莱斯劳。由于犹太人的身份,泽尔腾自小对政治、经济学感兴趣,对数学的爱好伴随其一生。 1951~1957年,他在法兰克福大学学习数学,1957年获硕士学位。 1961年,泽尔腾获得马恩法兰克福大学的数学博士学位。 1967~1968年,泽尔腾去伯克利加州大学商学院当客座教授。 1969年接受柏林大学聘请,担任经济学教授至1972年。 1984年,他到波恩大学任经济学教授。 1991年,泽尔腾和夫人伊丽莎白都患上了严重的糖尿病。伊丽莎白因此下肢瘫痪,并且视力也接近失明。但泽尔腾夫妇对生活仍充满了自信。泽尔腾多次来中国访问,并到过多所大学进行学术演讲。泽尔腾在学术报告中展示出的大师的学术精神与态度、深刻的思想见解以及伟大的学术抱负令聆听其报告的每一个人所敬佩。 1994年泽尔腾教授因在“非合作博弈理论中开创性的均衡分析”方面的杰出贡献而荣获诺贝尔经济学奖。 泽尔腾现还任计量经济学社团委员、美国艺术与科学学院外籍名誉院士、青岛大学名誉教授、南开大学公司治理研究中心顾问、南京审计学院名誉教授。

二、主要著作和学术贡献 1、主要著作 泽尔腾的主要学术论著有:《一项寡头垄断实验》、《关于扩展性博弈中均衡完善概念的再检验》、《连锁商店之谜》、《博弈中均衡选择通论》、《价格制定者厂商的一般均衡》(1974年)、《博弈均衡选择的一般理论》(1988年,与哈萨尼合作)、《战略理性模型与决策理论丛书:《系列C:博弈论、数学规划及运筹学研究》(1988年)。1994年,由于“莱茵哈德?泽尔腾教授的均衡分析中的完善性的观念大大扩展了非合作博弈论的应用”,他与约翰?纳什、约翰?哈萨尼共同荣获该年度诺贝尔经济学奖。 2、学术贡献 他的主要学术研究领域为博弈论及其应用、实验经济学等。博弈论是作为数学的一个分支出现的,但是它在军事、政治、经济许多方面都有很多重要的运用,其中以在经济学内的运用最多也最为成功。博弈论整个改写了经济学理论。博弈论对人类的更大贡献是,加强了国际间的交流合作机会。各国对博弈论的研究,促进了人类社会的文明发展。此外,博弈论的思维方式推动了人类思维模式更高层次的发展。 泽尔腾针对纳什均衡中的静态分析的不足,在1965年将扩展型博弈推广为动态博弈,并提出了子博弈的概念和子博弈完美均衡的概念,发展了倒推归纳法。1975年发表“关于扩展型博弈中完美均衡概念的再检验”一文,提出了被称之为“颤抖手完美纳什均衡”的概念,

博弈论课程心得体会

《博弈论与信息经济学》课程心得体会 作为一名会计专业硕士,我选修这门课程是为了了解和学习一种思想方法,这种方法我很早就感兴趣,电影《美丽的心灵》中纳什的故事让博弈论在我心中显得非常神秘和高大上。第一堂课吕老师谈到博弈论已经成为一种主流方法时,学习的欲望变得更为强烈。经过九周的学习,尽管由于有些地方因为数学能力有限,不得尽懂,但我觉得自己起码已经揭开了这种方法的入门和核心的面纱。 我认为,会计专业硕士是为了培养立足于会计的高级管理人才而设置的,除了扎实的专业知识和理论功底,我觉得掌握思想方法是尤为重要的能力。面对会计行业的变革,作为一名研究生,财务管理能力和管理会计能力是我的核心竞争力。这两种能力需要缜密的思维,科学的方法。如果说缜密的思维更需要在学习和实践中不断历练,科学的方法就需要不断地去接触和了解,不断地去主动学习。博弈论就是一种科学的方法。我觉得博弈论是一种寻求均衡的科学,也是一种创造规则的科学。它让我了解面对不同利益相关者时怎么去寻求均衡、博弈,甚至创造有益的规则。同时,它让我有了一种更加科学、简洁的视角看待事物,非常实用有效而且简单漂亮。 博弈论的核心应该是纳什均衡,这是一个理性的策略组合,每个参与者在对方的选择一定情况下会做出纳什均衡策略组合中的策略。这种选择将是每个理性参与人最终的选择。这个道理很明了,也正是明了让这个理论非常有力。吕老师带着我们解决一个又一个案例中的问题时,我感觉到这种方法的神奇和独特。我印象里最深的是吕老师对法律的看法:法律让不可置信的承诺变成可置信的承诺,好的法律是看似严苛,但很少有人触犯它。以前在学习经济法时,我对“法律是一种合同”这种观点不是很在意,吕老师的说法让我有了新的认识。让不可置信承诺变成可置信的承诺,使得最有益的策略组合成为纳什均衡,在这一点上合同和法律的目的和性质是一样的。我还记得吕老师说《反国家分裂法》是一部非常好的法律,在以前我因为它几乎很少被使用而感觉不到这部法律的重量,但从博弈论的角度来看,这部法律使得针对台湾,宣布独立就会被制裁成为一种可置信的承诺,吕老师的解释让我非常赞同。我真的觉得自己看某些问题的视角发生了变化,更加地深刻和科学。 我觉得正是这种视角是我学习这门课程最大的收获。我知道,短短九周的学习远远不足以掌握博弈论,我甚至或许不能完整地计算出一道例题,但是我对它有了一个基本的认识,理解它的理论基础,最重要的在看一些问题时我可以尝试着用博弈论的角度去试试看。最可怕的不是不会用博弈论的技术和方法,可怕的是在能够使用它时我不知道以它的角度去看待问题,知道可以使用这门科学的技术和方法。经过这两个多月的课程,相信将来如果用的着这种方法时,我知道从哪里着手去学习。

博弈论的相关知识

零和博弈 博弈是一种策略的相互依存状况:你的选择或策略将会得到什么结晶,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受禹的策略组合。但是,我们通常还是会把这个博弈当中的其他参与者称为一方的对手。一个博弈的行动可能是相继进行,也可能是同时进行。在相继行动的博弈里,存在一条线性思维链:假如我这么做,我的对手可以那么做,反过来我应该这么应对。。。。。。这种博弈通过描绘博弈树进行研究。其中要遵循法1则:向前展望,倒后推理,就能找出最佳的行动方式。 策略组合 而在同时行动的博弈中,存在一个逻辑循环的推理过程:我认为他认为我认为。。。。这个循环必须解开,一方必须看穿对手的行动,哪怕他在行动时候并不知道这是怎么一回事。要想解开这么一种博弈,可以建立一张图,这张图能显示所有可能想得到的策略组合将会相应产生什么结果。然后按照下列步骤进行分析:首先看参与各方有没有优势策略,优势策略意味着,无论对手采取什么策略,这一策略都将胜过其他的任何组合策略。这就引出法则2:假如你有一个优势策略,请照办。假如你没有优势策略,但你的对手有,那么,尽管认定他一定会照办吧,然后相应选择你自己的策略。 优势策略 接着,假如没有一方拥有优势策略,那就看看有没有人拥有一个劣势策略,劣势策略意味着无论对手采取什么策略,这一策略都将逊于其他作任何策略。如果有,请遵循法则3:剔除劣势策略,不予考虑。如此一步一步做下去。假如在这么做的过程中,在简化之后的博弈里出现了一个优势策略,应该应用这个优势策略。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动法则以及这个博弈的结果。即便这个过程可能有会导出一个独一无二的结果,这么做也可以缩小整个博弈的规模,使其变得更加容易控制。最后,假如既没有优势策略也没有劣势策略,又或者这个博弈已经经过第二步进行了最大限度的简化,那么请遵循法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应。假如存在一个这样的独一无二的均衡,我们就有很好的证据证明为什么所有的参与者都应该选择这个均衡。假如存在许多这样的均衡,你就需要用一个普遍认帐的法则或者说惯例做出取舍。假如并不存在这样的均衡,这通常意味着一切有规则可循的行为都有可能被对方加以利用,这时候你需要将你的策略混合运用。在实践过程中,博弈可能包含一些相继行动过程,也可能包含一些同时行动过程,因此须将上述技巧综合起来,灵活运用,思考和决定自己的最佳行动应该是什么。[2] 《博弈思维》- 零和博弈 简介 零和(zero sum). 赌博中,双方相同的获胜概率。这个词也经常用在政治中,两个国家的势均力敌的实力可以被称作“零和”。“零和”是博弈论的一个概念,意思是双方博弈,一方得利必然意味着另一方吃亏,一方得益多少,另一方就吃亏多少,双方得失相抵,总数为零,所以称为“零和”。“囚徒困境”产生的最主要原因是因应了这种“零和”思维——每个人都在你输我赢的博弈中,追求自身利益的最大化。人们发现在社会的方方面面都能发现与“零和游戏”类似的局面。从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏”场。游戏中不是“你赢我输”,就是“你输我赢”。任何一方的收获,即是对方的损失。 零和理论

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论的理论精华及其现实意义

48 [收稿日期]2002-02-25 [作者简介] 胡希宁(1952-),男,安徽芜湖人,中共中央党校经济学教研部教授;贾小立(1970-),男,山西洪洞人,中共 中央党校研究生院硕士研究生。 博弈论的理论精华及其现实意义 胡希宁 1 贾小立 2 (1.中共中央党校经济学教研部,北京100091; 2.中共中央党校研究生院,北京100091) [摘要]经济博弈论以贴近现实的方式,揭示了现代经济活动的内在规律。它的发展过程是 纳什均衡从提出到改进的过程。无论在理论上还是在实践上,博弈论都具有重要的现实意义。 [关键词] 博弈论;纳什均衡;信息经济学 [中图分类号] F062.5 [文献标识码]A [文章编号]1007-5801(2002)02-0048-06 第6卷第2期 2002年5月 中共中央党校学报 Journal of the Part y School of the Central Committee of the C.P.C. Vol.6,No.2Ma y .,2002 博弈论(Game Theor y )研究的是,各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。冯?诺伊曼(John Von Neumann )与摩根斯坦恩(Oskar Mor g enstern )合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中。到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。纳什 (Nash ,J.F.)的《N 人博弈的均衡点》(1950)、《非 合作博弈》(1951)明确提出了“纳什均衡”(Nash E q uilibrium ),图克(Tucker )则定义了“囚徒困境”(Prisoners’Dilemma ,1950)。两人的著作奠定了 现代非合作博弈论的基石。泽尔滕(R.Seleten , 1965)首次将动态分析引入博弈论,提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Sub g ame Perfect Nash E q uilibrium )和相应 的求解方法———“逆向归纳法”(Bakeward Induction )。豪尔绍尼(J. C.Harsan y i ,1967)首次 把信息不完全性引入博弈分析,定义了“不完全信息静态博弈”(Static Games of Incom p lete information )的基本均衡概念———“贝叶斯-纳什 均衡” (Ba y esian -Nash E q uilibrium ),构建了不 完全信息博弈的基本理论。之后,不完全信息动态博弈(d y namic g ames of incom p lete information ) 得到迅速发展,弗得伯格和泰勒尔(Furdenber g and Tirole ,1991)定义了它的基本均衡概念——— “精炼贝叶斯—纳什均衡”(Perfect Ba y esian -Nash E p uilibrium )。70年代以后,博弈论形成了一个完整的体系;大体从80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展及应用中所作出的开创性贡献。 一经济博弈论的基本理论———基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不完全信息静态、不完全信息动态四种博弈结构为主线,对纳什均衡及其改进进行概括,以阐明经济博弈论的主要思想内涵。 (一)完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概念。完全信息静态博弈(Static Games of Com p lete Information )是指,博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者)对所有其他局中人的特征(策略空间、支付函数等,前者指可供局中人选择的策略组合,后者指决定局中人损益得失的函数)有完全的了解;所有局中人同时选择行

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

清华大学经济博弈论期末考试04

经济博弈论(2004年秋季学期)期末测验题答案 注意:请将所有题目的答案写在答题册上,写在本试题页上一律无效。 1. (20 points) Lucy offers to play the following game with Charlie: “Let us show pennies to each other, each choosing either heads or tails. If we both show heads, I pay you $3. If we both show tails, I pay you $1. If the two don’t match, you pay me $2.” Charlie reasons as follows. “The probability of both heads is 1/4, in which case I get $3. The probability of both tails is 1/4, in which case I get $1. The probability of no match is 1/2, and in that case I pay $2. So it is a fair game.” Is he right? If not, (a) why not, and (b) what is Lucy’s expected profit from the game?(game table, 5 points; solutions, 7 points; (a), 4 points; (b), 4 points) (20分)露西提出与查理玩下面的游戏:“让我们互相向对方亮出硬币,每个人可以选择正面或者背面。如果双方亮出的都是正面,我给你3美元。如果双方亮出的是背 面,我给你1美元。如果两枚硬币正背面不同,你给我2美元。”查理做了这样的推理: “两枚硬币都是正面的概率是1/4,如此我得到3美元。都是背面的概率为1/4,如此我 得到1美元。正背面不同的概率为1/2,如此我付出2美元。因此这是一个公平游戏。” 他的想法是否正确?如果不正确,(a)为什么不正确?(b)露西从游戏中得到的期望 利润是多少?(博弈表5分;解7分;(a)问4分;(b)问4分。) 解答: 该博弈为零和博弈。博弈表如下(5分): CHARLIE Head Tail LUCY Head -3 2 Tail 2 -1 求解博弈。容易看出,该零和博弈没有纯策略纳什均衡。(1分) 只有一个混合策略的纳什均衡为:露西和查理均以3/8的概率出正面,5/8的概率出背面。 (6分) (a)查理的推理不对。因为双方实际(策略性)选择的、出硬币的正背面的概率不同于完 全随机选择的概率(后者正背面概率各为1/2)。查理错误地将一个混合策略的博弈情境当成 了随机选择的“赌博”情境。(4分) (b)露西的期望利润为1/8。(4分)(相应的,查理的期望利润为-1/8,不要求) 2. (20 points) You have to decide whether to invest $100 in a friend’s enterprise, where in a year’s time the money will increase to $130. You have agreed that your friend will then repay you $120, keeping $10 for himself. But instead he may choose to run away with the whole $130. Any of your money that you don’t invest in your friend’s venture, you can invest elsewhere safely at the prevailing rate of interest r, and get $100(1+r) next year. (a) Draw the game tree for this situation and show the rollback equilibrium. (8 points) Next suppose this game is played repeatedly infinitely often. That is, each year you have the

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

(定价策略)价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流管理(采购与供应链1班) 学号:1040407122 姓名:曾维乐 二〇一一年十二月十八日

价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。 关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

相关文档
相关文档 最新文档