文档库 最新最全的文档下载
当前位置:文档库 › 博弈论完全信息静态博弈

博弈论完全信息静态博弈

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论

博弈论 1 引言 博弈论包括局中人,策略和支付函数三个要素。有n个局中人参入的博弈称为n人博弈, n≥ 2。每个局中人有个支付函数,其收益或损失由所有局中人的策略按照该支付函数计算。每个局中人采用的策略可以是其多个策略中的某一个,或者是策略的某种概率分布。前者称为纯策略博弈,后者称为混合策略博弈。纯策略可以看作是混合策略的特殊情形。根据局中人之间的关系,博弈分为合作博弈和非合作博弈。每个局中人都希望使自己的利益最大化。但是在非合作博弈中,由于局中人的利益是互相冲突的,只能寻求一组策略使每个局中人较为满意。一组策略是指由每个局中人的一种策略构成的策略组合。如果存在一个策略组合,无论那个局中人单方面地改变其策略,不会使其收益增加,只可能使其收益减少,这个策略组合就叫做納什均衡(或納什均衡解、納什均衡点)。以下是关于納什均衡的正式定义及其存在性定理(见[1])。 Formal definition Let (S,f) be a game with n players, where S i is the strategy set for player i, S = S1?S2?…?S n is the set of strategy profiles and f = (f1(x), f2(x), … , f n(x)) is the payoff function for x∈S. Let x i be a strategy profile of player i and x-i be a strategy profile of all players except for player i. When each player i∈ {1, 2, … , n} chooses strategy x i resulting in strategy profile x = (x1, x2, … , x n) then player i obtains payoff f i(x). Note that the payoff depends on the strategy profile chosen, i.e., on the strategy chosen by play i as well as the strategies chosen by all the other players. A strategy profile x*∈S is a Nash Equilibrium (NE) if no unilateral deviation in strategy by any single player is profitable for the player, that is ?i, x i∈S i: f i(x i*, x-i*) ≥f i(x i, x-i*). Nash’s Existence Theorem If we allow mixed strategies, then every game with a finite many pure strategies has at least one Nash Equilibrium.(有限策略的非合作n人博弈至少有一个納什均衡) 2 二人博弈 2.1 纯策略博弈 局中人I有m个策略A1, A2, … , A m,局中人II有n个策略B1, B2, … ,B n,不同策略下双方的收益如表2.1所示([2]p72)。 表2.1 二人博弈的收益表 由每个单元格中前一个数字构成的矩阵A = (a ij)m?n是局中人I的收益矩阵,由后一个数

完全信息和不完全信息-博弈论相关

3、完全信息和不完全信息: 完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。 在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数。 温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。显然不完全信息意味着不完美信息,但逆命题不成立。 12、完美和不完美信息: 不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。 完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。 2、贝叶斯均衡: 是纳什均衡在不完全信息博弈中的自然扩展。在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型。这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用 14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。 贝叶斯纳什均衡:P147 4、有限次重复博弈: 16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。 7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。 激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。显然,只有代理人选择委托人所希望的行动是得到的期望效用不小于他选择其他行动是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。满足激励相容约束的机制称为可实施机制。 8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H是PAI发生的概率的比率,它告诉观测者观测到的PAI在多

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 1.2博弈论的主要特点 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类 博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(sub game perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型等等。 1.4纳什均衡 纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博

完全信息和不完全信息博弈论相关

3、完全信息与不完全信息: 完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。 在不完全信息博弈里,至少有一个参与人不知道其她参与人的支付函数。 温泉信息就是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。显然不完全信息意味着不完美信息,但逆命题不成立。 12、完美与不完美信息: 不完美信息指的就是自然做出了它的选择,但就是其她选择人并不知道它的具体选择就是什么,金知道各种选择的概率分布。 完美信息:指一个参与人对其她参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。 2、贝叶斯均衡: 就是纳什均衡在不完全信息博弈中的自然扩展。在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其她参与人实际上会选择什么策略,但就是它能正确预测到其她参与人的选择如何以来与其各自的类型。这样,她决策的目标就就是在给定自己的类型与别人的类型已从战略情况下最大化自己的期望效用 14、PBNE贝叶斯纳什均衡就是这样一种类型依从战略组合:给定自己的类型与别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就就是说没有人有积极性选择其她战略。 贝叶斯纳什均衡:P147 4、有限次重复博弈: 16、重复博弈就是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。定理:令G就是阶段博弈,G(T)就是G重复T次的重复博弈(T小于正无穷)。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果就是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都就是一次性博弈的均衡结果)。 7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。 激励相容约束也就是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望她选择的行动。显然,只有代理人选择委托人所希望的行动就是得到的期望效用不小于她选择其她行动就是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。满足激励相容约束的机制称为可实施机制。 8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H就是PAI发生的概率的比率,它告诉观测者观测到的PAI在多大

博弈论基础作业及答案【最新资料】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论论文--非合作博弈论

非合作博弈论 博弈论也叫对策论,是现代微观经济学的基础领域之一,主要研究在彼此互动的情形下个人是如何做决策的。近年来它已经被广泛地应用于商业、政治、社会学等其他社会科学的分析中。博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。 1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈—“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,妙笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案 如果图片不显示,用打印预览就可以了。 P127 第一题:领悟精神就可以了,而且每本书上都有这些例题,不找了。 第二题: UMD 为参与人1的战略,LMR 为参与人2的战略。前面的数字代表参与人1的得益,后面的代表参与人2的得益。 参与人2的R 战略严格优于M 战略,剔除参与人2的M 战略,参与人1的U 战略优于M 战略,剔除参与人1的M 战略,参与人1的U 战略优于D 战略,剔除参与人1的D 战略,参与人2的L 战略优于R 战略,剔除参与人2的R 战略。最后均衡为U ,L (4,3)。这样可能看不清,按照步骤一步步画出图就好多了。 第三题:恩爱型 厌恶型 用划线法解出,恩爱的都活着或者都死,厌恶的或者受罪,死了对方另一个人开心的不得了。 第四题:没有人会选择比原来少的钱,战略空间为{原来的钱,比原来多的钱}。支付为{0,原来的钱,比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。 第五题:n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题:在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 第七题:设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P 2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。 解得:P 1=P 2=a+C ,π1=π2=a 2。 第八题:不会! 到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。 第十题: 无纯战略纳什均衡,设参与人1为P 1~P 4,参与人2为Q 1~Q 4。 得到:-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3,推出:Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子,老虎,鸡,虫子中选择一个。

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与人 i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡。 (二):纳什均衡(Nash Equilibrium) 2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略(经济理性策略),即:u i(s i*, s-i*)

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析.在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就

是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战> 这个例子讲的是一男一女谈恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出.男的偏好足球,女的则更喜欢芭蕾,但他们都宁愿在一起,不愿分开。这个博弈中,有两个纳什均衡:(足球,足球)(芭蕾,芭蕾).就是说,给定一方去足球场,另一方也会去足球场;类似的,给定一方去看芭蕾舞,另一方也会去看芭蕾舞.那么,究竟哪一个纳什均衡会实际发生?我们不知道.只有看实际生活了. <案例四:斗鸡博弈>

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

相关文档
相关文档 最新文档