当前位置：文档库 › 博弈论复习题型参考

博弈论复习题型参考

一．选择题

1.一个博弈中，直接决定局中人支付的因素是（）：

A. 策略组合；

B. 策略；

C. 信息；

D. 行动。

2.下面的例子中，（）可以说明古诺模型。

A．两商店的距离;B．偏远农产品市场上两大西瓜种植垄断商的价格竞争

C．偏远农产品市场上两大西瓜种植垄断商的产量竞争;D．彩电的尺寸偏好差异

3.海萨尼公理是（）

A. 某些参与人不知道自然的选择，但假设所有参与人都知道自然选择的概率

B. 假设所有参与人都知道自然的选择

C. 某些参与人不知道自然的选择，但假设部分参与人知道自然选择的概率

D. 以上都不对

4.下列说法错误的有（）

A．非对称信息会导致市场的失灵。

B．有限完美信息动态博弈，逆向归纳法是求解子博弈精练纳什均衡的最简便方法。C．海萨尼转换”把“不完全信息博弈”转换成“完全但不完美信息博弈”。

D．如果单阶段的博弈有纳什均衡，则有限次重复博弈的均衡还是单阶段博弈的简单重复。

5. 从参与人对其他参与人的各种特征信息的获得差异来分，博弈可分为（）A．静态博弈和动态博弈;B．合作博弈和非合作博弈;

C．完全信息博弈和不完全信息博弈 ;D．完全信息静态博弈和完全信息动态博弈

6.下述错误的表述是（）。

A、现实中，信息不对称比信息对称更为普遍;

B、产出的不确定程度会影响对代理人的激励强度；

C、父子合开的小企业中不存在委托——代理问题;

D、委托人与代理人的利益几乎不可能完全一致

7．按照非对称信息发生的时间不同来分类，信息经济学可分为（）

A．逆向选择模型和信号传递模型；B．逆向选择模型和道德风险模型

C．信息甄别和信号传递模型；D．隐藏行动的道德风险和隐藏信息的道德风险

8.关于战略式与扩展式，以下命题正确的是（）

A. 战略式方法只能表述静态博弈；

B. 扩展式方法不能表述有无限战略的博弈；

C. 扩展式方法只能表述动态博弈；

D. 扩展式与战略式表述包含的要素是相同的

9.贝叶斯纳什均衡属于哪种博弈中的均衡状态？（）

A、完全信息静态博弈；

B、完全信息动态博弈；

C、不完全信息静态博弈；

D、不完全信息动态博弈。

二．辨析题。

1.重复博弈能促进博弈方更合作和提高博弈效率。

2.分成制能够有效解决现实生活中的激励问题，而固定工资却不能。

3.由于存在信息不对称，所以在委托代理关系中，高产出应获得高回报，从而达到激励的目的。

三．综合题

1.在纳税检查的博弈中，参与人为税收机关和纳税人。税收机关可以选择检查或不检查，C 为检查成本，纳税人可选择纳税或者逃税，假设A为应纳税款，F是偷税被检查后的罚款，设C

（2）请问该博弈是否存在纯战略纳什均衡以及混合策略纳什均衡。（3）试分析A，C,F三个参数的变动分别对税收机关和纳税人的决策的影响。

2.三寡头市场需求函数为P=100-Q,其中Q是三个厂商的产量之和，并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2先同时决定产量，厂商3根据厂商1和厂商2的产量决策，问他们各自的产量和利润是多少？

3.（本题15分）两企业合作开发某产品的市场。以下博弈矩阵的纳什均衡是什么？合作的局面在一次性博弈中是否出现。如果该原博弈进行重复无限期，试确定双方为保证合作出现的触发战略，并求最低的贴现因子δ，使得触发战略是一个子博弈精炼纳什均衡。

企业乙

不合作合作

企业甲不合作0,0 3，-1

合作-1,3 2,2

4.两个企业共同分割一个市场，市场的当前利润是100万美元，在谈判的第一个回合中，企业甲提出自己要求万美元的市场份额，企业乙或者接受或者拒绝，出价费用为0.若企业乙拒绝，在第二个阶段企业乙提出给企业甲万美元的市场份额，但此时由于时间的推移，部分市场已经流失掉，此时的总市场份额只有原来的3/4，企业甲或者接受或者拒绝。企业甲如果拒绝，他可以在第三阶段提出自己得到万美元的市场份额。此时的市场总份额只有上一期的2/3,企业乙或者接受或者拒绝。此时如果没有任何一项提议被双方接受，则双方会彻底失去这个市场。画出该博弈的扩展式表述，并给出该讨价还价问题的均衡结果。

5.两个项目组同时决定是否维护某合用的实验室设施。如果只要有一个实验室维护，两项目组就都能得到1单位好处；没有人维护则两个项目组均没有好处。设两个项目组维护的成本不同，分别为c1, c2.

（1）如果假设c1,和c2.分别为0.1和0.5，该博弈的纳什均衡是什么？博弈结果会如何？（2）如果假设c1,和c2.都是独立均匀分布在[0,1]上的随机变量，真实水平只有每户人家自己知道，该博弈的贝叶斯纳什均衡是什么？

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论 1.博弈的概念：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。它包括四个要素：参与者，策略，次序和得益。 2.一个博弈的构成要素：博弈模型有下列要素：(1)博弈方。即博弈中决策并承但结果的参与者．包括个人或组织等：(2)策略。即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序：次序不同一般就是不同的博弈，即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别：合作博弈：允许存在有约束力协议的博弈；非合作博弈：不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时，当事人能否达成一个具有约束力的协议。假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品（价格），则是非合作博弈。合作博弈：团体理性（效率高，公正，公平）非合作博弈：个人理性，个人最优决策（可能有效率，可能无效率） 4.完全理性和有限理性: 完全理性：有完美的分析判断能力和不会犯选择行为的错误。有限理性：博弈方的判断选择能力有缺陷。区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性：个体理性：以个体利益最大为目标；集体理性：追求集体利益最大化。第一章课后题：2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×） ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√） — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

完整word版,博弈论期末复习题

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A U D 解：由划线解得知有一个纯战略均衡（R D ,）再看看它是否有混合战略均衡设B 以)1,(γγ-玩混合战略，则有均衡条件： γγγ-=-+?=2)1(21)(U V A γγγ26)1(64)(-=-+?=D V A γγ262-=- 得14>=γ，这是不可能的，故无混合战略均衡，只有这一个纯战略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡解：由奇数定理，若使它先有两个纯战略均衡，则很可能就有另一个混合战略均衡。 B A U D 将博弈改成上述模型，则 )1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 5 4 = γ 同样，设A 的混合战略为)1,(θθ-，则

)1(25)1(16θθθθ-+=-?+ θθ3251+=+ 2 1= θ 于是混合战略均衡为? ???????? ????? ??51,54,21,21。二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上，1认为2选a 的概率为P ，则1选L '的支付P P P 32)1(25+=-+= 1选R '的支付P P P P 3233)1(36+>+=-+=

故1必选R '。 ? 给定1在第二个决策结上选R '，2在左边决策结上会选a ，故子博弈精炼均衡为 {}),(,,d a R L ' 四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为 11q c =，其中1q 为厂商1的产量。第2个厂商的成本函数为22cq c =，其中2q 为厂商 2的产量，c 为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c 是厂商2的“私人信息”，厂商1认为c 在?? ????2 3,21上呈均匀分布。设市场需求函数为 214q q P --=，其中P 为价格，两个厂商都以其产量为纯战略，问纯战略贝叶斯均衡为何？解：给定2q ，厂商1的问题是 1 211 1)14( )1(max 1 q q q q P q ---=-=π 因)(22c q q =。厂商1不知道c ，故目标函数为 ?? ????--=---??2 /3212 112 /31212112 11 )(3max )1)(4(max dc c q q q q dc q c q q q q 一阶条件： 0)(232 /3212 1 =- -? dc c q q 得 ?-=2 /3212 1)(2123dc c q q （1）厂商2的问题是： 22 2122212 2)4( )4( )(max 2 q q q q c q c q q q c P q ---=---=-=π 一阶条件： 02)4(21=---q q c

博弈论的考试复习资料

一、简答题 2、什么是信号传递博弈？请举例说明。信号传递博弈是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这个博弈中，有两个参与人，i=1、2，参与人成为信号发送者，参与2称为信号接收者；参与人1的类型是私人信息，参与人2的类型是公共信息（即只有一个类型）。举例：（1）“市场进入阻挠”是产业经济学中的一个典型例子。设想有一个垄断企业已在市场上(称为“在位者”)处于优势地位,另一个企业虎视眈眈谋求进入(称为“进入者”)。在位者若要保持自己的垄断优势,就会想方设法阻挠进入者进入。动态博弈通常用博弈树表示,如下图中,进入者先选择行动(进入或不进),在位者然后默许或斗争,最后的数字是支付水平。如进入者选择“进入”,在位者选择默许,支付水平分别为40和50。用不完全信息动态博弈分析“市场进入”例子。在这个博弈中,在位者可能是低成本,也可能是高成本,进入者无法得知。假设在位者先行动———比如说定价。用P表示价格,那么,P 本身可能包含有关在位者成本函数的信息,因为不同成本函数下的最优价格是不一样的。假定存在一个价格P3,只有低成本企业才有利可图,而高成本企业是不敢模仿这个价格的。那么,精炼贝叶斯均衡是,低成本在位者选择P3,高成本企业选择一个较高的垄断价格;如果进入者观察到在位者选择了P3,就推断其为低成本,不进入;否则,就认为在位者是高成本,进入。这就说著名的“垄断限价模型”。

这里，在位者是信号发送者，进入者是信号接受者。当在位者选择价格时，他知道进入者将根据自己选择的价格判断自己是高成本还是低成本的概率；进入者确实是根据观测到的价格修正对在位者类型的判断，然后选择进入还是不进入。 3、“在动态博弈中，因为后行动的博弈方可以观测到先行动方的选择，因此，总是有利的。”此说法正确吗？为什么？不正确，因为在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业可能具有先动优势。 4、简述不完全信息静态博弈由哪些要素构成？

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。（× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.（）博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。 (×）在一个博弈中博弈方可以有很多个。（√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√）在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. （×）上策均衡就是帕累托最优得均衡。（×）因为零与博弈中博弈方之间关系都就是竞争性得、对立得，因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。（×）在博弈中存在着先动优势与后动优势，所以后行动得人不一定总有利，例如:在斯塔克伯格模型中，企业就可能具有先动优势。囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果，就是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.（√）不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈，共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡，或者混合战略与纯战略轮流采用。(√）如果阶段博弈G＝｛A1， A2，…，An; u1, u2，…,ｕn)具有多重Ｎａsh均衡,那么可能(但不必)存在重复博弈G（T）得子博弈完美均衡结局，其中对于任意得t＜T,在ｔ阶段得结局并不就是G得Nash均衡.（√）(或:如果阶段博弈G=｛Ａ１，A２,…，An; ｕ1，u2,…，ｕn)具有多重Ｎash均衡,那么该重复博弈G（Ｔ)得子博弈完美均衡结局，对于任意得t<Ｔ，在t阶段得结局一定就是G得Ｎash均衡。）零与博弈得无限次重复博弈中,所有阶段都不可能发生合作，局中人会一直重复原博弈得混合战略纳什均衡.(√）（或：零与博弈得无限次重复博弈中,可能发生合作，局中人不一定会一直重复原博弈得混合战略纳什均衡.(×））原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合，符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果，符合所有局中人得利益，因此，不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益，但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

博弈论基础复习

《博弈论基础》主要知识点一、名词解释（5×2＝10分）策略型博弈它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。混合策略局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。扩展型博弈博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具。博弈树对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。完美信息博弈是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。类型 :一般地，将一个参与人所拥有的所有私人信息称为他的类型。信号博弈是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。分离均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。混同均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。联盟

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P,I)，其中P为市场价格，I为消

费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。比较： 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论与社会科学方法论(潘天群)

通识课课程中文名称：博弈论与社会科学方法论课程英文名称：Game Theory and Methodology of Social Sciences 课程代号：开课学期：第一学期（秋学期）主讲教师：潘天群职称：教授、博导研究专长：博弈论、逻辑学、科学方法论所在院系：哲学联系电邮：tqpan@https://www.wendangku.net/doc/ed5591122.html, 授课对象：全校二、三年级本科生（不限专业）一、主讲教师简介：潘天群，哲学博士，现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才（2006）。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。主要研究领域为：逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部：《行动科学方法论》，《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》，自2002年出版以来深受读者欢迎，为畅销书与长销书，已出版第三版。主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”（2009）。二、课程简介由于“他人”与“我”是既合作又竞争的关系，研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来，对社会现象表现出强大的解释力，已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖，许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学（如生物学、人工智能）之中。本课程突破数理博弈论的框架，结合主讲教师十年来的研究工作，构建适合

博弈论考试试题

博弈论考试试题你有三个小时考试时间。回答所有问题。考试内容比较多，我在认为最难的问题旁边标注了星号，如果你担心不够时间，可以把这些带星号的问题留到最后才做。 1．（55分钟—36分）简略回答下面每个子问题。请写出你的计算过程，并在你不能给出正式结论时，提供大概的解释，那样我可以给你部分分数。（a）尽可能给出正式的说明，指出一个观察到的行为是无穷连续的多级博弈意味什么？给出一个不是无穷连续博弈的例子。（b）尽可能给出正式的说明，指出一个一般性支持的性质意味着什么？在课上我们看到什么理论关于一般性支持的性质？（c）课堂上，在说明带有可观察行为的有限扩展型博弈和无限期多级博弈时，我不同地详细讲述了支付函数。支付函数范畴是如何不同？为什么我做出这个改变？（d）在扩展型博弈中给出一个策略的正式定义。（e）给出一个博弈的例子，其中一个看起来不合理的结果在一个子博弈完美均衡里变成可能。（f）下面显示的扩展型博弈里，博弈者1有多少个纯策略？写出正常形式的支付矩阵。这个博弈有多少子博弈？（g）找出下面博弈中全部的纳什均衡。

（h ）找出二阶段博弈的子博弈完美均衡，博弈者在成本a/16处选择a ，于是博弈者1和2同时行动进行博弈，如下面所示。（i ）找出同时行动博弈中的纳什均衡，其中博弈者1选择1a ∈?，博弈者2选择2a ∈?，支付是，

考虑如下的关于信任的博弈，这在很多试验中都做过。试验者从给博弈者1$10和给博弈者2$0开始。然后试验者问博弈者1愿意将多少美元给博弈者2来帮助他。如果他选择给x美元给试验者，则试验者给博弈者2 *3x。随后，博弈者2有机会将一些或全部（或没有）他获得的钱给博弈者1。（a）假定这两个博弈者都是风险中性的，仅关心他们自己的支付，找出这个博弈的子博弈完美均衡。（顺便说明，子博弈完美均衡不像在试验中出现。通常博弈者1给出一些，但不会把全部的钱给回试验者） (b) 这个博弈有博弈者获得更高支付的纳什均衡吗？（c）假定我们修改了博弈，以致在上述的两阶段后，博弈者1有机会打博弈者2。假定这将减少博弈者1的效用1美元，减少博弈者2的效用5美元。这将改变你们在（a）和（b）中的答案吗？如果我们在第二阶段后有如下显示的博弈会怎么样呢？作个你认为合理的预测。（d*）对这个试验结果的另一个解释是，博弈者可以是无私心的。说明无私心的最简单表达——每个博弈者最大化他自己的美元支付和其他博弈者美元支付的权重和——除了权重上一个特别（非强迫）的选择，不能解释试验规则性。你能想出可能被用来说明试验结果的效用函数吗？

博弈论复习讨论题

1、人与人之间的博弈是什么关系？既可以是竞争关系，也可以是合作关系 2、因为博弈论的研究而获得1994年诺贝尔经济学奖的是泽尔腾、海萨尼、纳什 3、学习博弈论的目的只是为了在今后与他人的博弈中能够打败对手（×） 4、博弈是指在一定的游戏规则约束下，基于（直接）相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。 5、如果博弈前的损益总和与博弈后的损益总和相等，该博弈称为零和博弈 6、策略具有以下特性：完整性、不可观察性、多样性 7、人在博弈中并不是完全理性的（√） 8、博弈论的建立基于两大假设，其中除了人的理性以外，还有一个是（人的认知） 9、囚犯困境的根本原因在于个人行为的负外部性（私人成本与社会成本的差异） 10、在囚犯困境的博弈中，事先订立攻守同盟一定是有用的（×） 11、（占优）策略是指无论其他参与者采取什么策略，某参与者采用该策略的结果都优于或不劣于其他策略。 12、以下现象哪些明显属于“囚犯困境”？价格战、公地悲剧、环境污染 13、“好货不便宜、便宜没好货”其实是一个“智猪博弈”，这是因为不懂行的人占了懂行的人的便宜 14、之所以会出现“万元陷阱”，是因为：不懂得止损、沉没成本 15、智猪博弈是一个搭便车的博弈。一方付出了相应的代价，双方共享了所得到的收益。（√） 16、人在“亏损”的情况下，会从一个风险（厌恶）者变成了风险偏好者。 17、以下哪些博弈不属于竞争关系？同学聚会 18、哪些行业是赢者通吃的？演艺界、搜索引擎、门户网站 19、杭州试行的“谦让牌”之所以没效果，是因为宣传力度不够（×） 20、汇合点（Meeting point）必须是（共同）知识才有用 21、以下是某教授和学生张三之间的策略表达式：教授选择放过该学生的概率是多少？50% 22、以下是某教授和学生张三之间的策略表达式：张三选择平时勤快的概率是多少？20% 23、纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动（√）

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征： 1. 研究对象的普遍性和应用范围的广泛性人们的行为之间存在相互作用与相互依赖，不同的行为主体及其不同的行为方式所形成的利益冲突与合作，已成为一种普遍现象，这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实，使博弈论的研究内容和应用范围十分广泛，涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域，在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性一是运用数学模型来描述所研究的问题，使博弈论的分析更为精确。二是研究方法具有抽象化的特征，由于博弈论分析大量使用了现代数学，使它所描述和分析的过程及所揭示的结论都带有抽象、一般化的特点。三是博弈论分析方法所体现的模式化特征，博弈论为人们提供了一个统一的分析框架或基本范式，从而使博弈论能够分析和处理其它数学工具难以处理的复杂行为，成为对行为主体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中，不仅要应用现代数学的大量知识，还涉及到经济学、管理学、心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性博弈论中的最佳策略是经济学意义上的最优化，它只回答是什么导致博弈均衡，均衡的结果是什么，所遵循的基本原则是科学结论的客观性和普遍性。从实践上看，博弈论突破了传统的完全竞争、完全信息假定，更加强调决策者的个人理性，强调不完全信息、不完全竞争条件下的经济分析，强调决策个体之间的相互影响和相互作用等外部性，强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致，等等。作为一门方法论科学，除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外，还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说，博弈论方法具有实证的特征，使研究结果更具有真实性。

历史的制度分析：博弈论分析方法

历史的制度分析：博弈论分析方法把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究，目前主要有两种方法。一种是“进化博弈论方法”（evolutionary game approach）。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比，研究人类经济行为中的策略和行为方式的均衡，以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为，社会制度并不是由什么人有意设计出来的，而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入，就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视，主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程，从而在纳什均衡的理性主义解释遇到理论困难时，显示出了通过进化机制实现纳什均衡的可能性。应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”（repeated game approach），它运用更精细的均衡概念，如“子博弈精炼均衡”（subgame perfect equilibrium）来分析历史与现实中的制度选择与变迁过程。其中最具代表性的，就是格瑞夫进行的“历史的比较制度分析”。所谓的重复博弈，实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同，它是由若干个阶段博弈（stage game）构成的一个完整的和相对长期的博弈过程。因此，在重复博弈中，各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益，而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时，他必须考察到其在当前阶段的博弈中所采取的策略，不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说，他不能像在一次性博弈中那样，毫不顾及其他博弈方的利益。有时，一方若作出一种合作姿态，可能会使其他博弈方在随后的阶段中也采取合作态度，从而实现共同的长远利益。这样，在重复博弈中就存在着比一次性博弈更大的合作的可能性，也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征，为它说明人类之间的合作行为，特别是说明历史与现实社会中体制与制度的演变过程，提供了强有力的支持。在历史的比较制度分析那里，制度被定义为本身是“自我实施的对行为的非技术决定的约束” ，即所谓的自我实施制度（self-enforcing institution ）。自我实施制度的一个最基本的特征，就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同，自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此，历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程，也就是制度博弈各方在特定的战略局势中，根据自己不同的目标自主地选择各自的最优策略与对手进行博弈，最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”，恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说，一个子博弈精炼均衡，必须是各博弈方在整个博弈的每个阶段（子博弈）都选择了不愿单独改变的策略（纳什均衡）的最终结果。如果我们从博弈论的角度来观察自我实施制度，就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说，自我实施制度所具有的自发产生和自我实施的基本属性，说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果，也即实现子博弈精炼均衡的结果。更直接地说，自我实施制度的产生，必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说，如果一个制度博弈实现了子博弈精炼均衡的结果，那它也应该是自我实施的。

博弈论复习题及答案

博弈论判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

论文-博弈论方法在经济学中

经济生活中的博弈论应用摘要：博弈，这个原来只是在学术圈出现的名词，如今已经越来越多地走进了我们的生活。博弈论是运筹学的一个重要分支，其中，非合作博弈（non- cooperative game）是现代博弈理论中的核心内容和重要基础，下面通过对经典案例囚徒困境和智猪博弈的分析，对纳什均衡相关定义的研究，得到了在经济决策中行为人如何决定最优决策的方法。在此基础上，以纳什均衡作为理论支撑点，结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。关键词：博弈论；均衡点；得益矩阵；纳什均衡

目录一.引言 (3) 二．博弈论与纳什均衡的主要内容 (3) 2.1博弈论的主要思想 (3) 2.2博弈论的分类 (4) 2.3纳什均衡 (4) 2.4 纳什均衡的分类 (4) 三．案例分析 (5) 3.1 囚徒困境（1950年，图克） (5) 3.1.1案例分析 (5) 3.1.2案例应用 (6) 3.2 智猪博弈（1950年，约翰.纳什） (6) 3.1.1 案例分析 (7) 3.1.2 案例应用 (7) 四．价格战博弈 (8)

一.引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）以及冯·诺伊曼（V on·Neumann）。1928年冯·诺伊曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学期的基础和理论体系。1950-1951，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，以此为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。二．博弈论与纳什均衡的主要内容 2.1博弈论的主要思想书上是这样定义的：博弈是指一些个人或者组织面对一定的环境条件，在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施，进而各自取得相应结果的结果。现代科学将这种“对策论”、“对局理论”称之为博弈论，主要研究公式化了的激励结构间的相互作用。从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的

博弈论知识点总结完整版

博弈论（一）：基本知识 1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。 1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。 1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈： a、完全信息静态博弈，纳什均衡，Nash(1950) b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965） c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968） d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form） 1.6占优均衡： a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i，si*称为参与人 i的严格占优战略，如果满足： ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡： a、“严劣”和“弱劣”的含义：设s i’和s i’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’’。 b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。（二）：纳什均衡（Nash Equilibrium） 2.1纳什均衡定义：对于一个策略式表述的博弈G={N,S i, u i,i∈N}，称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡，如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略（经济理性策略），即：u i(s i*, s-i*)

博弈论试题

杭州师范大学2010-2011学年第二学期通识课程期末考试《博弈论与企业管理》试卷一、单项选择题（本大题共12题，每题3分，共36分） 1. 下列关于优势策略均衡和纳什均衡的描述正确的是（） A 优势策略均衡肯定是纳什均衡； B 纳什均衡都是优势策略均衡； C 纳什均衡是特殊的优势策略均衡； D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是（） A 承诺使威胁可置信； B 承诺往往对自己构成约束； C 承诺往往不需要成本； D 承诺往往会给自己带来成本，但最终结果使自己有利 3. 对于以下报酬矩阵，哪个命题是正确的（） A 甲和乙都有占优策略； B 只有甲有占优策略； C 只有乙有占优策略； D 两人都没有占优策略 4. 对于如下报酬矩阵，乙的占优策略是（） A 上； B 中； C 左； D 右

5. 对于题4的报酬矩阵，以下哪个是纳什均衡（） A （上，左）；B （上，右）；C （下，右）；D （上，中） 6. 对于题4的报酬矩阵，如果乙先走一步，并且知道甲再作决策时已经知道乙的决策，那么，乙将采取（） A 左；B 中； C 右；D 上 7. 交易双方信息不对称，比如买房不知道卖方的一些情况，是由于（） A 卖方故意隐瞒自己的一些情况； B 买方自身的认识能力有限； C 买方掌握完全信息的成本太高； D 以上三种情况都有可能 8. 面对不对称信息，下列哪一项不能为消费者减少信息不对称（） A 品牌；B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号（） A 产品保证； B 延长的质量保单； C 暂时的经营场所； D 被认可的品牌 10.在二手市场上，（） A 买主知道商品的质量，而卖主不知道； B 买主不知道商品的质量，而卖主知道； C 卖主和买主都知道商品的质量是低的； D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够（） A 使代理人参与工作的净收益不低于不工作也能得到的收益； B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平； C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突； D 以上都是 12.在信息不对称的劳动力市场，效率最低的激励机制是（） A 固定工资；B 效率工资；C 利润分享； D 提成二、简答题（本大题共6题，第1、2、3题每题4分，第4、5、6题每题6分，共30分） 1.一个博弈如果出现两败俱伤的结果，这样的博弈一定是非合作的零和博弈吗 2.两个罪犯只打算合伙犯罪一次，所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次，那么在开始的犯罪活动中如果被捕，还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下：（1）如果（上，左）是优势策略均衡，那么a ，b ，c ，d 应满足什么条件（2）如果（上，左）是纳什均衡，那么，又应该满足什么条件（3）如果（上，左）是优势策略均衡，那么，它是否必定是纳什均衡为什么