文档库 最新最全的文档下载
当前位置:文档库 › (完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)

(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)

(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)
(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)

《博弈论》习题参考答案(Part.Ⅰ)

一、选择题

1.B

2.C

3.A

4.A

5.B

6.ABCD

7.C 8.B 9.C

二、判断正误并说明理由

1.F 上策均衡是比纳什均衡更严格的均衡概论

2.T 上策均衡是比纳什均衡更严格的均衡概论

3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战

5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性

6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡

7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益

10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高

三、计算与分析题

1、 (1)画出A 、B 两企业的损益矩阵。

(2)求纯策略纳什均衡。 (做广告,做广告)

2、画出两企业的损益矩阵求纳什均衡。 (1)画出A 、B

两企业的损益矩阵

(2)求纳什均衡。

两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:

乙 左 右 上 下

(1)如果(上,左)是上策均衡,那么,a>?, b>?, g? 答:a>e, b>d, f>h, g

(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足? 答:a>e, b>d 4、答:(1

)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

答:若新华选择“竞争”,则北方也会选择“竞争”(60000>0);若新华选择

“合作”,北方仍会选择“竞争”(900000>500000)。

若北方选择“竞争”,新华也将选择“竞争”(60000>0);若北方选择“合作”,新华仍会选择“竞争”(900000>0)。

由于“竞争”为双方的占优策略,故均衡结果为两家公司都选择竞争性策略。

5、博弈的收益矩阵如下表:

(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?

答:从占优策略均衡的定义出发:

对甲而言,策略“上”(a,c)优于策略“下”(e,g);

对乙而言,策略“左”(b,f)优于策略“右”(d,h)。

所以结论是:a>e, b>d, f>h, c>g

(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?

答:纳什均衡只需满足:a>e, b>d,

(3)如果(上,左)是上策均衡,那么它是否必定是纳什均衡?为什么?

答:占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。

(4)在什么情况下,纯策略纳什均衡不存在?

答:当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。

7、求纳什均衡。

纳什均衡为:大猪“按”,小猪“等”,即(按,等)

6、

(1)有哪些结果是纳什均衡?

答:(低价,低价),(高价,高价)

(2)两厂商合作的结果是什么?

答:(高价,高价)

8、用反应函数法结合划线法,求出下列博弈的所有纯策略纳什均衡。

参与人1

参与人2

甲乙丙丁

B

参与人1的反应函数:

R1(2)=B,若2选择甲

=B,若2选择乙

=A,若2选择丙

=C或D,若2选择丁

参与人2的反应函数:

R2(1)=丙,若2选择A

=甲,若2选择B

=丙,若2选择C

=丙,若2选择D

求共集,得纯策略纳什均衡为(B,甲)与(A,丙)9、求出下面博弈的纳什均衡(含纯策略和混合策略)。

L R U

D

解:(1)纯策略Nash均衡:由划线法可知,该矩阵博弈没有纯策略Nash均衡。

(2)混合策略Nash均衡

设甲选择“U”的概率为P1,则选择“D”的概率为1-P1

乙选择“L”的概率为P2,则选择“R”的概率为1-P2

对甲而言,最佳策略是按一定的概率选“U”和“D”,使乙选择“L”和“R”的期望值相等

即P1*0+(1-P1)*6= P1*8+(1-P1)*5

解得P1=1/9

即(1/9,8/9)按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均衡对乙而言,最佳策略是按一定的概率选“L”和“R”,使乙选择“U”和“D”的期望值相等

即P2*5+(1-P2)*0= P2*2+(1-P2)*4

解得P2=4/7

即(4/7,3/7)按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡10、根据两人博弈的损益矩阵回答问题:

左右上

(1)写出两人各自的全部策略。

答:全部策略:(上,左),(上,右),(下,左),(下,右)(2)找出该博弈的全部纯策略纳什均衡。

答:由划线法可知,该矩阵博弈全部纯策略Nash均衡为(上,左)和(下,右)两个

(3)求出该博弈的混合策略纳什均衡。

解:设甲选择“上”的概率为P1,则选择“下”的概率为1-P1

乙选择“左”的概率为P2,则选择“右”的概率为1-P2

对甲而言,最佳策略是按一定的概率选“上”和“下”,使乙选择“左”和“右”的期望值相等

即P1*3+(1-P1)*0= P1*0+(1-P1)*2

解得P1=2/5

即(2/5,3/5)按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡对乙而言,最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等

即P2*2+(1-P2)*0= P2*0+(1-P2)*4

解得P2=2/3

即(2/3,1/3)按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡

11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函

数为Q=200-P。

求:(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?

(3)用该案例解释囚徒困境。

答:(1)由已知条件 Q=200-P,P=200-Q

TC1=20q1,TC2=20q2 q1+q2=Q

可得1,2厂商的利润函数分别为:

K1=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2

K2=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2

令dK/dq1=0 得厂商1的反应函数为180-2Q1-Q2=0,

令dK/dq2=0 得厂商2的反应函数为180-Q1-2Q2=0,

联解可得q1=q2=60

K1=K2=3600

(2) 由已知条件 Q=200-P,P=200-Q

TC=TC1+TC2=20q1+20q2 =20Q 可得1,2厂商的总利润函数为: K=PQ-TC=(200-Q)Q-20Q=180Q-Q2 令dK/dQ=0 得 Q=90,q1=q2=45

K=PQ-TC=(200-Q)Q-20Q=180Q-Q2=8100 K1=K2=4050

(3) 将q1=45,q2=60 和q1=60,q2=45分别代入1,2厂商的利润函数 可得1,2厂商的利润为:

K1(q1=45,q2=60)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375 K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=4500

K2 (q1=45,q2=60)=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2=4500 K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375

根据划线法,可得厂商1.2的上策是(不合作,不合作)即(3600,3600) 双方利润均低于(合作,合作)(4050,4050

)显然它属于“囚徒困境” 13、(市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。

.

左图:温柔型

右图:残酷型

(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什

-10,25)

10,20)

20,30)

-10,0)

均衡

(1)温柔型在位者的纳什均衡为 (进入, 默认) 残酷型在位者的纳什均衡为 (不进入, (进入,斗争)) (2)已有企业为温柔型的概率至少多少时,新企业才愿意进入?

2010(1)0p p -->= 1/3p >=得到

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。

(2)囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。

(3)分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。 (4)商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

2、解释并讨论古诺的双寡头模型的纳什均衡。为什么其均衡是一种囚徒困境?

见上课笔记

或计算题第11题

3、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

(1)假设条件举例:偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。门卫可以不睡觉,或者睡觉。小偷可以采取偷、不偷两种策略。如果小偷知道门卫睡觉,他的最佳选择就是偷;如果门卫不睡觉,他最好还是不偷。对于门卫,如果他知道小偷想偷,他的最佳选择是不睡觉,如果小偷采取不偷,自己最好去睡觉。

(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):

(3)分析:通过划线法可知:这个博弈是没有纳什均衡的。门卫不睡觉,小偷不偷,双方都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。

(4)“激励(监管)悖论”说明:现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。

(5)结论:加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

博弈论试题

杭州师范大学2010-2011学年第二学期通识 课程期末考试 《博弈论与企业管理》试卷 一、单项选择题(本大题共12题,每题3分,共36分) 1. 下列关于优势策略均衡和纳什均衡的描述正确的是( ) A 优势策略均衡肯定是纳什均衡; B 纳什均衡都是优势策略均衡; C 纳什均衡是特殊的优势策略均衡; D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是( ) A 承诺使威胁可置信; B 承诺往往对自己构成约束; C 承诺往往不需要成本; D 承诺往往会给自己带来成本,但最终结果使自己有利 3. 对于以下报酬矩阵,哪个命题是正确的( ) 【 A 甲和乙都有占优策略; B 只有甲有占优策略; C 只有乙有占优策略; D 两人都没有占优策略 4. 对于如下报酬矩阵,乙的占优策略是( ) (

A 上; B 中; C 左; D 右 5. 对于题4的报酬矩阵,以下哪个是纳什均衡( ) A (上,左);B (上,右);C (下,右);D (上,中) 6. 对于题4的报酬矩阵,如果乙先走一步,并且知道甲再作决策时已经知道乙的决策,那么,乙将采取( ) A 左; B 中; C 右; D 上 7. 交易双方信息不对称,比如买房不知道卖方的一些情况,是由于( ) A 卖方故意隐瞒自己的一些情况; B 买方自身的认识能力有限; C 买方掌握完全信息的成本太高; D 以上三种情况都有可能 8. 面对不对称信息,下列哪一项不能为消费者减少信息不对称( ) A 品牌;B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号( ) ) A 产品保证; B 延长的质量保单; C 暂时的经营场所; D 被认可的品牌 10.在二手市场上,( ) A 买主知道商品的质量,而卖主不知道; B 买主不知道商品的质量,而卖主知道; C 卖主和买主都知道商品的质量是低的; D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够( ) A 使代理人参与工作的净收益不低于不工作也能得到的收益; B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平; C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突; D 以上都是 12.在信息不对称的劳动力市场,效率最低的激励机制是( ) A 固定工资;B 效率工资;C 利润分享; D 提成 二、简答题(本大题共6题,第1、2、3题每题4分,第4、5、6题每题6分,共30分) 1.一个博弈如果出现两败俱伤的结果,这样的博弈一定是非合作的零和博弈吗 … 2.两个罪犯只打算合伙犯罪一次,所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次,那么在开始的犯罪活动中如果被捕,还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下:

博弈论复习题及答案

博弈论复习题及答案 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些基本特点是什么 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈请求出其中的纳什均衡

答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险有什么办法可以解决道德风险问题 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为N H

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论习题集

PROBLEM SET I OF GAME THEORY 1. State whether the following games have unique pure strategy solutions, and if so what they are and how they can be found. (1) Player 2 Player 1 (2) Player 2 Player 1 (3) Player 2 Player 1 2. Draw the normal form game for the following game and identify both the pure-and mixed-strategy equilibria. In the mixed-strategy Nash equilibrium determine each firm ’s expected profit level if it enters the market. There are two firms that are considering entering a new market, and must make their decision without knowing what the other firm has done. Unfortunately the market is only big enough to support one of the two firms. If both firms enter the market, then they will each make a loss of £ only

博弈论基础作业及答案【最新资料】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论测试题

博弈论测试题十一 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案 如果图片不显示,用打印预览就可以了。 P127 第一题:领悟精神就可以了,而且每本书上都有这些例题,不找了。 第二题: UMD 为参与人1的战略,LMR 为参与人2的战略。前面的数字代表参与人1的得益,后面的代表参与人2的得益。 参与人2的R 战略严格优于M 战略,剔除参与人2的M 战略,参与人1的U 战略优于M 战略,剔除参与人1的M 战略,参与人1的U 战略优于D 战略,剔除参与人1的D 战略,参与人2的L 战略优于R 战略,剔除参与人2的R 战略。最后均衡为U ,L (4,3)。这样可能看不清,按照步骤一步步画出图就好多了。 第三题:恩爱型 厌恶型 用划线法解出,恩爱的都活着或者都死,厌恶的或者受罪,死了对方另一个人开心的不得了。 第四题:没有人会选择比原来少的钱,战略空间为{原来的钱,比原来多的钱}。支付为{0,原来的钱,比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。 第五题:n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题:在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 第七题:设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P 2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。 解得:P 1=P 2=a+C ,π1=π2=a 2。 第八题:不会! 到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。 第十题: 无纯战略纳什均衡,设参与人1为P 1~P 4,参与人2为Q 1~Q 4。 得到:-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3,推出:Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子,老虎,鸡,虫子中选择一个。

博弈论考题与答案

一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之间P=a—b*Q 解: 二、什么是纳什均衡,你是如何理解纳什均衡的? 答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 三、构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈) 答: 四、给出该博弈的纳什均衡,并用消除劣势战略法,找出 (R1,C3)这个纳什均衡。 C1 C2 C3 R1 2,12 1,10 1,12 R2 0,12 0,10 0,11 R3 0,12 0,10 0,13 五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡。 答:设S为棒子T为老虎C为鸡W为虫子,则其支付矩阵为: 2 S T C W S 0,0 1,-1 0,0 -1,1 1 T -1,1 0,0 1,-1 0,0 C 0,0 -1,1 0,0 1,-1 W 1,-1 0,0 -1,1 0,0 设1、2出STCW的概率分别为P1P2P3P4和Q1Q2Q3Q4,则矩阵达到均衡时,2的期望收益必须满足:0*p1—1*p2+0*p3+1*p4=1*p1+0*p2—1*p3+0*p4=0*p1+1*p2+0*p3—1*p4= —1*p1+0*p2+1*p3+0*p4 整理为—p2+p4=p1—p3= —p1+p3 由于上式为对称的,所以,p1=p2=p3=p4,又p1+p2+p3+p4=1,可得p1=p2=p3=p4=0.25. 同理q1=q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为:A1(0.25,0.25,0.25,0.25)A2(0.25,0.25,0.25,0.25) 六、5个海盗抢到了100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。首先,1号提出分配方案。然后大家5人进行表决,当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳌鱼。如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳖鱼。以次类推。假定每个个强盗都是经济学假设的“理性人”,假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化? 七、假设选民政治态度是成线性均匀分布的,说明为什么两党政治具有欺骗性,如果是三党政治情况如何,为什么? 答:政党和政治家争取选民情况实际上就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以他是站在左边的,左边是他的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,他要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法,就是使自己的竞选纲领向“右”的方向靠过去一点,就是在竞选中宣布也要照顾中产阶级的利益。移过去一点,地盘就可能大一点。同样,原来立党之本是在“右”边的保守党,在竞选的过程中,也要往左边靠,争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的漫骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。 这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性。竞选的时候,怎样有利于拉票就怎样讲,当选以后,可以忘得一干二净。在这个意义上,我们说不要以为哪个政党上台这些西方国家的态度就会改变,确实很有道理。政党政治,本来在理论上有促使政治家个人操守不可太放肆的优点。但是在西方国家,小学生都知道政治家说的话不可靠,无奈制度决定了,每次竞选,人们只能在那少数政治家之间作出他信非常有限的选择。 为什么第三个政党难成气候?这是因为,如果三个政党的位置不相同,不在同一个点上,那么他们都有向中点

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另

外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为0 ,B 的收益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。 N H

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论基础作业及答案

博弈论基础作业及答案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论试题集

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。 显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。 这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。 取石子(一) 时间限制:3000ms |内存限制:65535KB 难度:2 描述 一天,TT在寝室闲着无聊,和同寝的人玩起了取石子游戏,而由于条件有限,他/她们是用旺仔小馒头当作石子。游戏的规则是这样的。设有一堆石子,数量为N (1<=N<=1000000),两个人轮番取出其中的若干个,每次最多取M个 (1<=M<=1000000),最先把石子取完者胜利。我们知道,TT和他/她的室友都十分的聪明,那么如果是TT先取,他/她会取得游戏的胜利么? 输入 第一行是一个正整数n表示有n组测试数据 输入有不到1000组数据,每组数据一行,有两个数N和M,之间用空格分隔。

对于每组数据,输出一行。如果先取的TT可以赢得游戏,则输出“Win”,否则输出“Lose”(引号不用输出) 最优解: #include using namespace std; int main() { int k; long m,n; cin>>k; while(k--)

博弈论试题集

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。 显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余得物品,后者取胜.因此我们发现了如何取胜得法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1—k个,结果剩下(m+1)(r—1)个,以后保持这样得取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)得倍数,就能最后获胜。 这个游戏还可以有一种变相得玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜. 取石子(一) 时间限制:3000 ms | 内存限制:65535 KB 难度:2 描述 一天,TT在寝室闲着无聊,与同寝得人玩起了取石子游戏,而由于条件有限,她/她 们就是用旺仔小馒头当作石子.游戏得规则就是这样得。设有一堆石子,数量为N(1<=N<=1000000),两个人轮番取出其中得若干个,每次最多取M个(1<=M<=1000000),最先把石子取完者胜利。我们知道,TT与她/她得室友都十分得聪 明,那么如果就是TT先取,她/她会取得游戏得胜利么? 输入 第一行就是一个正整数n表示有n组测试数据 输入有不到1000组数据,每组数据一行,有两个数N与M,之间用空格分隔。 输出 对于每组数据,输出一行。如果先取得TT可以赢得游戏,则输出“Win",否则输出 “Lose”(引号不用输出) 样例输入 样例输出

最优解: #include〈iostream> using namespacestd; intmain() { int k; ?longm,n; ?cin>>k; ?while(k--) { ?cin>>n>>m; ??if(n%(m+1)==0) ??cout<<"Lose"〈〈endl; else cout〈<"Win"〈<endl; ?} } 巴什博弈变形: 有两种解,依实际情况而定: 取石子(七) 时间限制:1000 ms | 内存限制:65535 KB 难度:1

相关文档
相关文档 最新文档