文档库 最新最全的文档下载
当前位置:文档库 › 博弈复习题及参考答案

博弈复习题及参考答案

博弈复习题及参考答案
博弈复习题及参考答案

第一章复习题

2, 4, 5, 6, 7

第一章参考答案

2、设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。

4、“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整个、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。

现实中“囚徒的困境”类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争,初中、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。

5、首先可根据博弈方的行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类。

其次可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是进化博弈。

第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。

第四是根据博弈问题的信息结构,根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。

第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。

第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。

9、(a)根据问题的假设,该博弈的得益矩阵和扩展形表示分别如下:

赚(35%)亏(65%)

不开

3000

100100

(300) (100)(0) (100)

(b)如果我是风险中性的,那么根据开的期望收益与不开收益的比较:

0.35X 300+0.65X 0=105> 100

肯定会选择开。

(c)如果成功的概率降低到0.3,那么因为这时候开的期望收益与不开的收益比较: 0.30X

300+0.70X 0=90v 100

因此会选择不开,策略肯定会变化。

(d)如果我是风险规避的,开的期望收益为:

0.9X( 0.35X 300+0.65X 0) =0.9X 105=94.5v 100

因此也会选择不开。

(e)如果我是风险偏好的,那么因为开的期望收益为:

1.2X( 0.35X 300+0.65X 0) =1.2X 105=126> 100

因此这时候肯定会选择开。

10、首先需要注意的是,在该博弈方的得益单位不同,逃犯得到的是增加或者减少的刑期(年),而看守得到的则是奖金(元),因此除非先利用效用概念折算成相同的单位,否则两博弈方的得益相互之间不能比较和加减。

直接采用单位不同的得益,该博弈的得益矩阵如下:

该博弈的扩展形表示如下:

根据上述得益矩阵和扩展形不难清楚,该博弈中两博弈方的利益是对立的。虽然由于两博弈方得益的单位不同,相互之间得益无法相加,因此无法判断是否为零和博弈,但两博弈方关系的性质与猜硬币等博弈相同,也是对立的。因此,该博弈同样没有两博弈方都愿意接受的具有稳定性的策略组合,两博弈方最合理的策略都是以相同的概率随机的选择路线。

补充习题:

1. 判断下列叙述是否正确,并作简单分析。

a) 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒

都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

逃路线一犯

路线二

-10,100010,0

10,0-10,1000

看守

(40, 40)

(50,50)

b )合作博弈就是博弈方采取互相合作态度的博弈。

参考答案:

a ) 错误。结论恰恰相反,也就是囚徒的困境博弈中两囚徒之所以处于困境,根源正 是因为两

囚徒很在乎坐牢的绝对时间长短。 此外,我们已开始就假设两囚徒都是 理性经济人,而理性经济人都是以自身的(绝对)利益,而不是相对利益为决策 目标。

b ) 不正确。合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力协议限 制行为选

择的博弈问题,与博弈方的态度是否合作无关。

2. 博弈与游戏有什么关系?

参考答案:

现代博弈论和经济学中的博弈通常指人们在经济、政治、军事等活动中的策略选择, 特别是在有各种交互作用、策略互动条件下的策略选择和决策较量。游戏则是指日常生 活中的下棋打牌、赌胜博彩,以及田径、球类等各种体育比赛。因此博弈和游戏之间当 然是有明显区别的。但博弈和游戏之间其实也有重要的联系,因为博弈与许多游戏之间 在本质特征方面有相同的特征:(1)都有一定的规则;(2)都有能用正或负的数值表示, 或能按照一定的规则折算成数值的结果;(3)策略至关重要;(4)策略和利益又相互依 存性。正是因为存在这些共同的本质特征,因此从研究游戏规律得出的结论可用来指导 经济政治等活动中的决策问题,或者把这些决策问题当作游戏问题研究。因此博弈在一 定程度上可以理解成就是游戏。 其实“博弈”的英文名称“Game ”的基本意义就是游戏。

3. 一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择

是否克扣工资。假设工人不偷懒有相当于 50元的负效用,老板想克扣工资则总有借 口扣掉

60元工资,工人不偷懒老板有150元产出,而工人偷懒是老板只有80元产出, 但老板在支付

工资之前无法知道实际产出,这些情况使双方都知道的。请问

a ) 如果老板完全能够看出工人是否偷懒, 博弈属于哪种类型?用得益矩阵或扩展形 表示该

博弈并作简单分析。

b ) 如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示 并简单分

析。

参考答案:

a )由于老板在决定是否克扣工资欠可以完全清楚工人是否偷懒,

因此这是一个动态

博弈,而且是一个完全信息的动态博弈。此外,由于双方都有关于得益的充分信 息,因此只是一个完全且完美信息的动态博弈。该博弈用扩展形表示如下:

根据上述得益情况可以看出,在该博弈中偷懒对工人总是有利的,克扣对老板也总是

(100,-20) (-10,

110)

有利的,因此在双方都只考虑自己的利益最大化的情况下,该博弈的通常结果应该是工 人偷懒和老板克扣

b )由于老板在决定是否克扣工资欠无法清楚工人是否偷懒,

因此该博弈可以看作静

态博弈。由于双方仍然都有关于得益的充分信息,因此是一个完全信息的静态博

弈。该博弈用得益矩阵表示如下:

其实,根据该得益矩阵不难得到与上述动态博弈相同的结论, 仍然是工人会选择偷懒 和老板会选择克扣。这个博弈实际上与囚徒的困境是相似的

第二章复习题

4,5,7,9,11,12

第二章参考答案

4、多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性不是指各

个博弈方有一致的预测,而是指每个博弈方自己的策略选择与自己的预测一致。

对博弈分析主要的不利影响是,当博弈存在多重纳什均衡,而且相互之间没有明确 的优劣之分时,会造成预测分析的困难,影响以纳什均衡为核心的博弈分析的预测能力 存在帕累托上策均衡、风险上策均衡、聚点均衡或相关均衡的可能性,并且博弈方相互 之间有足够的默契和理解时,多重纳什均衡造成的不利影响会较小

博弈方2

C R

首先,运用严格下策反复消去法的思想,不难发现在博弈方 1的策略中,

B 是相对

于T 的严格下策,因此可以把该策略从博弈方 1的策略空间中消去。把博弈方1的B 策 略消去后又可以发现,博弈方 2的策略中C 是相对于R 的严格下策,从而也可以消去 在下面的得益矩阵中相应策略和得益处划水平线和垂直线表示消去了这些策略

两个博弈方各消去一个策略后的博

弈是如下的两人2X 2博弈,已经不存在任

何严格下策。再运用划线或箭头法,很容易发现这个2X 2博弈有两个纯策略纳什均衡(M ,

L )和(T ,R )

工人

偷懒

不偷懒 5、 博 弈 方

1

老板

克扣

不克扣

博弈方2

由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,双方利益有不一致性,因此如果没有其他进一步的信息或者决策机制,一次性静态博弈的结果不能肯定。由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组

合中的任何一个。

7、我们用反应函数法来分析这个博弈。先讨论博弈方1的选择。根据问题的假设,

如果博弈方2选择金额S2 (0

S 当S i< 10000 七u(s i)=

0 当S1< 10000 -9

因此博弈方1采用S1=1000—S2时,能实现自己的最大利益u(s1)= S1=1000—S2。因此S1=1000—S2就是博弈方1的反应函数。

博弈方2与博弈方1的利益函数和策略选择是完全相似的,因此对博弈方1所选择的任意金额S1,博弈方2的最优反应策略,也就是反应函数是S2=1000- S1。

显然,上述博弈方1的反应函数与博弈方2的反应函数是完全重合的,因此本博弈有无穷多个纳什均衡,所有满足该反应函数,也就是S1+ 8=10000的数组(S1 ,S2)都

是本博弈的纯策略纳什均衡。

如果我是两个博弈方中的一个,那么我会要求得到5000元。理由是在该博弈的无穷多个纯策略纳什均衡中,(5000,5000)既是比较公平和容易被双方接受的,也是容易被双方同时想到的一个,因此是一个聚点均衡。

9、( 1)第i个厂商的利润函数为:

n i=pq i-C i q i=(a-q i-q j)q i-Gq i

将利润函数对产量求导并令其为0得:

-=a_q j_c i_2q i=0

q i

解得两个厂商的反应函数为:

q j= (a- q j-ci) /2

或具体写成:

q1=(a-q2-c1)/2

q2=(a-q1-C2)/2

(2)当0v c i v a/2时,我们根据上述两个厂商的反应函数,直接求出两个厂商的纳什均衡产量分别为:

a 2c C2 q1=

3

a c i 2C2

q2=—

3

(3)当c i v C2a+ CI时,根据反应函数求出来的厂商2产量q2V0。这意味着厂商2不会生产,这时厂商1成了垄断厂商,厂商1的了优产量选择是利润最大化的垄断产量

a—C

q i=q* =

2

因此这种情况下的纳什均衡为[(a- c i)/2, 0]。

11、(1)两个候选人竞争时,纯策略纳什均衡为(0.5, 0.5),即两个假选人都宣布自己是中间立场。我们用直接分析法加以证明:首先,如果一个候选人的立场是0.5而另一个候选人的立场不是0.5,那么不难证明有者将获胜而后者必然失败,因为根据投票原则前者得票比例将大于0.5,那么双方都有一半机会获胜。因此对任意一个候选人来说,都是不管对方选择的立场是否为0.5, 0.5都是自己的正确选择,也就是说0.5都是上策。因此(0.5, 0.5)是本博弈的一个上策均衡,当然也是纳什均衡。事实上,即使两个假选人开始时没有立即找到最佳立场0.5,他也会通过边竞争边学习很快调整到该纳什均衡策略。因为当两个候选人的立场都不在0.5时,谁更靠近0.5谁选票就多,观察到这一点,两个候选人必然都会向0.5靠拢,直到最后都取0.5的立场。

当两个候选人都选择0.5时,各自都能得到一半选民的支持,谁能够取胜往往取决于双方竞选立场以外的东西,例如候选人的个人魅力和演说才能等。

(2)三个候选人时问题比较复杂。因为当三个候选人的立场都处于中点附近位置时,立场夹在其他两个候选人之间的候选人只能获得很少的选票,从而他(或她)有转变成比“左”倾者更“左”倾,或比右倾者更右倾立场的动机。这时候三个候选人在中点附近处于一种不稳定的平衡。(0.5±S, 0.5±£, 0.5±E ),其中S,&和E是小正数。如果考虑到现实中竞选者的立场不可能由一维数学坐标精确描述,选民对候选立场差别的分辨能力也不可能很精细,那么当候选人的立场堵接近中点时,选民很难识别究竟哪个候选人偏右倾或“左”倾一些,因此三个候选人的立场都接近中点时可理解为是相同的。这样,三个候选人与两个候选人竞选的纳什均衡策略可以看成是相同的,即都选择(0.5, 0.5, 0.5)。

三个候选人时在数学上还可能求出其他纯策略纳什均衡。如策略组合(0.4, 0.6, 0.8)就是其中一个。因为当三个候选人分别选择这些立场时,每项悠悠民选人没有改变自己立场的动机,因为该策略组合的结果是他取胜,而第二和第三个候选人则单独改变自己的立场并不能改善自己的命运,无论只是稍微改变自己的立场,还是与其他候选人的相对立场发生逆转,都没有限胜的机会。因此根据纳什均衡的定义,这是一个纯策略的纳什均衡。类似的熏略组合还有许多。不过,虽然在数学上这些纳什均衡完全符合纳什均衡的定义,但是它们在现实选举问题中的意义却并不大,因为这种纳什均衡本身只是弱均衡(部分博弈方改变策略不损害自己的利益),而且部分博弈方(第二、第三个候选人)属于典型的“破坏者”,他们的策略改变不影响自己的利益,但却会对其他博弈方的利益产生决定性的影响,因此这些纳什均衡其实是不稳定的,不会是现实中的均衡结果。

上述博弈模型不仅在政治选举问题中有意义,在分析经济经营活动中的选址和产品定位等问题方面也非常有用。读者可以自行找一些例子进行分析。

12、在纳什均衡分析的基础上,再进一步考虑运用其他均衡概念或分析方法,如风

险上策均衡等进行分析。

首先,很容易根据划线法等找出本博弈的两个纯策略纳什均衡( U ,R )和(D ,L )。

本博奕还有一个混合策略纳什均衡,即两博弈方各自以 2/3、1/3的概率在自己的两个策

略U 、D 和L 、R 中随机选择。

但本博弈的两个纯策略纳什均衡中没有帕累托上策均衡,两个博弈方各偏好其中一 个,而且另一个策略组合(U ,L )从整体利益角度优于这两个纯策略纳什均衡,因此博 弈方很难在两个纯策略纳什均衡的选择上达成共识。混合策略纳什均衡的效率也不是很 高,因为有一定概率会出现(D ,R )的结果。

根据风险上策均衡的思想进行分析,当两个博弈方各自的两种策略都有一半可能性 被选到时,本博弈的两个纯略纳什均衡都不是风险上策均衡,而策略组合( U ,L )却是 风险上策均衡。因为此时博弈方1选择U 的期望得益是4,选择D 的期望是益是3.5,博 奕方2选择L 的期望得益是4,选择R 的期望得益是3.5。因此当两个博弈方考虑到上述 风险因素时,他们的选择将是(U ,

L ),结果反而比较理想。

如果博弈问题的基本背景支持,对本博弈还可以用相关均衡的思想进行分析。读者 可自己作一些讨论。 补充习题:

1. 判断下列表述是否正确,并作简单分析:

a ) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

b ) 如果以博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。

c ) 上策均衡一定是帕累托最优的均衡吗?并说明哪一个均衡更稳定些。 参考答案: a ) 错误。只要任一博弈方单独改变策略不会增加得益,策略组合就是纳什均衡了。

单独改变策略只能得到更小得益的策略组合是严格纳什均衡, 是比纳什均衡更强

的均衡概念。

b ) 正确。这是纳什均衡的基本性质之一一一奇数性所保证的。

c ) 不正确。囚徒的困境博弈中的(坦白,坦白)就是上策均衡(同时也是纳什均衡), 但该

均衡显然不是帕累托最优的,否则就不会称其为囚徒的困境了。

2. 下面的得益矩阵表示一个两人静态博弈。问当 a 、b 、c 、d 、e 、f 、g 和h 满足什么条 件时,

该博弈:

a ) 存在严格上策均衡;

b ) 可以用严格下策反复消去法简化或找出博弈的均衡;

c )存在纯策略纳什均衡

参考答案:

a )严格上策均衡是由各个博弈方的严格上策组成的策略组合。对于博弈方

1,如果a>e

且c>g ,则U 是相对于D 的严格上策;如果a

博弈方1

博弈方2

相关文档