文档库 最新最全的文档下载
当前位置:文档库 › 博弈论习题

博弈论习题

博弈论习题
博弈论习题

《博弈论》习题

一、选择题

1. 博弈论中,局中人从一个博弈中得到的结果常被称为():

A. 效用;

B. 损益;

C. 决策;

D. 利润

2. 下列关于策略的叙述哪个是错误的():

A. 策略是局中人选择的一套行动计划;

B. 参与博弈的每一个局中人都有若干个策略;

C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;

D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

3. 囚徒困境说明():

A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果;

B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡;

C. 双方都依照自己的利益行事,结果一方赢,一方输;

D、每个局中人在做决策时,不需考虑对手的反应

4. 一个博弈中,直接决定局中人损益的因素是():

A. 策略组合;

B. 策略;

C. 信息;

D. 行动。

5、策略式博弈,正确的说法是():

A. 策略式博弈无法刻划动态博弈;

B. 策略式博弈无法表明行动顺序;

C. 策略式博弈更容易求解;

D. 策略式博弈就是一个支付矩阵。

6. 下列有关策略和纳什均衡的叙述正确的有():

A. 纯策略是博弈方采取“要么做,要么不做”的策略形式;

B. 混合策略是博弈方根据一组选定的概率,在两种或两种以上可能的行为

中随机选择的策略;

C. 有些博弈不存在纯策略纳什均衡,但存在混合策略的纳什均衡;

D. 有些博弈既存在纯策略纳什均衡,也存在混合策略的纳什均衡。

7、古诺模型体现了寡头企业的( )决策模型。

A 成本

B 价格

C 产量

D 质量

8、伯特兰德模型体现了寡头企业的什么决策模型。

A 成本

B 价格

C 产量

D 质量

9、用囚徒困境来说明两个寡头企业的情况,说明了:()

A、每个企业在做决策时,不需考虑竞争对手的反应

B、一个企业制定的价格对其它企业没有影响

C、企业为了避免最差的结果,将不能得到更好的结果

D、一个企业制定的产量对其它企业的产量没有影响

10、子博弈精炼纳什均衡():

A. 不是一个一般意义上的纳什均衡;

B. 和纳什均衡没有什么关系;

C. 要求某一策略组合在每一个子博弈上都构成一个纳什均衡;

D. 要求某一策略组合在原博弈上都构成一个纳什均衡。

11. 下列关于重复博弈的叙述哪些是正确的():

A. 重复博弈又称为序贯博弈;

B. 影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性;

C. 如果博弈重复无限次,则局中人采取的针锋相对策略意味着任何一方参

与人的一次性不合作将触发永远的不合作;

D. 在有限次重复博弈中,若阶段博弈纳什均衡的唯一性存在,则每个阶段

出现的都是一次性博弈的均衡结果。

12. 在动态博弈战略行动中():

A. 首先作出选择并采取相应行动的局中人往往可以获得更多的收益;

B. 斯塔克博格模型与古诺模型对垄断厂商行为的分析方法及结论相同;

C. 一般而言,只有当局中人从实施某一威胁所能获得的总收益大于不实施

该威胁所获得的总收益时,该威胁才是可信的;

D. 承诺是当事人使自己的威胁策略变得可信的行动,但它也是有风险的。

13、市场交易中普遍存在的讨价还价属于哪种博弈。()

A 完全信息静态博弈

B 完全信息动态博弈

C 不完全信息静态博弈 D不完全信息动态博弈

14、下面哪种模型是一种动态的寡头市场博弈模型()

A 古诺模型

B 伯川德模型

C 斯塔克尔伯格模型 D田忌齐威王赛马

15、在一般产品销售市场上,以下哪种原因导致了逆向选择。 ( )

A 产品质量的不确定性

B 私人信息

C 公共信息

D 产品价格

16、完全信息动态博弈参与者的行动是( )

A 无序的

B 有先后顺序的

C 不确定的

D 因环境改变的

17、动态博弈参与者在关于博弈过程的信息方面是( )

A 不对称的

B 对称的

C 不确定的

D 无序的

二、判断正误并说明理由

1. 纳什均衡一定是上策均衡。

1.F 上策均衡是比纳什均衡更严格的均衡概论

2. 上策均衡一定是纳什均衡。

2.T 上策均衡是比纳什均衡更严格的均衡概论

3.在一个博弈中博弈方可以有很多个。

3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

4. 在一个博弈中只可能存在一个纳什均衡。

4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战

5. 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与

损失之和恒为零,所以双方不存在合作可能性

6. 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳

什均衡

7. 在博弈中纳什均衡是博弈双方能获得的最好结果。

7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

8. 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

9. 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而

减低自己的收益

10. 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚

徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

11. 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

12. 斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时

13. 无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复

正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。

13. .T无限次重复博弈没有结束重复的确定时间;而在有限次重复博弈中,存在最后一次

重复,并且正是有结束重复的确定时间,使重复博弈无法实现更高效率均衡。

14.无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益的

贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。

14. .T无限次重复博弈必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须

以得益的现值为根据。

15. 子博弈精炼纳什均衡不是一个纳什均衡。

15. F 子博弈精炼纳什均衡一定是一个纳什均衡。

16. 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博

弈的混合战略纳什均衡。

16. T 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原

博弈的混合战略纳什均衡。

17. 零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混

合战略纳什均衡。

17.F 同第16题。零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会

一直重复原博弈的混合战略纳什均衡。

18.原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。

18.T 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,因此不管

是重复有限次还是无限次,不会和一次性博弈有区别。

19.不存在纯战略纳什均衡和存在惟一的纯策略纳什均衡,作为原博弈构成的有限次重复博

弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

19.T 有限次重复博弈,特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博

弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

20.在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利

的。

20.F 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是

有利的。

21.由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。

21.F 只要两囚犯只打算合作有限次,其最优策略均为招供。比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。依此类推,对于有限次内的任何一次,两小偷均不可能合作。

22.如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈

完美结局:在每一阶段取G的Nash均衡策略。

22.T 如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博

弈完美结局:在每一阶段取G的Nash均衡策略。

三、计算与分析题

1、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可

以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B 企业不做广告,

A 企业可获得25万元利润,

B 企业可获得2万元利润;若A 企业不做广告,B 企业做广告,A 企业可获得10万元利润,B 企业可获得12万元利润;若A 、B 两企业都不做广告,A 企业可获得30万元利润,B 企业可获得6万元利润。 (1)画出A 、B 两企业的损益矩阵。(2)求纯策略纳什均衡。 答:(1)画出A 、B 两企业的损益矩阵。

(2)求纯策略纳什均衡。 (做广告,做广告)

2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益); 利润的大小取决于双方的策略组合(收益函数); 博弈有四种策略组合,其结局是: (1)双方都不涨价,各得利润10单位;

(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; (4)双方都涨价,可口可乐利润140,百事可乐利润35; 画出两企业的损益矩阵求纳什均衡。 答:(1)画出A 、

B 两企业的损益矩阵

(2)求纳什均衡。

两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:

乙 左 右 上 下

(1)如果(上,左)是上策均衡,那么,a>?, b>?, g?

答:a>e, b>d, f>h, g

(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足?

答:a>e, b>d

4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合

作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

答:

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

答:若新华选择“竞争”,则北方也会选择“竞争”(60000>0);若新华选择“合作”,北方仍会选择“竞争”(900000>500000)。

若北方选择“竞争”,新华也将选择“竞争”(60000>0);若北方选择“合作”,新华仍会选择“竞争”(900000>0)。

由于“竞争”为双方的占优策略,故均衡结果为两家公司都选择竞争性策略。

5、博弈的收益矩阵如下表:

(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?(尽量把所有必要的关系式都写出来)

答:从占优策略均衡的定义出发:

对甲而言,策略“上”(a,c)优于策略“下”(e,g);

对乙而言,策略“左”(b,f)优于策略“右”(d,h)。

所以结论是:a>e, b>d, f>h, c>g

(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?

答:纳什均衡只需满足:a>e, b>d

(3)如果(上,左)是上策均衡,那么它是否必定是纳什均衡?为什么?

答:占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。

(4)在什么情况下,纯策略纳什均衡不存在?

答:当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。

6、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:

(1)有哪些结果是纳什均衡?

答:(低价,低价),(高价,高价)

(2)两厂商合作的结果是什么?

答:无法确定

7、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的

按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):

求纳什均衡。

答:纳什均衡为:大猪“按”,小猪“等”,即(按,等)

8、用反应函数法结合图解法,求出下列博弈的所有纯策略纳什均衡。

参与人1

参与人2

甲 乙 丙 丁

答:(1)参与人1的反应函数: R1(2)=B,若2选择甲

=B,若2选择乙 =A,若2

选择丙 =C 或D,若2选择丁 参与人2的反应函数: R2(1)=丙,若2选择A

=甲,若2选择B =丙,若2选择C =丙,若2选择D

(2)求共集,得纯策略纳什均衡为(B ,甲)与(A ,丙) 9、求出下面博弈的纳什均衡(含纯策略和混合策略)。

乙 L R U D

解:(1)纯策略Nash 均衡:由划线法可知,该矩阵博弈没有纯策略Nash 均衡。

(2)混合策略Nash均衡

设甲选择“U”的概率为P1,则选择“D”的概率为1-P1

乙选择“L”的概率为P2,则选择“R”的概率为1-P2

对甲而言,最佳策略是按一定的概率选“U”和“D”,使乙选择“L”和“R”的期望值相等

即P1*0+(1-P1)*6= P1*8+(1-P1)*5

解得P1=1/9

即(1/9,8/9)按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均衡

对乙而言,最佳策略是按一定的概率选“L”和“R”,使乙选择“U”和“D”的期望值相等

即P2*5+(1-P2)*0= P2*2+(1-P2)*4

解得P2=4/7

即(4/7,3/7)按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡

10、根据两人博弈的损益矩阵回答问题:

左右上

(1)写出两人各自的全部策略。

答:全部策略:(上,左),(上,右),(下,左),(下,右)

(2)找出该博弈的全部纯策略纳什均衡。

答:由划线法可知,该矩阵博弈全部纯策略Nash均衡为

(上,左)和(下,右)两个

(3)求出该博弈的混合策略纳什均衡。

解:设甲选择“上”的概率为P1,则选择“下”的概率为1-P1

乙选择“左”的概率为P2,则选择“右”的概率为1-P2

对甲而言,最佳策略是按一定的概率选“上”和“下”,使乙选择“左”和“右”的期望值相等

即P1*3+(1-P1)*0= P1*0+(1-P1)*2

解得P1=2/5

即(2/5,3/5)按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡

对乙而言,最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等

即P2*2+(1-P2)*0= P2*0+(1-P2)*4

解得P2=2/3

即(2/3,1/3)按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡

11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函数为Q=200-P。求:(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?

(3)用该案例解释囚徒困境。

答:(1)由已知条件 Q=200-P,P=200-Q

TC1=20q1,TC2=20q2 q1+q2=Q

可得1,2厂商的利润函数分别为:

K1=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2

K2=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2

令dK/dq1=0 得厂商1的反应函数为180-2Q1-Q2=0,

令dK/dq2=0 得厂商2的反应函数为180-Q1-2Q2=0,

联解可得q1=q2=60

K1=K2=3600

(2) 由已知条件 Q=200-P,P=200-Q

TC=TC1+TC2=20q1+20q2 =20Q

可得1,2厂商的总利润函数为:

K=PQ-TC=(200-Q)Q-20Q=180Q-Q2

令dK/dQ=0 得 Q=90,q1=q2=45

K=PQ-TC=(200-Q)Q-20Q=180Q-Q2=8100

K1=K2=4050

(3) 将q1=45,q2=60 和q1=60,q2=45分别代入1,2厂商的利润函数

可得1,2厂商的利润为:

K1(q1=45,q2=60)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375 K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=4500

K2 (q1=45,q2=60)=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2=4500 K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375

根据划线法,可得厂商1.2的上策是(不合作,不合作)即(3600,3600) 双方利润均低于(合作,合作)(4050,4050)显然它属于“囚徒困境”

12、假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为

Q

P 2400-=,其中,21Q Q Q +=。

(1)求古诺(Cournot )均衡情况下各自的反应函数和利润函数,以及均衡产量、价格和利润,并作图表示均衡点。

(2)假设垄断企业1为领导者,求斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润。

(3)比较古诺均衡和斯塔克博格均衡的结果,并简要说明导致上述两种均衡结果差异的原因

解:

(1)对于垄断企业1:

2

19020)](2400max[2

11

121Q Q Q Q Q Q -=

-+-可得其反应函数为

由目标函数

利润函数为:21211122380Q Q Q Q --=π 对垄断企业2:

4

502)](2400max[122

2

221Q Q Q Q Q Q -

=-+-可得其反应函数为

由目标函数

利润函数为:22212242400Q Q Q Q --=π

在达到均衡时,有:

??

?==?

?? ?

?

--=

30

80

2

4501902111Q Q Q Q 可得

均衡时的价格为:180)3080(2400=+?-=P 两垄断企业的利润分别为:

12800802308028038021=?-??-?=π 3600304308023040022=?-??-?=π

均衡点可图示为:

(2)假设垄断企业1为领导者,企业2视企业1的产量为既定,其反应函数为:

4/5012Q Q -=

则企业1的目标函数为:

??

?==?-?????

???? ??

-+-3

/803

/280204502400max 211

111Q Q Q Q Q Q 均衡时价格为:

1603803280

2400=??? ??+-=P 利润为:3/392001=π,9/256002=π

(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,无需考虑企业2的反应,而企业2只能被动地接受企业1

的既定产量,计划自己的产出,这是一种“先发优势”

13、(市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。

.

左图:温柔型 右图:残酷型

(1) 找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡 答:温柔型在位者的纳什均衡为 (进入, 默认)

残酷型在位者的纳什均衡为 (不进入, (进入,斗争)) (2) 已有企业为温柔型的概率至少多少时,新企业才愿意进入? 答:2010(1)0p p -->= 1/3p >=得到

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。

(2)囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。

-10,25)

10,20)

20,30)

-10,0)

(3)分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。

(4)商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

2、解释并讨论古诺的双寡头模型的纳什均衡。为什么其均衡是一种囚徒困境?

见上课笔记

或计算题第11题

3、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

(1)假设条件举例:偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。门卫可以不睡觉,或者睡觉。小偷可以采取偷、不偷两种策略。如果小偷知道门卫睡觉,他的最佳选择就是偷;如果门卫不睡觉,他最好还是不偷。对于门卫,如果他知道小偷想偷,他的最佳选择是不睡觉,如果小偷采取不偷,自己最好去睡觉。

(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):

(3)分析:通过划线法可知:这个博弈是没有纳什均衡的。门卫不睡觉,小偷不偷,双方

都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。

(4)“激励(监管)悖论”说明:现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。

(5)结论:加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

基于博弈论的夫妻冲突分析

一个女人能有多美,通常是由与她相伴的男人来决定;一个男人能走多远,往往是由与他相随的女人来决定。夫妻之间的物质生活水平,通常是由收入较高的一方来决定;夫妇之间的精神生活水平,往往是由素质较低的一方来决定。 囚徒困境 在囚徒困境这个例子中,两个囚犯的上策都是坦白,因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态,当对局者选择的都是上策的时候,这种均衡叫做上策均衡。在博弈论中,所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有对局者都不想再改变他们所选择的策略。二.情侣冷战对峙 现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中,见下图: H表示主动的一方感觉自己付出更多从而受到伤害,生出不平衡感;E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后,有时也可能两人都想主动了,但谁也不先迈出这一步,在不知道对方策略和想法的情况下,一权衡一算计就总害怕自己亏了,又或者碍于情面拉不下面子,不肯服个软。于是乎,秋水望穿了,花瓣也掰完了,最后是怎样呢?在这个矩阵中我们需要考虑的是,或者说我们的假设前提是,双方都是完全理性的,是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局,但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道,所谓的爱情是没有理性可言的,它是一种激情,一旦斤斤计较反复权衡利弊得失,那就不叫爱。所以非常有意思的是,这个矩阵中出现的上策均衡(O,O——OVER),即双方都不主动从而导致感情破裂爱情失败的结局,正说明了爱情只要一权衡一算计,俩人都矜持和自私的话,那么最终铁定玩完。 三、夫妻关系的博弈分析 感情,爱情,亲情夫妻关系尴尬的了现实的活动中,夫妻关系既有和谐、融洽的一面,也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时,就有一对夫妻分道扬镳。 无论是丈夫还是妻子,双方都有自己的利益追求和价值取向,而家庭生活成为他们博弈的载体和工具。

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例一一“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢 “挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方 案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就_ 大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5 号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何? 通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析 摘要 随着市场经济的发展,人们对事物认知态度的变化,经济学的应用范围进一步扩大,人们的行事原则越来越趋向于经济学上的“理性”。就现状而言,经济学的分析不仅局限于某些领域,只要存在人类的社会活动,就存在经济,就存在资源合理配置问题,也就有经济分析的必要。谈恋爱是校园中的一个普遍现象,本文从经济学的视野中透视,爱情中的微观经济学问题,包括从预算线角度分析择偶以及爱情中的博弈关系,并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。 关键词:微观经济学;爱情;预算线;博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.()博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√) 在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. (×)上策均衡就是帕累托最优得均衡。(×) 因为零与博弈中博弈方之间关系都就是竞争性得、对立得,因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。(×) 在博弈中存在着先动优势与后动优势,所以后行动得人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.(√)不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈,共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略与纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)得子博弈完美均衡结局,其中对于任意得t<T,在t阶段得结局并不就是G得Nash均衡.(√)(或:如果阶段博弈G={A1,A2,…,An; u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)得子博弈完美均衡结局,对于任意得t<T,在t阶段得结局一定就是G得Nash均衡。) 零与博弈得无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈得混合战略纳什均衡.(√)(或:零与博弈得无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈得混合战略纳什均衡.(×)) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果,符合所有局中人得利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论的读书笔记

博弈论的读书笔记 【篇一:博弈论读书笔记】 博弈论读书笔 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行 为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗 争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优 化策略。 博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈 的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数 学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑 没有学过高等数学,但是这并不影响他通过运行策略来帮助田忌赢 得赛马。 博弈时时存在,它就在你的身边。本书就是试图通过日常生活中常 见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来 指导生活决策的方法。 在李凌、王翔的《论博弈论中的策略思维》中,作者从博弈论的起 源谈起,回顾了博弈论在诺贝尔经济学奖上所取得的成就,把博弈 论中的经典案例同生活中的实际例子联系起来进行分析,从合作、 模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是 如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后,围 绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击, 及其使博弈论的发展上升到了一个新的阶段和深度。

! 以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析: 一、囚徒困境—合作还是不合作 在这个模型中,合作还是不合作问题得到了很好的解释,纳什均衡解就是都选择坦白,也就是跟对方囚徒不合作,但这个解对两个囚徒来说并不是帕累托最优解,囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品,如果让使用资源者自愿承担费用,则会由于搭便车现象的出现,而无法实现共同提供公共物品的目标,所以需要政府通过纳税的方式来提供,以实现帕累托最优,达到资源的有效配置。囚徒困境有限次重复博弈中,当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规 定行事的激励,这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中,如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响,并非是完全理性的,所以在合作方面还存在着一定的风险,这就需要订立合作契约,将这种风险最小化,从现实经济利益的角度提高失信成本,使失约威胁实现真正的可置信。 二、智猪博弈—创新还是模仿 在智猪博弈中,在理性人的假设下,大猪和小猪的支付矩阵决定了大猪选择按,小猪选择等待。类似的,在股票市场中,大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高,而相应得到的收益也比较高,而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权,

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪 些基本表示方法?各种表示法 的基本要素是什么?(见教材) 2. 分别用规范式和扩展式表 示下面的博弈。 两个相互竞争的企业考虑同 时推出一种相似的产品。如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。 3. 什么是特征函数? (见教材) 4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子? 原因:个体理性与集体理性的矛盾。 例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? (见教材) 2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。 先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。 3. 求出下面博弈的纳什均衡。 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。 解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线,如下图,图中粗的折线,就是F(x)的图象

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

基于博弈论的夫妻冲突分析

基于博弈论的夫妻冲突分析 摘要:夫妻关系是社会生活中最重要的一种社会关系,小家庭的和谐稳定是构成大社会和谐稳定的基础。夫妻两人在家庭活动中往往会因为多种因素发生意见不合,进而产生冲突并伴随着心理博弈。夫妻博弈可分为夫妻关系和谐的合作博弈与夫妻冲突的非合作博弈,从这个意义上讲,夫妻冲突的本质是非合作博弈的结果与表现。构建和谐的夫妻关系,有效消解夫妻冲突,关键在于重建均衡的夫妻博弈模型,增进夫妻之间的情感沟通,达成夫妻之间的价值共识,促进家庭的和谐稳定。 关键词:夫妻博弈夫妻关系夫妻冲突家庭关系 博弈论也叫对策论,其含义可以表述为:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果或收益的过程。[1]一个完整的博弈包括博弈的参加者、博弈信息、行为或策略、博弈的次序和博弈各方的收益五项内容。博弈的定义隐含了这样一个基本假设:在冲突或竞争的情况下,每一个参加者具有充分的理性,都力图谋自身利益最大化或损失最小化。博弈的根源在于利益驱动,博弈主体都是依据自己的偏好和掌握的信息与规则来追求确定的外部目标。然而,博弈参与人不是孤立地作出决策,一方的决定会受对方影响以及影响对方。换言之,一方的选择有可能加惠于也有可能加害于另一方。有鉴于此,博弈分析的目的是使用博弈规则测均衡[2],即通过对各参与人行动与决策结果的分析来预测他们的最优策略组合也称为均衡状态。在这种状态下,所有参与人均得到最好的结果,所以,任何一方都不会主动偏离均衡状态,即使偏离了也会想方设法回到均衡的轨道上来。就此而言,博弈论是深刻理解人们各种互动行为的基础,它已经成为人们分析与解决事物矛盾、冲突与合作等因素的一种有效工具。 [1] 张振华.博弈论视野中的素质教育[J].辽宁大学学报(哲学社会科学版),2007,(9). [2] 张维迎. 博弈论与信息经济学[M].上海:上海人民出版社,2004:46.

(完整word版)博弈论练习题

1、纳什均衡一定是上策均衡,但并非每一个上策均衡都是纳什均衡。(×) 2、如果重复博弈的次数较少,但两家厂商都具有完全理性,则相互合作仍能实现。(×) 1、贝叶斯纳什均衡属于哪种博弈中的均衡状态?(C ) A、完全信息静态博弈; B、完全信息动态博弈; C、不完全信息静态博弈; D、不完全信息动态博弈。 2、下列正确的表述是(A )。 A、任何市场竞争都可由市场博弈来概括 B、剔除不可置信的威胁后的纳什均衡属于精炼贝叶斯纳什均衡 C、股票投资者之间的博弈属于零和博弈 D、“摸着石子过河”属于完全信息动态博弈 3、下述错误的表述是(C )。 A、现实中,信息不对称比信息对称更为普遍 B、道德风险源于代理人的理性行为 C、父子合开的小企业中不存在委托——代理问题 D、委托人与代理人的利益几乎不可能完全一致 4、右图为某一博弈的得益矩阵,据此可知:(D. ) A.甲与乙均没有上策 B.甲与乙均有上策 C.甲有上策而乙没有上策 D.甲没有上策而乙有上策 5、对于右下图表示的博弈,其上策均衡或纳什均衡 A.左上角 B.右上角 C.左下角 D.右下角 6、乒乓球团体赛中双方出场阵营的选择和确定属于(A. )。 A.静态博弈 B.动态博弈 C.零和博弈 D.合作博弈 7、就足球比赛中的比分而言,比赛属于( B )。 A.零和博弈 B.变和博弈 C.常和博弈 D.静态博弈 8、就排球比赛中的输赢结果而言,比赛属(A. )。 A.零和博弈 B.变和博弈 C. 常和博弈 D.静态博弈 假设有10 名劳动者,其中10 - x名是低能力的,另外x名是高能力的。这10 名劳动者是企业的潜在员工。现在,企业因业务扩展需要招聘1 名高能力劳动者。又假设这10 名劳动者都渴望到这家企业去工作。假设企业对高能力者愿意支付2元的工资,对低能力者支付1元的工资;高能力劳动者保留工资是1元,低能力者保留工资是0.5元。请回答如下一些问 题: 1)假设信息是完全的(即劳动者的能力写在脸上,人人皆知),企业具有完全的谈判能力(即只支付员工保留工资水平的工资),则招聘结果将如何? 由于信息是完全的,企业将大大降低招聘的风险,并以高能力劳动者可以接受的保留工资1

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

相关文档