文档库 最新最全的文档下载
当前位置:文档库 › 博弈论作业

博弈论作业

博弈论作业
博弈论作业

第1次作业

1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

a .写出以上博弈的战略式描述

b .求出以上博弈的所有纳什均衡(包括混合策略均衡)

2、设古诺模型中有n 家厂商。i q 为厂商i 的产量,12n Q q q q =+++L 为市场总产量。P 为市场出清价格,且已知Q a Q P P

-==)((当a Q <时,

否则0=P )。假设厂商i 生产产量i q 的总成本为i i i i cq q C C ==)(,也就是说没有固定成本且各厂的边际成本都相同,为常数)(a c c <。假设各厂同时

选择产量,该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?

3、两个厂商生产一种完全同质的商品,该商品的市场需求函数为

P Q -=100,设厂商1和厂商2都没有固定成本。若他们在相互知道对方

边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。问这两个厂商的边际成本各是多少?各自的利润是多少?

4、五户居民都可以在一个公共的池塘里放养鸭子。每只鸭子的收益v 是鸭子总数N 的函数,并取决于N 是否超过某个临界值N ;如果N N

<,收益

N N v v -==50)(;如果N N ≥时,0)(≡N v 。再假设每只鸭子的成本为2=c 元。若所有居民同时决定养鸭的数量,问该博弈的纳什均衡是什

么?

5、三对夫妻的感情状态可以分别用下面三个得益矩阵对应的静态博弈来表示。问:这三个博弈的纳什均衡分别是什么?这三对夫妻的感情状态究竟如何?

矩阵1: 妻子

丈夫 活着 死了

活着 1,1 -1,0

死了 0,-1 0,0

矩阵2: 妻子

丈夫

活着 死了

活着 0,0 1,0

死了

0,1 0,0

矩阵3: 妻子 丈夫

活着 死了 活着 -1,-1 1,0 死了

0,1

0,0

6、两个个体一起参加某项工程,每个人的努力程度[0,1](1,2)i e i ∈=,成本为()(1,2)i c e i =,该项目的产出为12(,)f e e 。个体的努力程度不影响到项目的分配方法,项目的产出在2个体之间均分。试回答以下问题: 1、如果

1212(,)3f e e e e =,2

()(1,2)i i c e e i ==,试求此博弈的的

Nash

均衡(即两个个体选择的最优努力程度)。 2、如果

1212(,)4f e e e e =,()(1,2)i i c e e i ==,试求此博弈的的

Nash

均衡。

第2次作业

1、企业甲和企业乙都是彩电制造商,都可以选择生产低档产品或高档产品,每个企业在四种不同的情况下的利润如以下得益矩阵所示。如果企业甲先于企业乙进行产品选择并投入生产,即企业乙在决定产品时已经知道企业甲的选择,而且这一点双方都清楚。

(1)用扩展型表示这一博弈。

(2)这一博弈的子博弈完美纳什均衡是什么? 企业乙

企业甲 高档 低档

高档 500,500 1000,700

低档 700,1000 600,600

2、两个寡头企业进行价格竞争博弈,企业1的利润函数是

q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1的价格,q 是企业2的价格。求:

(1)两个企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡;

(4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决策?

3、考虑如下的双寡头市场战略投资模型:企业1和企业2目前情况下的生产成本都是2=c

。企业1可以引进一项新技术使单位成本降低到1=c ,该项

技术需要投资f 。在企业1作出是否投资的决策(企业2可以观察到)后,两

个企业同时选择产量。假设市场需求函数为q q p -=14)(,其中p 是市场

价格,q 是两个企业的总产量。问上述投资额f 处于什么水平时,企业1会选

择引进新技术?

4、在市场进入模型中,市场逆需求函数为p =13-Q ,进入者和在位者生产的边际成本都为1,固定成本为0,潜在进入者的进入成本为4。博弈时序为:在位者首先决定产量水平;潜在进入者在观察到在位者的产量水平之后决定是否进入;如果不进入,则博弈结束,如果进入,则进入者选择产量水平。求解以上博弈精炼纳什均衡。

5、在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。

第三次作业

1、两个人合作开发一项产品,能否成功与两个人的工作态度有关,设成功概率如下:

B

A 努力 偷懒

努力 9/16 3/8

偷懒 3/8 1/4

再假设成功时每人有4单位的利益,失败则双方都没有利益,偷懒本身有1单位的利益。问该博弈无限次重复博弈的均衡是什么?

2、两寡头古诺产量竞争模型中厂商的利润函数为

()i i i j i q t q q π=--,1,2i =。若11t =是两个厂商的共同知识,而2t 则

是厂商2的私人信息,厂商1只知道23/4t =或24/5t =,且2t 取这两个值的概率相等。若两个厂商同时选择产量,请找出该博弈的纯策略贝叶斯均衡。

3、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本。两个厂商的固定成本都为零。厂商2的

边际成本c 是厂商2的“私人信息”,厂商1认为c 在??

?

???23,21上呈均匀分布。设

市场需求函数为214q q P --=,其中P 为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?。

4、两个企业同时决定是否进入一个市场,企业i 的进入成本),0[∞∈i θ是

私人信息,i θ是服从分布函数)(i F θ的随机变量以及分布密度

)(i f θ严格大于

零,并且1θ和2θ两者独立。如果只有一个企业进入,进入企业i 的利润函数为

m i πθ-;如果两个企业都进入,则企业i 的利润函数为i d θπ-;如果没有企

业进入,利润为零。假定m

π和d

π

是共同知识,且m

π

>d

π>0,试计算此博

弈的贝叶斯均衡。

博弈论第1次作业

1、a .写出以上博弈的战略式描述

b .求出以上博弈的所有纳什均衡(包括混合策略均衡)

①存在两个纯战略纳什均衡:分别为(企业1,企业2),收益为)2,1(W W 。(企业2,企业1),收益为)1,2(W W 。

②存在一个混合策略均衡:令学生A 选择企业1的概率为p ,选择企业2的概率为p -1;学生B 选择企业1的概率为q ,选择企业2的概率为q -1。

当学生A 以)1,(p p -的概率选择时,学生B 选择企业1的期望

学生B

企业1

企业2

学生A

企业1 )

221,121(W W )2,1(W W 企业2 )1,2(W W )121,221(W W

收益应该与选择企业2的期望收益相等,即:

22

1

).1(2.1)1(121.W p W p W p W p -+=-+ 解得:

21212W W W W p +-=

,2

11

221W W W W p +-=-

同理求出:

22

1

).1(2.1)1(121.W q W q W q W q -+=-+ 解得:

21212W W W W q +-=,2

11221W W W W q +-=-

所以,混合策略纳什均衡为:学生A 、B 均以)

2

11

22,21212(

W W W W W W W W +-+-的概率选择企业1,企业2。

2、该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?

各厂商的利润函数为:

i

n

k k i i i i i i q q c a q c Q a q c q Q a C q P u ).().(.).(.1

∑=--=--=--=-=

求解:

i n

k k q i q q q c a u i

i

).(max max 1

∑=--=

对其求导,令导数为0,解得反应函数为:

()]......[2

1

1121n i i i q q q q q c a q ++++++--=+-

纳什均衡),...,,(**2*1n q q q ,必是n 条反应函数的交点

)...([21*

*3*2*1

n q q q c a q +++--=

)...([2

1*

*3*1*2n q q q c a q +++--=

.....

)......([2

1*

*1*1*2*1*n i i i

q q q q q c a q ++++++--=+-

......

)...([2

1*

1*2*1*-+++--=n n

q q q c a q

1...**2

*

1

+-====n c

a q q q n

,且为唯一的纳什均衡。

当趋向于无穷大时博弈分析无效。

01

lim lim *

=+-=∞→∞→n c

a q n i

n ,此时为完全竞争市场,此时博弈分析无效。

3、问这两个厂商的边际成本各是多少?各自的利润是多少? 设:边际成本不变,为1c ,2c 。 计算得市场出清价格为:

)(100100)(21q q Q Q P P +-=-==

两个厂商的利润函数为:

1211111111)].(100[).(..q q q c q c P q c q P u +--=-=-= 2

212222222)].(100[).(..q q q c q c P q c q P u +--=-=-=

求解:

12111)].(100[max max 1

1

q q q c u q q +--=

22122)].(100[max max 2

2

q q q c u q q +--=

对其求导,令导数为0,解得反应函数为:

)100(21

)(21211q c q R q --==

)100(2

1

)(12122q c q R q --==

纳什均衡),(*

2*

1q q ,即(20,30)为两条反应函数的交点

)30100(21

201--=c

)20100(2

1

302--=c

得到: 301=c ,202=c 。

此时:

4001=u ,9002=u 。

4、若所有居民同时决定养鸭的数量,问该博弈的纳什均衡是什么?

设居民

i 选择的养鸭数目为i

n )5,4,3,2,1(=i ,则总数为

∑==

5

1

i i

n

N 。

假设:

N N <

居民的得益函数为:

i i i i i i i n n n c V n c n V u ).48().(..5

1

∑=-=-=-=

计算:

i i i u i u n n u i

i

).48(max max 5

1

∑=-=

得到反应函数:

)......(2

1

2451121n n n n n R n i i i i ++++-==+-

5、反应函数的交点),,,,(*5*4*3*2*1n n n n n 是博弈的纳什均衡。

将),,,,(*

5*4*3*2*1n n n n n 带入反应函数,得:

8

*

5

*4*3*2*1=====n n n n n 。 此时:

64=i u 。

此时,40=N

然后讨论下N

①若40>N ,则N N <,上述博弈成立。

②若40≤N ,则]5

[N

N =

5、问:这三个博弈的纳什均衡分别是什么?这三对夫妻的感情状态究竟如何?

矩阵1: 妻子

丈夫 活着 死了

活着 1,1 -1,0

死了 0,-1 0,0

矩阵2: 妻子

丈夫 活着 死了

活着 0,0 1,0

死了 0,1 0,0

矩阵3:

妻子 丈夫

活着 死了 活着 -1,-1 1,0 死了 0,1

0,0

用划线法得出三个矩阵的纳什均衡分别为: 矩阵1:

(活着,活着) (死了,死了)

可以看出这对夫妻间感情十分深厚。这对夫妻同生共死,一个死了,则另一个也选择死去。如果一个死了,一个活着,那么活着的将生不如死。

矩阵2:

(活着,活着) (活着,死了) (死了,活着)

可以看出这对夫妻间感情一般。这对夫妻共同活着没有收益,一个死了,对于另一个来说反而更好。

矩阵3:

(活着,死了) (死了,活着) 可以看出这对夫妻间感情很槽糕。这对夫妻共同活着对双方来说是生不如死。一个死了,对于另一个来说反而更好。

6、(1)如果1212(,)3f e e e e =,

2

()(1,2)i i c e e i ==,试求此博弈的Nash 均衡(即两个个体选择的最优努力程度)。 (2)如果1212(,)4f e e e e =,()(1,2)i i c e e i

==,试求此博

弈的Nash 均衡。 (1)收益为:

2

1211211

23)(),(21e e e e c e e f u -=-= 2

2212212

2

3)(),(21e e e e c e e f u -=-= 得出反应函数为:

221143

)(e e R e == 11224

3)(e e R e == 纳什均衡),(*

2*1e e 为两条反应函数的交点,代入得出:

0,0*2

*

1

==e e

两个人都不会努力的

(2)收益为:

1211211

2)(),(21

e e e e c e e

f u -=-= 2212212

2)(),(2

1

e e e e c e e

f u -=-= 分别求偏导:

1

2211

-=??e e u

1

212

2

-=??e e u

此时,两个人的努力程度都与对方的努力程度有关

①)2

1

,0[=i e 时,博弈一方越努力,另一方就选择努力程度为0,

此时纳什均衡为(0,0) ②21=

i e 时,双方收益均达到最大值,此时纳什均衡为)2

1

,21(

]

1,2

1

( i e 时,博弈一方越努力,另一方选择努力程度为1,

此时纳什均衡为(1,1)

第2次作业

1, (1)用扩展型表示这一博弈。

(2)这一博弈的子博弈完美纳什均衡是什么?

运用逆向法,由乙先来选择,在两个子博弈中,乙选择红色所示的路径。 再由甲选择,在(高档,低档),(低档,低档)之间选择。甲选择绿色所示路径。最终的子博弈完美纳什均衡是(高档,低档),双方的收益为(1000,700)

2、(1)两个企业同时决策的纯策略纳什均衡; 同时决策时,两个企业都为了各自利润最大化 分别对各自利润求导,并令导数为0

0)(21

=+--=??c aq p p π 0)(22

=--=??b q q

π 解得:

b q

c aq p =-= ,

ab b

-

==21ππ

此时,两个企业同时决策的纯策略纳什均衡为企业1,2的价格为),(b c aq -

(2)企业1先决策的子博弈完美纳什均衡;

企业1先决策,则企业2会在知道企业1的决策后,寻求自身利润最大化 所以:

0)(22

=--=??b q q

π b q

=

将b q

=带入b c ab p q c aq p ++--=++--

=2

21))((π 0)(21

=+--=??c ab p p

π c ab p -= 此时,

c ab b -==21ππ ,跟同时决策时的纳什均衡相同。

企业1先决策的子博弈完美纳什均衡为企业1,2的价格为),(b c ab -

(3)企业2先决策的子博弈完美纳什均衡; 企业2先决策,则企业1会在知道企业2的决策后,寻求自身利润最大化 所以:

0)(22

=--=??b q q

π c aq p -=

将c aq p -=带入c aq b q p b q -+--=+--

=2

22))((π

0)(22

=--=??b q q

π b a

q +=

2

此时,

c ab a p -+=2

2

c ab a b a -+=

+=4

,22

21ππ 企业2先决策的子博弈完美纳什均衡为企业1,2的价格为)4

,2(2

c ab a b a -++

(4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决

策?

企业在先决策时得到的利润大于后决策时的利润时,会希望先决策 企业1希望先决策:

04

2

>->-+c ab c ab a ,ab c a <≠,0

企业2希望先决策:

02

>+>b a

b ,2,0a b a -><

结论:2,0a

b a -

><,ab c <

3、(1)企业1没有引入新技术

12111)12()q q q q c p --=-=(π 22122)12()q q q q c p --=-=(π

求两个企业的利润最大化,只要对利润函数求偏导,并另偏导为0

02122111

=--=??q q q π

0212122

2

=--=??q q q π 得到: 41=q ,42=q 16,1621==ππ

(2)企业1引入新技术

f

q q q f q c p ---=-'-=12111)13()(π

22122)12()q q q q c p --=-=(π

求两个企业的利润最大化,只要对利润函数求偏导,并另偏导为0

02132111

=--=??q q q π

0212122

2

=--=??q q q π

得到:3141=

q ,3112=q 此时,3

17

=p

引入新技术使得企业1的利润不少于没有引入新技术前的利润,所以 16)(111=≥-'-='ππf q c p

得到

9

52

≤f 时,企业1会选择引进新技术。

4、(1)企业1的产量1q ,企业2以产量2q 进入市场

2113q q p --=

1211)12(q q q --=π

4)12(2212---=q q q π

企业2后进入市场,则企业2会在知道企业1的决产量后,寻求自身利润最大化

所以:

0212212

2

=--=??q q q π 12

2

1

6q q -= 将12

2

1

6q q -=带入1211)12(q q q --=π,得

0)2

1

612(11111=+--=??q q q q π 此时, 61=q ,32=q 5,1821==ππ

(2)企业1的产量1q ,企业2以产量2q 进入市场时利润为0,觉得不进入市场

2113q q p --=

1211)12(q q q --=π

4)12(2212---=q q q π

企业2后进入市场,则企业2会在知道企业1的决产量后,寻求自身利润最大化

所以:

0212212

2

=--=??q q q π 12

21

6q q -= 将12

2

1

6q q -=带入04)12(2212=---=q q q π,得 (舍去)或1681=q

321=π ,此时,企业2不进入市场。

5、三个企业的利润函数为:

)3,2,1(,)()(321=----=-=i q c q q q a q c p i i i π

企业2和企业3观察到企业1的产量后同时选择产量

23212)(q c q q q a ----=π

33213)(q c q q q a ----=π

企业2和3均为了各自利润最大化选择产量,求解出各个的反应函数:

023212

2

=----=??c q q q a q π 023213

3

=----=??c q q q a q π ()()3

11312c

q a q q q q --==,将反应函数带入企业1的利润函数,得

1113211)(3

1)(q c q a q c q q q a --=----=π

对其求偏导,求解出企业1利润最大时的产量

0)2(3

1

111=--=??c q a q π 得到:21c a q -=

, 6

32c

a q q -==, 此时:6

5)662(

c

a c a c a c a a p +=-+-+--=

第三次作业

1、两个人的得益矩阵如下:

B

A 努力 偷懒

努力

)49,49( )2

5,23(

偷懒

)2

3,25( )2,2( 一次博弈纳什均衡为(偷懒,偷懒),无法实现帕累托最优(努力,努力)。无限次博弈时,对于A ,第一阶段选择努力,

(1)若前t-1时刻选择均为努力,t 时刻也选择努力

)1(49)...1(49lim 2δδδδπ-=

++++=∞→t t A

(2)t 时刻选择偷懒,则前面的行为均为偷懒

δ

δδδδπ-+=++++='

∞→425)...(2lim 252t

t A

达到(努力,努力)这个均衡,使'

>A A ππ,即2

1

>

δ,采取触发策略。、 均衡为(努力,努力),合作产生。 2、假设:厂商2在23/4t =时,产量为'2q ,利润为'

2

π;

厂商2在2

4/5t =

时,产量为"2

q ,利润为"2π 对于厂商2来说,分别具有50%的概率得到以下的利润

)4

3

(2122'--'='q q q π ①

)5

4(2122

"

--"="

q q q π ②

对于厂商1来说,利润为

)1(2

1)1(212112111"

--+'--=

q q q q q q E π ③ 求解上面三个式子的一阶导数,并令其为零,得到

024

321='

--q q 025

421="

--q q 02

12121221="

-'-

-q q q 得到:240

47

,24041,24098221="='=

q q q 该博弈的纯战略贝叶斯均衡为,厂商1的产量为240

98

1=

q ,厂商2在23/4t =时,

产量为240

412='q ;在2

4/5t =时,产量为240

47

2=

"q 。 3、考虑到c 在???

???23,21上呈均匀分布,1..)()(,1)(23

2

1===?dc c c f c E c f

对于厂商1,121111)3(q q q c pq --=-=π

对于厂商2,221222))(4(q c E q q c pq ---=-=π

2212)3(q q q --=π

对于厂商1,2的利润函数求一阶导数,并令其为零 得到121

==q q

该博弈的纯战略贝叶斯均衡为,厂商1,2的产量均为1

4、假设:此博弈的贝叶斯均衡为企业1,2的成本为),(*

2*

1θθ

企业1,2的收益矩阵如下图:

2

1

进入 不进入 进入

),(21θπθπ--d d )0,(1θπ-m

不进入 ),0(2θπ-m

)0,0( 对于企业1来说

当*

11θθ<,企业1选择进入;当*

11θθ>,企业1选择进入 企业1进入的概率为

)()(110

11

θθθθF d f =?

不进入的概率为)(11θF - 企业2进入的期望收益为

))).((1()).((21212θπθθπθ--+-=m d F F u

不进入的期望收益为02=u 企业1进入的条件为21u u >

所以m m d F πππθθ+-=)).((1*

2

因为该博弈是对称的 所以m m d F πππθθ+-=)).((2*

1

此博弈的贝叶斯均衡为企业1,2的以概率))(),((21θθF F 进入

均衡的成本为

m

m d F πππθθ+-=)).((1*2,

m m d F πππθθ

+-=)).((2*

1())(),((21θθF F 中为*2*1,θθ

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论作业汇总

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

博弈论作业

博弈论作业

博弈论作业 一、 下面的得益矩阵表示博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 博弈方 2 L C R 博 弈 T 方 M 1 B 答:此博弈有两个纳什均衡:1、ML 得益(3,4) 2、TR 得益(4,2) 二、 求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡与得益。 博弈方 2 L R 博弈 T 方 B 1 答:(一)求混合策略均衡 1、博弈方1的概率P 则对博弈方2而言,有 1×P +2(1-P )=2×P +0(1-P ) 2-P =2P P =2/3 当P ﹤2/3,2-P ﹥2P ,则q ﹡=1是最合适的策略,即选择L 。 当P =2/3,2-P =2P ,则q ﹡∈(0,1)是最适合反应。 当P ﹥2/3,2-P ﹤2P ,则q ﹡=0是最适合策略,即选择R 。 2、给定博弈方2的概率q 则对博弈方1而言,有 2×q +0(1-q )=1×q +3(1-q ) 2q =3-2q q =3/4 当q ﹤3/4,2q ﹤3-2q ,则P ﹡=0是最合适的策略,即选择B 。 当q =3/4,2q =3-2q ,则P ﹡∈(0,1)是最适合反应。

当q﹥3/4,2q﹥3-2q,则P﹡=1是最适合策略,即选择T。 所以: 混合策略的均衡点为(2/3,3/4)。 (二)得益: ∪1=2×P×q+0×P×(1-q)+1×(1-P)×q +3(1-P)(1-q) =2×2/3×3/4+1×1/3×3/4+3×1/3×1/4 =3/2 ∪2=1×P×q+2×P×(1-q)+2×(1-P)×q +0(1-P)(1-q) =1×2/3×3/4+2×2/3×1/4+2×1/3×3/4 =4/3 三、设一四阶段两博弈方之间的动态博弈如下图所示。试找出全部子博弈, 求子博弈完美纳什均衡策略组合和博弈的结果。 答:依据逆推归纳法得出:此博弈均衡为b,得益(5,3); 路径为b, d, e, h。 四、两次重复下面的得益矩阵表示的静态博弈。设计一个处罚策略。 博弈方 2 L R S 博 弈 T 方 M 1 B

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论论文-共谋与防共谋案例

农村土地流转市场中三大主体博弈关系分析 摘要:以农村土地流转市场中相关利主体之间的博弈关系, 构建两人或多人博弈模型,基于博弈关系进行理论分析,分析农村土地流转市场中的社会行为,为改进农村土地流转提出对应的建议,完善农村土地流转市场。 关键词:农村土地流转、博弈、共谋与防共谋 一、农村土地流转 伴随我国工业化、信息化、城镇化和农业现代化进程,农村劳动力大量转移,农业物质技术装备水平不断提高,农户承包土地的经营权流转明显加快,发展适度规模经营已成为必然趋势。中共中央办公厅、国务院办公厅2014年11月印发《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》,《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》。 实践证明,土地流转和适度规模经营是发展现代农业的必由之路,有利于优化土地资源配置和提高劳动生产率,有利于保障粮食安全和主要农产品供给,有利于促进农业技术推广应用和农业增效、农民增收,应从我国人多地少、农村情况千差万别的实际出发,积极稳妥地推进。为引导农村土地(指承包耕地)经营权有序流转、发展农业适度规模经营,现提出如下意见。当前农村土地流转的主要类型为土地互换、出租、入股、合作等方式。流转土地要坚持农户自愿的原则,并经过乡级土地管理部门备案,签订流转合同。 二、集体土地流转市场中的利益主体 城乡统筹一体化进程中,在集体土地流转市场制度创新的完整过程中起着重要作用的利益主体有:乡镇政府、农村集体经济组织、农地转出方和农地转人方。 集体土地流转市场能否顺利进行是由国家(乡镇政府作为国家的代理人)、集体经济组织(包括村、组)、农地转出方与农地转入方四方相关利益主体进行博弈的结果,博弈过程是主观意愿根据其了解的情况逐步认识,最终做出结果作为理性的“经济人”,他们根据各自的利益目标,会作出不同的判断和选择,相应的得到各自的报酬。当某一方做出某项决策时,事先会受到他人决策的影响,同时反过来也会影响其他几方的行为。集体土地流转市场制度变迁在很大程度上是相关利益主体共同博弈的结果,利益主体之间的博弈结果,提出了对制度变迁的需求,需求导致了新制度的产生。根据集体土地流转市场相关利益主体之间表现出的博弈关系,进行博弈分析,有助于全面了解利益主体的策略选择,解释现行集体土地流转市场制度存在的不足,为相关管理部门和利益主体进行制度创新供决策参考。

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论作业

课程名称:信息经济学与博弈论课程编号:SX0071F23 课程类型:非学位课考核方式:考查 学科专业:管理科学与工程年级:2014 级姓名:学号:10076140185 河北工程大学2014 ~ 2015学年第2学期研究生课程论文报告 基于GA一RL的进化博弈求解主从博弈结构的供应链协调问题摘要:供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构,理论求解主从博弈问题就变得困难。因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分别设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径。 关键词:供应链协调;进化博弈论;强化学习(RL);遗传算法(GA) Coordinating supply chain of Stackelberg game model based on evolutionary game with GA一RL Abstract: Problems of coordinating supply chain are based on Stackelberg game model, but if research object is complex supply chain, it is difficult to find equilibrium of Stackelberg game ,so evolutionary Game theory was introduced. According to characteristics of leaders and followers in Stackelberg game model, learning Meehan is designed for each Player respectively. An algorithm of reinforcement learning combined with genetic searching is proposed for leaders, and a learning model of best一reply is designed for followers(retailers). Keywords: supply chain coordination; evolutionary game theory; reinforcement learning(RL);genetic algorithm(GA) 1引言 供应链协调问题是研究如何订立协调机制使分散控制的供应链中个体与整体之间的目标一致,解决供应链中企业个体自身的优化目标与供应链整体的最优解相冲突的状况。目前关于不同协调机制研究可以分为以下几类,一类是根据数量给予价格折扣,如根据经销商的销售量给予目标折扣(Sale re-bate)的问题[1],根据订货量给予线性折扣(Quantity discount)的问题[2];第二类是根据

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

生活中的博弈论例子

生活中的博弈论有那些例子 那讲工作上的事假如你做的策划被上司偷了那你是要向更高级的领导告状还是忍受这也算一个博弈论问题你要是告状,也许能够伸冤,但也会若到上司他可能会给你下绊子但不上诉他也许会再偷,你的工作就白废了 还有物价方面假如几个店铺联合起来自然能够把东西卖的比较贵但只要其中一个降价其他店的客人就会全跑到那家去那另外几家也会被迫降价店铺联合本来是最好的赚钱方法但店铺间一般是敌对关系为防备有人订低价,引走客人所有的店铺都会尽可能低价其实我们学校门口的网吧刚上演了一出这个好戏真是有感触啊!!!!! 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 1.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略怎样才是“合理” 应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运

博弈论第2次作业

第2次作业 1.在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。 给定企业1的产量q1,企业2和企业3的最优化问题分别为 ()23210max 2q c q q q a q ----≥, ()33210 max 3q c q q q a q ----≥从而得到企业2和企业3的最优反应函数为q 2=231q q c a ---,q 3=2 21q q c a ---,联立得纳什均衡为:q N 2=31q c a --,q N 3=3 1q c a --.给定企业2和企业3的最优反应,企业1的最优化问题为:()13210max 1q c q q q a N N q ----≥,由此得企业1的最优产量为 2 c a -,q 2=q 3=6 c a - 2、两个寡头企业进行价格竞争博弈,企业1的利润函数是q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1的价格,q 是企业2的价格。 求: (1)两个企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡; (4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决策? (1):(a b-c ,b ) (2):(a b-c ,b )

(3):(a 2/2+ab-c ,a/2+b ) (4):a<0,b>-a/2,c

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

经济博弈论第1次作业

博弈论第1次作业 1、两个人分4只乒乓球,每个人同时独立地提出自己想得到的球数。设参与人1想得到s 1只,参与人2想得到s 2只球,分配的规则是:如果s 1 + s 2 ≤4,那么每个参与人均能得到自己想要的数量;如果s 1 + s 2 >4,那么两个参与人什么也得不到。 (1)写出参与人1,2的战略空间S 1,S 2; (2)画出该博弈的双变量收益矩阵; (3)用划线法找出该博弈的全部纯战略纳什均衡。 2、精神病医生A 、B 同时在一条很长的公路边选择各自的诊所位置,这条公路用从0到1的区间表示。公路0到1/4这个区间属于俄勒冈州,从1/4到1这个区间属于加利福尼亚州。医生A (参与人1)同时拥有俄勒冈州和加利福尼亚州的行医执照,而医生B (参与人2)只有俄勒冈州的行医执照。假设病人沿这条公路是均匀分布的,每个病人都就近看病,每个医生的收益就是到他诊所就诊的病人比例。设医生A (参与人1)的战略空间(选择诊所的位置)为{}10,1/8,1/4,3/8,1/2,5/8,3/4,7/8,1 S =;医生B (参与人2)的战略空间为{}20,1/8,1/4S =。 (1) 试画出博弈的双变量收益矩阵; (2) 利用划线法找出该博弈的纯战略纳什均衡。 3、在下图所示的战略式表述的博弈中,有没有占优战略均衡?有没有重复剔除严格劣战略的占优均衡?有没有纳什均衡?如果有,请写出相应的均衡。 参与人2 参与人1 L M R U M D 4、下图是两人博弈的战略式表述形式,其中参与人1的战略空间S 1={U,D},参与人2的战略空间S 2={L,R}。

参与人2 L M 参与人1 U D 这里a ,b ,c ,d ,e ,f ,g ,h 为参数。 (1) 设S*=(U,L )是此博弈的严格占优战略均衡,问:上述参数之间应满 足哪些条件? (2) 设S*=(U,R )是此博弈的重复剔除严格劣战略的占优均衡,问:上述 参数之间应满足哪些条件?(用两种剔除顺序讨论) (3) 设S*=(D ,R )是此博弈的纳什均衡,问:上述参数之间应满足哪些 条件? (4) 设S 1*=(U ,L )和S 2*=(D ,R )是此博弈的纳什均衡,问:上述参数 之间应满足哪些条件?这时两个参与人有无严格劣战略? 5、求下图所示战略式表述的博弈的混合战略纳什均衡。 参与人2 L R 参与人1 U D 6 B A L R U D 7、A 、B A 企业可以获得18万元利润,B 企业可以获得10万元利润;若A 企业做广告,B 企业不做广告,A 企业可以获得30万元利润,B 企业可以获得4万元利润;若A 企业不做广告,B 企业做广告,A 企业可以获得13万元利润,B 企业可以获得16万元利润;若A 、B 两企业都不做广告,A 企业可以获得35万元利润,B 企业可以获得8万元利润。 试求:(1)画出A 、B 企业的支付矩阵。(2)求出该博弈的纯策略纳什均衡。 8、两个厂商生产一种完全同质的商品,该商品的市场需求函数为P Q -=100,设厂商1和厂商2都没有固定成本。若他们在相互知道对方边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。问这两个厂商的边际成本各是多少?各自的利润是多少?

相关文档
相关文档 最新文档