文档库 最新最全的文档下载
当前位置:文档库 › 不完全信息下联盟组合形成动态博弈分析_张翼

不完全信息下联盟组合形成动态博弈分析_张翼

不完全信息下联盟组合形成动态博弈分析_张翼
不完全信息下联盟组合形成动态博弈分析_张翼

第31卷 第7期2012年 7月 技 术 经 济Technology 

Economics Vol.31,No.7

Jul.,2012不完全信息下联盟组合形成动态博弈分析

张 翼1,陈 耀2,夏茂森1

(1.南京理工大学经济管理学院,南京210094;2.扬州大学,江苏扬州225001

)摘 要:在回顾和梳理联盟及联盟组合形成理论的基础上,从成本-收益决策的视角构建了两阶段的动态博弈模型,

探讨了在不完全信息下联盟组合形成的动态机制和稳定均衡条件,旨在为企业组建联盟组合提供决策分析框架,进一步推进以焦点企业为研究对象的联盟组合研究。关键词:焦点企业;联盟组合;动态博弈

中图分类号:F270 文献标识码:A 文章编号:1002-980X(2012)07-0124-05

收稿日期:2012-05-03

基金项目:江苏省社会科学基金项目“联盟禀赋、治理结构的战略匹配与联盟绩效研究”(09GLD015

)作者简介:张 翼(1975—)

,女,江苏南京人,南京理工大学经济管理学院博士研究生,研究方向:战略管理;陈耀(1962—),女,江苏扬州人,扬州大学副校长、教授,博士生导师,研究方向:战略管理;夏茂森(1980—)

,安徽巢湖人,南京理工大学经济管理学院博士研究生,研究方向:制度经济学。

近年来,

越来越多的企业同时在跨产业领域和跨地理区域组建战略联盟,最初意义的双边联盟已经不再能满足企业战略目标的需要,将联盟作为单个事项或交易来研究也无法认识多边联盟作为一个

整体的协同作用[

1]

。一些研究者借鉴金融研究领域的“投资组合”概念中“组合”一词,试图突显立足焦点企业(focal actor)研究其联盟战略的价值和视角的准确性。联盟理论研究的重点从单个联盟问题转向联盟组合问题。对焦点企业来说,

联盟组合意味着更大的联盟规模、更多的联盟结构以及更复杂的联盟关系或伙伴关系,其多样性和异质性使得对联盟组合形成或组建问题的探讨更具复杂性。本文将焦点企业与两类潜在的合作伙伴—

——生产型企业和研发型企业作为研究对象,基于成本-收益决策的视角,采用博弈的方法,探讨在不完全信息下联盟组合形成的动态机制和其稳定均衡条件,以期为企业组建联盟组合提供决策分析框架,并进一步推进以焦点企业为研究视角的联盟组合研究。

1 文献综述

1.1 联盟组合的内涵

由于分析视角不同,因此理论界对联盟组合的定义至今仍无定论。有学者基于社会网络理论,将

联盟组合定义为以自我为中心的联盟网络[2-

3],该定

义只包括焦点企业与联盟伙伴之间的直接联系,剔除了各种非直接联系。在基于组织学习理论的研究中,联盟组合被定义成焦点公司过去和现在的联盟

经验的累积[

4-

6]。最广泛使用的定义是从追加角度而界定的,即联盟组合是焦点企业所有联盟的集合

体[

7-

10]。已有的联盟组合定义多是以焦点企业为研究对象,但主要存在两个方面的分歧:(1)在应包含或剔除的联盟关系类型上存在分歧。除包括焦点企业与结盟伙伴的直接关系外,联盟组合定义是否还应包括对焦点企业有影响的伙伴间的非直接关系。(2

)在时点选择上存在分歧。除包括焦点企业当前时点的联盟外,联盟组合是否还应包括已终止但对焦点企业的结盟行为和绩效均有影响的过去时点的联盟。

1.2 联盟与联盟组合的形成

联盟形成一直是战略管理学术界的重要议题,也是联盟问题研究的焦点。理论界已有诸多研究对联盟动机进行了探讨,

认为联盟的形成主要基于三大理论———交易成本理论、资源基础理论和社会关系理论。这些理论分别从交易成本降低、总成本最

小化[11-

12]、资源依赖型与互补性[13]以及有限理性和信息不对称下社会关系资本的意义与作用[14]

的角

度来解释联盟或联盟组合的成因。尽管这三大理论赋予了企业充分的联盟动机,但是拥有了联盟动机就一定会引发联盟形成吗?研究证明,有些企业虽然认同联盟带来的优势并具备联盟动机,

但最终却没有能形成联盟或联盟组合[15]

,所以仅仅基于联盟

动机的观点来解释联盟形成在理论上缺乏说服力。为了弥补解释与探讨联盟形成上的不足之处,有学者从成本-收益决策的视角出发,尝试立足从组织

21

认知、评估到决策执行的动态分析与采纳过程对联盟形成现象提出另一种解释[16]。成本-收益决策的视角侧重于从组织决策过程的角度来探讨联盟的形成,认为联盟或联盟组合的形成实际上是组织对联盟或联盟组合收益与成本综合评估和比较的结果[17]。只有当组织对联盟或联盟组合的预期收益大于感知成本时,组织才会形成正向意愿,进而形成联盟或联盟组合,即联盟决策或联盟组合决策被组织采纳。成本-收益观点可以被视作组织形成联盟或联盟组合的理性成因,有助于了解联盟或联盟组合形成的程序过程,完善联盟问题研究的分析框架。

除了上述已有理论研究贡献,联盟或联盟组合形成问题的研究在以下3个方面存在不足之处:(1)基于成本-收益决策视角的分析并未探讨联盟或联盟组合形成的成本与收益的具体内容即内涵,大部分研究者仅仅把交易成本理论、资源基础理论和社会关系理论阐述的联盟动机放入成本-收益理论的评估采纳模型中,模型的构建略显不足。(2)探讨联盟或联盟组合的形成必须基于焦点企业与潜在伙伴的联盟意愿以及双方或多方并存的真实性。联盟或联盟组合形成与否,除了受组织的单方面动机、意愿的影响外,还应该考量潜在联盟伙伴的联盟决策,即联盟的合作机会是否存在。研究的立足点不能只偏向组织单方面而忽视对“一个巴掌拍不响”的合作机会以及潜在伙伴的分析。(3)已有的联盟组合形成研究更多侧重于探讨和解释联盟组合于对焦点企业的意义以及合作的积极动机,如规模经济、范围经济,而对基于焦点企业的联盟组合形成的决策制定和机制探讨略显不足[18]。

2 模型构建

针对已有研究在联盟组合形成机制探讨方面的不足,本文将延伸成本-收益理论在联盟组合形成决策中的应用,构建博弈模型,分析在信息不完全条件下焦点企业及其联盟潜在伙伴组建联盟组合的机制。

2.1 参与人

假定在联盟组合的博弈中有两方参与人,分别是焦点企业和有可能构建联盟组合的潜在合作伙伴,分别用F和P表示。虚拟参与人“自然”用N表示。在本文中,为了分析方便,根据与焦点企业的潜在合作关系将潜在合作伙伴分为两类———生产型企业和研发型企业。假定博弈过程中不存在欺骗。2.2 行动选择

在联盟组合的博弈过程中,每个参与方都只有两种行动选择,用AF={aF}={组合,不组合}表示焦点企业的行动集,也就是说,焦点企业面对潜在的合作伙伴时可以选择组合或不组合企业联盟;用AP={aP}={参与,不参与}表示潜在合作伙伴的行动集,也就是说,面对焦点企业发出的联盟组合信息,无论是潜在的生产型合作伙伴还是潜在的研发型合作伙伴,都可以选择参加或不参加。

2.3 博弈支付

本文用UF表示焦点企业的支付,用UP表示潜在合作伙伴的支付,在联盟组合形成的博弈过程中,各个参与方的支付如下:

(1)焦点企业。

UF(不组合)=R

UF(生产企业,组合)=R+r合作收益-PC

UF(研发企业,组合)=R+g合作收益-TC

R>0,PC>0,TC>0,

 g合作收益>0,r合作收益>

烆0

(2)潜在的合作伙伴。

UP(生产企业,参与)=K+g′合作收益-PC′

UP(生产企业,不参与)=K

UP(研发企业,参与)=G+g′合作收益-TC′

UP(研发企业,不参与)=G

K>0,PC′>0,TC′>0,

 g′合作收益>0,r′合作收僧>0,G>

烆0

对于焦点企业来说:R表示焦点企业选择与生产型企业不组合时的收益;PC表示焦点企业与生产型企业进行组合所支付的成本;TC表示焦点企业与研发型企业进行组合所支付的成本;r合作收益和g合作收益分别表示焦点企业与生产型企业和研发型企业进行组合后的组合收益。

若潜在的合作伙伴为生产型企业,它选择不参加与焦点企业的联盟组合时的收益为K,选择参加与焦点企业的联盟组合时的收益为r′合作收益-PC′。其中,r′表示组合后的生产型企业的合作收益,PC′表示选择联盟组合所需支付的合作成本。

若潜在的合作伙伴为研发型企业,它选择不参加与焦点企业的联盟组合时的收益为G,选择参加与焦点企业的联盟组合时的收益为G+g′合作收僧-TC′。其中,g′合作收益表示组合后的研发型企业的合作收益,TC′表示选择联盟组合所需支付的合作成本。

2.4 不完全信息下动态博弈树的构建

由于焦点企业与潜在的合作企业对自己的信息不是完全公开的,因此焦点企业无法完全获取潜在合作企业是否选择参与组合的信息,潜在的合作企业的显示性信息也可能被隐瞒。同样,潜在的合作企业也不能完全撑握焦点企业是否确定选择其成为

张 翼等:不完全信息下联盟组合形成动态博弈分析

联盟组合成员的显示性信息。因此,焦点企业与潜在的合作伙伴在这个动态博弈中都具有不完全信息。图1所示的博弈树展示了这个不完全信息博弈。假设焦点企业与两类企业(

可能包括n个企业)打交道,其中P*表示面临生产型企业的机率,1-P*则表示面临研发型企业的机率,P′表示焦点企业选择联盟组合的概率

图1 不完全信息下焦点企业联盟组合

动态博弈分析树

3 不完全信息下焦点企业联盟组合的动态博弈分析

通过海萨尼转换,

可将焦点企业对表达参与组合意向的两类企业的一个主观判断转化为判断两类

企业参与联盟组合的各自概率。P(g|s)表示生产型企业在选择表达参与焦点企业联盟组合的前提下真实参与联盟组合的条件概率;P(g|k)表示研发型企业在选择表达参与联盟组合的前提下真实参与组合的条件概率。这两个条件概率就是焦点企业需要进行判断的内容。

首先,在做出合理判断之前,不管两类企业是否表达了参与焦点企业联盟组合的意向,焦点企业都要了解潜在合作企业的真实参与意向。用P(s)表示生产型企业参与组合的概率,用P(k)表示研发型企业的概率,显然这两个概率只能根据经验或一

般情况得出。其次,焦点企业还应知道两类企业选择参与时把自己介绍为愿意参与焦点企业联盟组合的概率和不参与时把自己介绍为愿意参与焦点企业联盟组合的概率,可分别用P(s|g)和P(k|g)表示。

根据贝叶斯法则,有

P(s|g)=P(s)×P(g|s)P(g)

P(s)×P(g|s)Ps×Pg|s+Pk×Pg|

k。

(1

)其中,P(k|g)=1-P(s|g)。由前述分析可知,生产型和研发型企业参与联

盟组合的意愿各不相同。在生产型企业真正愿意合作的情况下,其对联盟组合参与的显性表示为其真实意愿,即P(g|

s)=1;同样,对于研发型企业来说也是如此,P(g|

k)=1,即式(1)就变为P(s|g)=

P(s)×P(g|

s)Ps×Pg|s+Pk×Pg|

k=P(s)P(s)+P(

k)=P(s)。(2

)同理,P(k|g)=P(k)

。焦点企业知道潜在的两类联盟企业参与联盟组合的意愿各不相同,且信息不完全使得它无法识别潜在的合作企业是否最终会选择参与联盟组合。正因为这样,焦点企业只能根据经验和一般情况对P(s|g)和P(

k|g)做出判断,并在此基础上选择使自己期望收益最大化、

不存在风险或风险最小的策略。假设焦点企业根据经验和一般情况判断P(s|g)=P(

s)=P*,那么焦点企业在自己的决策信息集选择组合的期望收益为:

E(A)=P*(R+r合作收益-PC)+(1-P*)

(R+g′合作收益-TC)=P*(r合作收益-PC-g′合作收益+TC)+R+g

′合作收益-TC。(3)从博弈分析树还可以看出,焦点企业选择不组合的期望收益为:

E(NA)=R。(4)当E(A)>E(NA)=R,即P*>(-g′合作收益+T

C)/(r合作收益-g′合作收益+TC-PC)时,焦点企业选择组合时的收益大于不组合时的期望收益,

焦点企业会选择联盟组合;反之,当E(A)<E(NA)时,焦点企业选择组合时的收益小于不组合时的收益,焦点企业则不会选择联盟组合。

焦点企业选择与某一类企业组合的条件是:对于生产型企业来说,只要焦点企业与生产型企业的合作收益均大于其所投入的成本,即r合作收益≥PC,

则焦点企业选择与生产型企业联盟组合;同样的,对于研发型企业来说,当g合作收益≥TC时,焦点企业选择与研发型企业进行联盟组合。

对于潜在联盟企业来说,在第一阶段,如果它选择不参与组合,

则焦点企业与潜在联盟企业均无损失、无收益;在第二阶段,即潜在联盟企业选择参与焦点企业的联盟组合,但潜在联盟企业由于信息不完全而无法获悉焦点企业是否选择进行组合以及以何种方式组合,

因此潜在联盟企业只能根据经验对焦点企业是否进行组合选择做出主观判断,并在此基础上选择使自己期望收益最大化的策略。假设潜在联盟企业—

——生产型企业和研发型企业根据经验6

21技术经济 第31卷 第7期

和一般情况判断焦点企业选择组合的概率分别为P′和P″,那么潜在联盟企业会根据自己的决策信息集进行决策。此时生产型企业的期望收益为:E(S)=P′(K+r′合作收益-PC′)+(1-P′)(K-PC′)=P′r′合作收益+K-PC′。(5)当E(S)大于不参与联盟组合的收益K,即P′>PC′/r′合作收益时,生产型企业选择参与联盟组合。

研发型企业的期望收益为:

E(K)=P''(G+g′合作收益-TC′)+(1-P″)(G-TC′)=P″g′合作收益+G-TC′。(6)当E(K)大于不参与联盟组合的收益G,即P″>TC′/g′合作收益时,研发型企业选择参与联盟组合。

最后,当P′和P″与焦点企业选择组合的最小概率相等时,即焦点企业选择组合与生产型企业、研发型企业选择参与的边界条件,构成联盟组合形成且处于稳定均衡的最严格约束,即P′均衡=PC′/r′合作收益=(-g′合作收益+TC)/(r合作收益-g′合作收益+TC-PC)=P″均衡=TC′/g′合作收益。

通过分析焦点企业与生产型和研发型两类合作企业之间的博弈,本文基于成本-收益的视角考察了博弈参与人之间的博弈过程和可能形成的均衡条件、状态,突破了传统的、从定性角度讨论联盟组合(如配置战略[19]等)问题的研究思路,将成本-收益理论进一步延伸至联盟组合的形成过程和结果状态研究中。此外,本文基于不完全信息博弈模型,分析了不完全信息下联盟组合的形成机理以及联盟组合潜在伙伴即不同博弈方在不完全信息下博弈行为的选择,突破了联盟群决策研究中大部分学者在完全信息条件下运用博弈论对联盟形成相关问题进行探讨的做法[20-21],在潜在伙伴参与联盟概率一样的假设前提下分析联盟形成机理。由于潜在合作伙伴与焦点企业的信息获取和公开程度皆有不同,联盟组合形成的博弈过程往往处于不完全信息情形下,因此,在不完全信息条件下探讨联盟组合形成机理更符合实际情况,得出的结论对联盟实践指导意义更强。另外,本文通过建立两阶段动态博弈模型考察了焦点企业、生产型企业和研发型企业之间的策略互动,进一步尝试拓展了Matthew等的单阶段静态博弈研究[22-23],有助于推进联盟组合的博弈理论分析。

4 结论

企业联盟组合是企业基于策略目标的考虑所结成的合作关系,企业通过联盟组合实现资源交换和绩效收益提升,并通过彼此的互动博弈达成各自的阶段性目标,进而实现企业的长效发展。

本文利用动态博弈的分析方法,对焦点企业与两类潜在合作伙伴的联盟组合形成机制进行了两阶段的动态博弈分析,并探讨了其可能的稳定均衡条件。研究表明,由于信息不完全,因此焦点企业是否选择与某类潜在合作企业进行联盟组合取决于该潜在合作伙伴可能获得的合作收益与焦点企业选择组合成本的差距,以及合作双方所获收益与各自成本差异的双向作用;潜在的合作伙伴———生产型企业和研发型企业愿意参与联盟组合并达至均衡的条件,取决于博弈双方的合作收益与各自所投入成本的差距。

整个联盟组合形成的稳定均衡条件,不仅取决于潜在合作伙伴愿意参与的边际成本,还受制于焦点企业选择联盟组合的均衡条件———合作成本、潜在合作伙伴的合作收益以及博弈双方合作收益的差距,博弈各方基于交互的博弈盘算和决策行动最终形成了稳定的均衡格局。

参考文献

[1] GEORGE G,ZAHRA S A,WHEATLY K K.The effectsof alliance portfolio characteristics and absorptive capacity

on performance[J].Journal of High Technology Manage-

ment Research,2010,12:205-226.

[2] ROWLEY T,BEHRENS D,KRACKHARDT D.Redun-dant governance structures:An analysis of relational em-

beddedness in the steel and semiconductor industries[J].

Strategic Management Journal,2000,21:369-386.[3] OZCAN P,EISENHARDT K M.Origin of portfolios:en-trepreneurial firms and strategic action[J].Academy of

Management Journal,2009,52:246-279.

[4] ANAND B N,KHANNA T.Do firms learn to create val-ue?The case of alliance[J].Strategic Management Jour-

nal,2000,21:295-315.

[5] REUER J J,PARK K M,ZOOLO M.ExperimentalLearning in International Joint Ventures:The Role of Ex-

perience Heterogeneity and Venture Novelty[M].Ox-

ford,UK:Pergamon,2002.

[6] HOANG H,ROTHAERMEL F T.The effect of generaland partner-specific alliance experience on joint R&D pro-

ject performance[J].Academy of Management Journal,

2005,48:332-345.

[7] HOFFMAN W H.How to manage a portfolio of alliances[J].Long Range Planning,2005,38:121-143.[8] HOFFMANN W H.Strategies for managing aportfolio ofalliance[J].Strategic Management Journal,2007,28:827-

856.

[9] LAVIE D.Alliance Portfolio and firm performance[J].Strategic Management Journal,2007,28:345-381.[10] LAVIE D,MILLER S R.Alliance portfolio international-ization and firm performance[J].Organization Science,

2008,19:623-646.

张 翼等:不完全信息下联盟组合形成动态博弈分析

[11] STUCKEY J A.Vertical Integration and Joint Venturesin the Aluminum Industry[M].Cambridge,MA:Har-

vard University Press,1995.

[12] JARILLO J C.On Strategic networks[J].Strategic Man-agement Journal,1988,9:31-41.

[13] GULATI R.Strategic networks[J].Strategic Manage-ment Journal,2000,21:203-215.

[14] KOKA B R,PRESCOTT J E.Strategic alliance as socialcapital:a multidimensional view[J].Strategic Manage-

ment Journal,2002,23:795-816.

[15] HOFFMANN W H.Strategies for managing aportfolioof alliance[J].Strategic Management Journal,2007,28:

827-856.

[16] YOSHINO M Y,RANGAN.Strategic Alliance:An En-trepreneurial Approach to Globalization[M].Boston:

Harvard Business School Press,1995.

[17] HARRIGAN K R.Bases of interorganization coopera-tion:propensity,power,persistence[J].Journal of Man-

agement Studies,2010,27:417-434.

[18] DAS T K.The dynamics of alliance conditions in the alli-ance development process[J].Journal of Management

Studies,2002,39(5):725-745.

[19] 詹也,吴晓波.企业联盟组合配置战略与组织创新的关系研究———基于我国汽车行业的多案例研究[J].科学学研

究,2012(3):466-473.

[20] 阮爱清,徐霄峰.企业联盟建立的二元shapley值群决策模型[J].统计与决策,2010(20):62-64.

[21] 罗利,鲁若愚.shapley值在产学研合作利益分配博弈分析中的应用[J].软科学,2001(2):28-31.

[22] JACKSON M O.A survey of Network Formation Models[M].Cambridge:Group Formation in Economics,Press,

2005.

[23] MESTERTON M,SHERRATT T N.Coalition forma-tion:agame-theoretic analysis[J].Behavioral Ecology,

2006,12:277-286.

Dynamic Game Analysis on Alliance Portfolio Formation under

Condition of Incomplete Information

Zhang Yi 1,Chen Yao2,Xia Maosen1

(1.School of Economics and Management,Nanjing University of Science and Technology,Nanjing 210094,China;

2.Yangzhou University,Yangzhou Jiangsu 225001,China)

Abstract:Through reviewing the theory of the formation of alliance as well as alliance portfolio,this paper builds a dynamic game model withtwo-stage from the perspective of cost-benefit,and uses this model to explore the dynamic mechanism and stable equilibrium requirement of alli-ance portfolio formation under the condition of incomplete information,which aims to provide a decision-making analysis framework for enterpri-ses when establishing alliance portfolio and promote the research on alliance portfolio based on focal actors.

Key words:focal actor;alliance portfolio;dynamic game

(上接第110页)

New Empirical Study on Coal Resource Exploitation and Resource Curse in China:

Case of Shanxi,Shaanxi and Inner Mongolia

Wang Baozhong1,He Liancheng2,Li Zhongmin1

(1.School of International Business,Shaanxi Normal University,Xi'an 710062,China;

2.School of Economics and Management,Northwest University,Xi'an 710062,China;

3.Department of Economics Management,Yuncheng University,Yuncheng Shanxi 044000,China)

Abstract:Firstly,this paper discusses the research progress on'resource curse'at home and abroad,and points out the necessity of takingShanxi,Shaanxi and Inner Mongolia(Jin-Shan-Mon)as the research object.Then it uses the data about these indexes such as coal exploitation in-tensity,per capita GDP,manufacturing investment level,R&D and education investment level of Shanxi,Shaanxi and Inner Mongolia provincesfrom 1991to 2010to empirically test the'resource curse'in three provinces from the perspectives of the whole and the provincial by establishingapanel data regression model and using the econometrics method.The empirical result shows as follows:there is'resource curse'effect in the de-velopment of Jin-Shan-Mon;the implementation of Western Development and Rise of Central China result in the significant differences in're-source curse'effects of three provinces,which causes these provinces to some extent to lock or weaken or break'resource curse'.Finally,it pointsout that developing manufacturing industry is an important way to weaken'resource curse',and strengthening system construction is a key factorto crack the curse.Therefore,resource-based regions should strengthen to develop manufacturing industries and emphasize system construction.Key words:coal resource;resource curse;resource exploitation;western development;rise of central China

技术经济 第31卷 第7期

完全信息动态博弈练习题

1、空中客车与波音两家公司在研发新型商业客机方面展开激烈竞争。波音公司在研发过程中已经处于领先地位,而空中客车正考虑是否参与这场竞争。假如空中客车不参与竞争,那么它的收益为0,而波音公司将会获得垄断地位,获得10亿美元的收益。假如空中客车决定参与竞争,则波音公司就不得不决定与空中客车进行和平竞争,还是打价格战。如果和平竞争,双方各自获得3亿美元的收益;如果打价格战,则客机价格下滑,双方都无法收回研发成本,各损失1亿美元。请画出博弈树,找出子博弈精炼纳什均衡。 2、考虑可乐行业,可口可乐与百事可乐是两家主要公司,市场规模为80亿美元。每家公司可以选择是否做广告,广告成本为10亿美元;如果一家企业做广告而另一家不做,则前者强的所有市场;如果两家企业都做广告,则各占一半市场,并付出广告成本;如果两家公司都不做广告,也各占一般市场,但不支付广告成本。 (a)画出博弈支付表,并找出当两家公司同时行动时的纳什均衡; (b)假定博弈序贯进行,画出可口可乐公司率先行动时该博弈的博弈树。 (c)在(a)、(b)均衡中,从可口可乐与百事可乐的共同观点来看,哪一个是最佳的,这两家公司要怎样才会有更好的结果? 3、假设巨人、太阳神、弗里达三大百货公司正考虑在波士顿两个新的大型购物中心中的一个开设分店。其中,城市购物中心靠近人口密集的富人区,规模不大,最多只能以两家大百货商场为龙头。而郊区购物中心地处较远的郊外,相对较穷,能以三家百货商场为龙头。三家百货公司都不想在两个地方同时开店,因为顾客有相当部分重复,两处都开店无疑是同自己竞争。每家百货公司都不愿意在一个地方独家经营,拥有多家商场的购物中心能够吸引更多的顾客,顾客总量的增加自然会使商场利润增加。此外,它们都偏向争夺富人群体的城市购物中心,所以它们必须在城市购物中心(如果这个尝试失败了,它们将会尝试在郊区建立商场)和郊区购物中心(不争取城市市场而直接进入郊区市场)之间作出选择。在该案例中,百货公司将5种可能结果按等级排列如下:5 (最好)和另一家公司在城市购物中心;4 和一家或两家公司在郊区购物中心;3 在城市购物中心独家经营;2 在郊区购物中心独家经营; 1 最坏,在尝试进入城市市场失败后在郊区独家经营,而此时其他非百货业公司已经签约获得郊区购物中心的最好地盘。三家百货公司因管理结构各不相同,所以做新购物中心扩展市场工作的快慢也不同。弗里达公司动作最快,其次是巨人公司,最后是太阳神公司,它在准

完全信息动态博弈习题(一)

完全信息动态博弈习题(一) 1、在一个由三个寡头垄断者操纵的市场上,反需求函数由()Q a Q P -=给出,此处321q q q Q ++=,i q 表示企业i 生产的产量。每一企业生产的边际成本函数为常数c ,并且没有固定成本。企业按以下顺序进行产出决策:(1)企业1选择01≥q ;(2)企业2和3观测到1q ,并同时分别选择2q 和3q 。试求出此博弈的子博弈精炼解。 解:采用逆向归纳法。 (1)在第二阶段企业2和企业3决策: ()[]223212 222cq q q q q a Max Max q q ----≥≥=π π ()[]333213 333cq q q q q a Max Max q q ----≥≥=π π 求出反应函数为:??? ??????????? --=--=33 1312q c a q q c a q (2)第一阶段企业1的决策: ()[]113211cq q q q q a Max ----π 一阶条件: 023211 1=----=??c q q q a q π, 将 3 31 31 2q c a q q c a q --= --= 带入可求得: 2 1c a q -= ,6 32c a q q -= =

2、假设家长和孩子进行一个博弈:令收入为p I (家长的收入)和c I (孩子的收入)是外生给定的,第一,孩子决定收入c I 中的多少用于储蓄S 以备将来,并消费掉其余部分B I c -;第二,家长观测到孩子的选择S 并决定给予一个赠与额B 。孩子的收益(支付)为当期和未来的效用之和:()()B S U S I U c ++-21;家长的收益(支付)为()()()[]B S U S I U k B I V c p ++-+-21(其中k>0反映出家长关心孩子的福利)。假定效用函数1U 、2U 和V 递增并且严格凹,试证明:在逆向归纳解中,孩子的储蓄非常少,从而可诱使家长给予更高的赠与(即如果S 增加,并使B 相应减少,家长和孩子的福利都会提高)。 解:采用逆向归纳法,先最大化家长的收益(支付):给定的孩子的行动S ,来选择自己的行动B, Max ()()()[]B S U S I U k B I V c p ++-+-21 一阶条件: ()()B S kU B I V p +' =-'2 反应函数满足: 0//122*+dS B S d ,所以(S+B )会增加,从而()B S U +2也会增加;同时,因为()B S U +2增加的幅度比()S I U c -1减小的幅度大,所以孩子的收益(支付)效用增大了,同时家长的收益(支付)效用也增大了。

博弈论——完全信息动态博弈

2 完全信息的动态博弈 2.1完全和完美信息的动态博弈 动态博弈(dynamic game):参与人在不同的时间选择行动。 完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈 静态博弈习惯用战略式(Strategic form representation)表述,动态博弈习惯用扩展式(Extensive form representation)表述。战略式表述的三要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。扩展式表述的要素包括:参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件(自然的选择)的概率分布。 n人有限战略博弈的扩展式表述用博弈树来表示 1 (1,2) (0,3)

①结:包括决策结和终点结。决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。第一个行动选择对应的决策结为“初始结”,用空心圆表示,其它决策结用实心圆表示。X表示结的集合,x X表示某个特定的结。z表示终点结,Z表示终点结集合。 表示结之间的顺序关系,x x′表示x在x′之前。x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。以下两种情况不允许: 前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。 ②枝:博弈树上,枝是从一个决策结到其直接后续结的连线,每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地,每个决策结下有多个枝,给出每次行动时参与人的行动空间,即此时有哪些行动可供选择。 ③信息集(information sets):博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结。(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。引入信息集的目的是为了描述当一个参与人要作出决策时他可能不知道“之前”发生的所有事情。(之前加引号是因为,博弈树中的决策结的排序并不一定与行动的时间顺序相一致)

网络安全不完全信息动态博弈模型

万方数据

万方数据

万方数据

万方数据

网络安全不完全信息动态博弈模型 作者:贾春福, 钟安鸣, 张炜, 马勇, Jia Chunfu, Zhong Anming, Zhang Wei, Ma Yong 作者单位:贾春福,Jia Chunfu(中国科学技术大学信息科学技术学院,合肥,230026;南开大学信息技术科学学院,天津,300071), 钟安鸣,张炜,马勇,Zhong Anming,Zhang Wei,Ma Yong(南开大学 信息技术科学学院,天津,300071) 刊名: 计算机研究与发展 英文刊名:JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT 年,卷(期):2006,43(z2) 被引用次数:4次 参考文献(4条) 1.B V John A conceptual model of hacker development and motivations 2001(02) 2.B Schneier Attack trees:Modeling security threats 1999(12) 3.M Rogers Psychology of hackers:A new taxonomy available 2001 4.向叔文约束条件下的Nash平衡点[期刊论文]-贵州工业大学学报 1998(04) 本文读者也读过(5条) 1.苘大鹏.杨武.杨永田.周渊.张冰.Man Dapeng.Yang Wu.Yang Yongtian.Zhou Yuan.Zhang Bing基于弱点关联和安全需求的网络安全评估方法[期刊论文]-高技术通讯2009,19(2) 2.唐成华.姚淑萍.张翔.崔中杰.Tang Chenghua.Yao Shuping.Zhang Xiang.Cui Zhongjie网络安全综合监控平台中安全策略的研究[期刊论文]-计算机研究与发展2006,43(z2) 3.李英楠.张宏莉.云晓春.方滨兴.LI Ying-nan.ZHANG Hong-li.YUN Xiao-chun.FANG Bin-xing基于网络拓扑的网络安全事件宏观预警与响应分析[期刊论文]-哈尔滨工业大学学报2005,37(11) 4.王起宏.李芝棠.WANG Qihong.Li Zhitang网络欺骗在网络安全中作用的分析[期刊论文]-华中科技大学学报(自然科学版)2005,33(5) 5.张海霞.苏璞睿.冯登国.Zhang Haixia.Su Purui.Feng Dengguo基于攻击能力增长的网络安全分析模型[期刊论文]-计算机研究与发展2007,44(12) 引证文献(5条) 1.娄燕强.宋如顺.马永彩基于RBF神经网络的攻防博弈模型[期刊论文]-计算机应用与软件 2011(1) 2.娄燕强.宋如顺.马永彩基于RBF神经网络的攻防博弈模型[期刊论文]-计算机应用与软件 2011(1) 3.孟祥宏信息安全攻防博弈研究[期刊论文]-计算机技术与发展 2010(4) 4.浅议信息安全攻防对抗[期刊论文]-网络安全技术与应用 2009(9) 5.石乐义.贾春福.吕述望服务跳变抗DoS机制的博弈理论分析[期刊论文]-电子与信息学报 2009(1) 本文链接:https://www.wendangku.net/doc/e18041964.html,/Periodical_jsjyjyfz2006z2101.aspx

第九章 不完全信息动态博弈

第九章不完全信息动态博弈 我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。回顾前面讲过的,如果参与者的战略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。如果参与者的战略要成为博弈的一个完美贝叶斯均衡,它们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的贝叶斯纳什均衡。完美贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想在不完全信息博弈中的推广,它本身是纳什均衡。 9.1 完美贝叶斯均衡定义 为引进完美贝叶斯均衡概念,考虑如下完全但不完美信息动态博弈。 [例1]首先,参与者1在3个行动中进行选择——L、M及R,如果参与者1选择R,则博弈结束(不等参与者2行动);如果参与者1选择了L或M,则参与者2就会知道1没有选择R (但不清楚1是选择了L还是M),并在或L'或R'两个行动中进行选择,博弈随之结束。收益情况由图10-1的扩展式博弈给出。 图10-1

相关文档
相关文档 最新文档