当前位置：文档库 › 博弈论模型

博弈论模型

1. 囚徒困境

这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。

“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发

现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情

形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他

们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这

两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就

可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪

来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会

得到奖赏。

那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，

他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。

但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔

丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也

意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一

理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保

持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个

逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打

交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互

之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对

方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，

就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。

2. 智猪博弈

在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着

控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是

9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1

个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收

益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，

总之，等待还是要优于行动。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种

明智的选择。这时候有所不为才能有所为！

高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提

供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业

节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现

象在经济生活中十分常见，却很少为小企业的经理人所熟识。

3. 枪手博弈

有三个枪手，第一个枪手A的命中率是80%， B是60%，C是40%。他们同时举

枪瞄准、同时射击另两个人中的一个，要尽可能消灭对手，每个人一次机会，

一颗子弹，目标是努力使自己活下来。谁活下来的可能性最大？如果你认为枪

法最准的A胜出，那么你就错了。

我们来看，如果你是A，你毫无疑问的会瞄准对你威胁最大的B，而B也会瞄准对他威胁最大的A，而C则也可能瞄准A，那么三个人存活的概率都是多少呢？

A = 100% - 60% - （1-60%）* 40% = 24%

B = 100% - 80% = 20% (因为命中率为80%的A在瞄准他)

C = 100% （因为没有人瞄准他）

原来，枪法最不准的C竟然活了下来。

那么，换一种玩法呢？

如果三个人轮流开枪，谁会生存下来？

如果A先开枪的话，A还是会先打B，如果B被打死了，则下一个开枪的就是C，那么此时A生存的概率为60%，而C依然是100%（他开过枪后A没有子弹了，

游戏结束）；如果打不死B，则下一轮在B开枪的时候一定会全力回击，A的生存率为40%，不管是否打死A，第三轮AB的命运都掌握在C的手里了。

那么，如果游戏规则规定必须由C先开枪，如果你是C怎么才能让自己活下来呢？

答案是胡乱开一枪，只要不针对AB任何一人即可。

当C开枪完毕，AB还是会陷入互相攻击的困境。

插播1——警察与小偷

令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地，那么警察应该为了保护价值大而一直保护A地吗。博弈

论认为当然不是，警察的合理策略应当是有倾向于A以一定概率的随机巡查。

这个概率就是：p=A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。但是很不幸的是，此时的小偷谋求的是，最小得手几率的最大化。

也就是说，警察的最优策略将把小偷的最差策略改良！这个便是冯·诺伊曼提

出的“最小最大定律”。

我们必须再一次感谢这个不完美的世界，因为现实之中，类似的现象，对于一

方仍然可以设法找到对手致命的规律性行动（当然必须考虑到对方是不是一个

更加老练的猎手，故意放出的诱饵）。而保持自己的行动的无序性，则有可能

成为欺骗策略的武器，这倒似张三丰所言道的：无招胜有招。

4. 斗鸡博弈

两只斗鸡在决斗的时候，无论选择进或退都是一个难题，因为纳什均衡已经给

出了一胜一败的最优策略。在很多较量下，死拼将是得不偿失的，因为很可能

给第三者机会。因此，两个已经在战场的强势力很可能自觉的遵循纳什均衡，

当一方攻击时，另一方暂退。虽然可能某方暂时受损，但较之于两败俱伤是好

得多的。不过，要维持这一状况，必须保证下一次先期受损的一方发动攻势的

时候，另一方同样的后退。于是这样的攻击性行为开始变得“仪式化”，没有

人真正流血。这只不过是两个巨头玩弄的游戏，目的是警告后来者，想进来，

那么也得陪我们一起玩，可是你玩的起么？

这正是百事的广告，即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。

插播2——协和谬误

欧洲ZF在大量投资协和飞机后，终于不能自拔。即使前景黯淡，也撑着面子投下去，非要走头无路才放弃。而这时投入的成本已经全打水漂了。如果，发现

不能继续的时候，就果敢放手，损失会小得多。可是他们会、能这么做么？壮

士断腕，是何等的壮烈，却也是何等的艰难！

沉没成本很可能会延续人们无畏的坚持。已经沉没的本该放弃，可惜大部分有

赌徒式的心理，相信阿基米德的杠杆终将启动。可惜他们在爬到足够撬动杠杆

的支点之前，已经窒息了。

协和谬误，倒是给了人们半途而废的理由，会不会有人担心它的滥觞会左右一

些本该坚持的目标？的确有这个可能，但是应该相信人们足够理智，完全可以

比较沉没成本、机会成本与未来收益的关系。看清了的，必定会坦然地走出协

和谬误。

5. 蜈蚣博弈

一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个

睿智的策略，因果相报，把握好因缘，自有好结果。它的另一个好处，就是使

得未来的计划明晰化，是你不再徘徊。只可惜，很多时候，碌碌无为的我们并

没有看透迷局的眼睛。我们黑色的眼睛只习惯于黑夜。

蜈蚣博弈也有一个致命的悖论，仍旧是个人利益和集体利益的冲突，因为最后

一次的背叛收益始终优于合作。可悲的是，这一次背叛将由于人性的理智，穿

越时光隧道，回到原始的地点：人们将从开始就拒绝合作。还是感谢我们这个

不完美的世界吧，事实上人们很少这样做。当然合作到最后的也很少，这意味着，倒推法只在中间阶段突然发生了作用，只不过谁也不能预测，中间一步在

哪里。在那里，我们只有冀望信任、道德、良知等等。

6. 分蛋糕博弈

两个小孩怎么分蛋糕？经典的故事，经典的解答：一个分，一个选。现实多如此，权利的合理分配将有效促进公平与效率。经营权与所有权的分置的确使得

经济更加活力。不过分蛋糕的进阶模型却强调了讨价还价的策略，分蛋糕不是

一次性的，而是多回合的，而且出现成本：蛋糕在融化。

时间称本的加入，将使得分配变得复杂化。双方如果不能及时达成交易，不仅

集体的收益将减量，而且个体的收益也将减少。在此情况下，利用时间称本以

及威胁、承诺将对其中一方极其有利。顾客可能迫于情势，必须尽快结束谈判，这时卖方却不慌不忙，故意拖延，顾客一方将不得不在价格上作出妥协。

顾客一方当然也有策略，它的策略就是货比三家，要求承诺或威胁。这个前提

是买方市场的存在。顾客还应当保护自己讨价还价的能力，这就是顾客有权投

诉商家。

7. 鹰鸽博弈

这个博弈很多人等同于斗鸡博弈。不过，斗鸡是两个兼具侵略性的个体，鹰鸽

却是两个不同群体的博弈，一个和平，一个侵略。在只有鸽子一个苞谷场里，

突然加入的鹰将大大获益，并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场，

而是一定比例共存，因为鹰群增加一只鹰的边际收益趋零时（鹰群发生内斗），均衡将到来。

由此产生了ESS进化上的稳定策略，也就是说一旦均衡形成，偏离的运动会受

到自然选择的打击。也就是鹰群饱满后，再试图加入的鹰将会被鹰群排挤。

进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖，也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉，这是个

体的失败，集团的胜利以及集体的止步不前。

8. 脏脸博弈

恍然大悟的博弈。三个人在屋子里，不许说话。美女进来说：你们当中至少一

个人脸是脏的。三人环看，没有反应。美女又说：你们知道吗？三人再看，顿悟，脸都红了。为什么？因为美女后一句废话点破天机，三个人都知道脏脸的

存在，而且推测知道对方也知道了脏脸的存在（因为另两人脸没红，说明他们

看到脏脸了），而且知道对方知道自己已经想到上一步……循环开始，知识开

始共同化，真相大白：三个人都是脏脸，所有人都脸红了。

这就是共同知识的作用，它的作用显得有点可怕的强大。几乎是一招无影腿，

杀人不见血。在台面上的博弈之前，私下的算计已经置对手于死地。不过，很

可能对方也预料到这一点，早也想到这一点，同时杀来。终于，形成双死局面。

当然，现实虽然存在类似现象，不过共同知识更大的作用在于减少交易成本。

因为某些规则人尽皆知，双方只要各自依之行事就可以了。

信息均衡：

很显然，信息的作用在博弈之中非常重要。将博弈论还原到现实，人们不再完

全理性，信息存在不对称，博弈就需要在抢占信息高地上作出努力。

信息不对称，是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德

风险”，前者事前，后者事后。信息不对称短期内对某一方会有利，但最终会

破坏整个市场。于是有两个解决策略。

信息传递：传达你的正面的信息的策略，也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。

信息甄别：诱导对手暴露其私下拥有的真实信息。就是给顾客一个放大镜，保

证顾客不会走到其他柜台去。这种策略显然更加有效，不过风险也更大：万一

顾客用放大镜看出了了自己的瑕疵怎么办？

插播3——博傻理论

在资本市场中（如股票、期货市场）：人们之所以完全不管某个东西的真实价

值而愿意花高价购买，是因为他们预期会有一个更大的笨蛋会花更高的价格从

他们那儿把它买走。

“博傻理论”所要揭示的就是投机行为背后的动机，投机行为的关键是判断

“有没有比自己更大的笨蛋”，只要自己不是最大的笨蛋，那么自己就一定是

赢家，只是赢多赢少的问题。如果再没有一个愿意出更高价格的更大笨蛋来做

你的“下家”，那么你就成了最大的笨蛋。可以这样说，任何一个投机者信奉

的无非是“最大的笨蛋”理论。

何谓博傻？

博傻是指在高价位买进股票，等行情上涨到有利可图时迅速卖出，这种操作策

略通常被市场称之为傻瓜赢傻瓜，所以只能在股市处于上升行情中适用。从理

论上讲博傻也有其合理的一面，博傻策略是高价之上还有高价，低价之下还有

低价，其游戏规则就像接力棒，只要不是接最后一棒都有利可图，做多者有利

润可赚，做空者减少损失，只有接到最后一棒者倒霉。

在艺术品市场中：预期会有人花更高的价格从你手中买走它

博弈论中的笨蛋理论（Theory of Greater Fool）：你之所以完全不管某件艺

术品的真实价值，即使它一文不值，也愿意花高价买下，是因为你预期会有更

大的笨蛋花更高的价格从你手中买走它。而投资成功的关键就在于能否准确判

断究竟有没有比自己更大的笨蛋出现。只要你不是最大的笨蛋，就仅仅是赚多

赚少的问题。如果再也找不到愿意出更高价格的更大笨蛋从你手中买走这件艺

术品的话，那么，很显然你就是最大的笨蛋了。

9. 以牙还牙

是一个用于博弈论的重复囚徒困境（Reiterated Prisoner's Dilemma）非常有效的策略。也就是说，人家怎么对你，你也怎么对他。说得再准确点，这个策

略在开局时选择合作，以后则模仿对手在上一期的行动。这一策略有两个

步骤：① 第一个回合选择合作② 下一回合是否选合作要看上一回对方是否合作，若对方上一回背叛，此回合我亦背叛；若对方上一回合作，此回合继续合

作以牙还牙策略有四个特点：① 友善：以牙还牙者开始一定采取合作态度，不会背叛对方② 报复性：遭到对方背叛，以牙还牙者一定会还击作出报复③

宽恕：当对方停止背叛，以牙还牙者会原谅对方，继续合作④ 不羡慕对手：以牙还牙者个人永远不会得到最大利益，整个策略以全体的最大利益为依归

10. 手表定律

手表定律是指一个人有一只表时，可以知道现在是几点钟，而当他同时拥有两

只表时却无法确定。两只表并不能告诉一个人更准确的时间，反而会让看表的

人失去对准确时间的信心。你要做的就是选择其中较信赖的一只，尽力校准它，并以此作为你的标准，听从它的指引行事。记住尼采的话：“兄弟，如果你是

幸运的，你只需有一种道德而不要贪多，这样，你过桥更容易些。”如果每个人都“选择你所爱，爱你所选择”，无论成败都可以心安理得。然而，

困扰很多人的是：他们被“两只表”弄得无所，心身交瘁，不知自己该信仰哪

一个，还有人在环境、他人的压力下，违心选择了自己并不喜欢的道路，为此

而郁郁终生，即使取得了受人瞩目的成就，也体会不到成功的快乐。

手表定理在企业经营管理方手表定律面给我们一种非常直观的启发，就是对同

一个人或同一个组织的管理不能同时采用两种不同的方法，不能同时设置两个

不同的目标。甚至每一个人不能由两个人来同时指挥，否则将使这个企业或这

个人无所适从。手表定理所指的另一层含义在于每个人都不能同时挑选两种不

同的价值观，否则，你的行为将陷于混乱。

关于博弈论的兴趣启蒙，还有不少好书可以下载来看，下面是小编为您推荐的

一些培养兴趣的图书，不能当做教材的哦～～～

1. 一读就懂的博弈论

2. 每天读一点好玩的博弈论

3. 活学活用博弈论

4. 石头，剪子，布——趣味博弈论

5. 博弈论的诡计全集

6. 妙趣横生博弈论：事业与人生的成功之道

如果博弈有唯一的均衡点，那么这个博弈是可预测的，即这个均衡点就是事先知道的

惟一的博弈结果。但是如果博弈有两个或两个以上的均衡点，则无法预测出一个结果来。斗鸡博弈则有两个均衡：一方进另一方退。因此，我们无法预测斗鸡博弈的结果，即不能知道谁进谁退，谁输谁赢。

由此看来，斗鸡博弈描述的是两个强者在对抗冲突的时候，如何能让自己占据优势，

力争得到最大收益，确保损失最小。斗鸡博弈中的参与者都是处于势均力敌、剑拔弩

张的紧张局势。这就像武侠小说中描写的一样，两个武林顶尖高手在华山之上比拼内力，斗得是难分难解，一旦一方稍有分心，内力衰竭，就会被对方一举击溃。

斗鸡博弈最直接的意义在于揭示了这样一个道理：既然对每只公鸡来说，最好的结果

是对方退下来而自己不退，那么如何才能够达到这种“不战而屈人之兵”的效果呢——“不战”不是不采取措施，而是说应该巧妙营造声势，让对手处于不利的地位，那

么自然你就是胜者。在生活和工作中，难免会出现你争我夺的情况，这个时候就体现

出斗鸡博弈的影响了。谁能够在你进我退之中占领上风，谁将会取得最终的胜利，成

为那只赢的斗鸡。

1980年，美国总统竞选的决战是在共和党候选人里根与民主党候选人卡特之间进行，由于二人当时的实力旗鼓相当，因此他们二人展开了美国竞选史上最激烈的争夺战。

当时的卡特是已经当政4年的在职总统，但政绩并不突出，而且内政方面不能令人满意，国内通货膨胀加剧，失业人数猛增。人们对这些有关国计民生的问题十分不满，

怨声载道。而这些正好成了里根手中的王牌，他集中火力攻击卡特经济政策失误，并

耸人听闻地宣称他要消除“卡特大萧条”。而这时的卡特也抓住广大民众关心的战争

与和平问题，指责里根增加防务开支的主张是好战之举。里根与卡特就是这样唇枪舌剑，拳来脚往，双方一时难决雌雄。

20世纪80年代的美国，广播、电视、报纸等大众传播媒介对人们的影响极为广泛。

一个人的形象，在美国民众的心中往往占有重要位置，有时甚至直接决定了选民投谁

一票。所以，总统选举，与其说是选民在选择候选人的政策纲领，不如说是在品味候

选人的性格、智慧、精力、风度。在这方面，里根可以说是占据了得天独厚的优势。

在里根当选共和党总统候选人之后，他当年在好莱坞演过的电影，一下子成了热门，

全国各地影剧院、电视台争相放映。这股里根影视热风，无疑替里根做了一次绝好的

宣传。人们从影视中看到，当年的里根英俊潇洒、精明强干，而现在仍然生机勃勃、

干劲十足，风度不减当年。这给人们留下了一个很好的印象。

在里根影视风兴起的同时，里根还借电视媒体极力展示自己的风采。在与卡特的电视

辩论中，里根表现得能言善辩、妙语连珠，而卡特则相形见绌、呆板迟钝、结结巴巴。因此在投票之前关键性的一场电视辩论后，民意测验的结果，支持里根的人上升到

67%，支持卡特的人下降为30%。1980年11月4日大选结果，里根以绝对优势大获全胜。

里根的胜利，要归功于在他巧妙地利用了大众传播媒介，通过电影、电视、广播等手段，让自己的形象深入民众。在这场斗鸡博弈中，里根成功地把握了进攻的主动，成为了胜利的斗鸡。而卡特则显得捉襟见肘，被里根牵着鼻子走，最终走向失败。

设想一下斗鸡场上有两只公鸡，其中一只雄赳赳、气昂昂，摆出一副久经沙场、无所畏惧的样子，如果另一只公鸡在气焰上短了一筹，自然就被对手的声势给震慑住了，自然节节败退，这就是斗鸡博弈告诉我们的道理：不必针锋相对，大可做一些虚张声势的表面功夫，让对手自己软下去，这才是斗争的最高境界。

有时候，你的对手也不是那么好惹的，万一他是一个“不蒸馒头争口气”的呆子，那么你怎么营造声势都没有用，他不吃这一套，还是会琢磨着怎么拼个鱼死网破，这时候你不妨主动进攻，给他一点颜色看看，让他知道你的厉害不是纸面上的，也不是口头上的，他自然就乖乖地后退了。

一个面带菜色、衣着简朴的小伙子乘坐长途汽车，因为带的杂物太多，被司机训斥后蜷缩在车尾角落里。

车行半路，忽然冒出来几个歹徒持械抢劫，原来他们混在旅客堆里，逃避了司机的注意。这时候，司机已经被凶狠的歹徒用刀顶住脖子，眼见一场面对全体乘客的抢劫就要发生。那个小伙子突然站了起来，大叫一声：“给我住手！”然后写了一张纸条递了过去。几个歹徒读罢字条，互相对视片刻，竟然迅速下车逃跑了。

一场风波化险为夷，大家诧异地问小伙子：“你是警察？”

“不是。”

“你是军人？”

“也不是。”

“那你怎么这么厉害？”

“老实说，我今天正好带着借来的大笔钱，被他们抢走的话我也只有死路一条，所以

只得铤而走险了。我在纸条上写的是：快滚蛋！我是一个持枪在逃犯，惹火了我就杀

了你们。”

“横的还是怕不要命的”，“威慑战略”在某些时候还真管用。你给别人的威慑不一

定代表你真会那么去做，只是给别人一种震慑力或假象。在生活中采用一些假的威慑，或许可以解决一些难题。恰如在斗鸡博弈中，有一只公鸡气势汹汹地向前迈一步，意

味着：“小样，你胆子还真不小，等我给你点颜色看看！”这样对手就被吓得屁滚尿

流啦！

从科学的角度上来说，斗鸡博弈对人的作用，和达尔文生物进化论的观点相一致：在

自然界中，到处都存在着一种竞争的法则，在这种竞争法则的作用下，这个世界才显

得生机勃勃。如果一个物种失去了竞争，这一物种就会失去活力，死气沉沉而陷入灭

种的边缘。如果一只斗鸡永远都不战斗，那么它只会变成一只普通的公鸡，整日在沙地上溜达觅食。所以，如果要成为一只战无不胜的常胜将军，你必须学会让你的对手成为你前进的动力，让你变得越来越强壮。

关于定价的博弈论模型

CH13 关于定价的博弈论模型分析寡头市场的最大困难在于策略问题。在此情形下，市场上仅有几家企业，每一家企业在做决策时，都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。一、基本概念在一些情况下，个人或企业必须作出策略性选择，并且最终的结果依赖于每一个行动者的选择，这种情况就可以看成是一个博弈。 1．博弈的三要素任何一个博弈都必须具备三个要素：（1）博弈的参与者参与人的具体身份无关紧要，在博弈中没有“好人”与“坏蛋”之分，我们只是简单地假设每个参与者在考虑到对手行为的前提下，做出最有利的策略性选择。（2）策略策略是博弈参与者的行动规则。在非合作博弈中，参与者之间不能就策略选择达成一个有约束力的协议。（3）支付（payoffs ）支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面，既包括显性的货币报酬，也包括隐性的参与者关于结果的心理感受。 2. 符号两个参与者（A 和B ）之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中，A S 和B S 分别表示参与者A 和参与者B 的可选策略，(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时，各自所得到的支付（,A B a S b S ∈∈）。二、Nash 均衡市场均衡：在均衡价格和产量下，买方和卖方都没有动力去改变自己的行为。

Nash 均衡：对于策略组合（**,a b ），如果给定其它参与者的策略，没有一个参与者会选择单方面偏离，那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解设想所有参与者在博弈之前达成一个（没有约束力的）协议，规定每个参与人选择一个特定的战略。那么，给定其他参与人都遵守此协议，是否有人不愿意遵守此协议？如果没有参与人有积极性单方面背离此协议，我们说这个协议是可以自动实施的（self-enforcing ），这个协议就构成一个纳什均衡。否则，它就不是一个纳什均衡。三、一个例子两个厂商（A 和B ）决定自己花多少钱用于做广告。每个厂商可以选择较高的预算（H ）或较低的预算（L ）。 1．博弈的扩展式表述图13.1 2．博弈的策略式（规范式）表述表13.1 3．占优策略和Nash 均衡从表13.1可以看出，低预算（L ）是厂商B 的占优策略，即不管厂商A 选择哪一种策略，L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识，厂商A 也知道L 是厂商B 的占优策略，所以厂商A 将选择L 。因此，该博弈的均衡是（L ，L ）。请验证（L ，L ）构成一个Nash 均衡，而其它三个策略组合都不是Nash 均衡。

生活中的博弈论论文

生活中的博弈论论文摘要：生活、博弈、无处不在、利益、老鹰、报价价位、得与失正文：博弈无时不在，无处不在，日常生活中的一切，均可从博弈得到解释，大到美日贸易战，小到今天早上你突然生病。可能读者会认为，贸易争端用博弈论来分析是可以的，但对自己生病也可以用博弈论来理解就有点不可思议，因为自己就一个人，和谁进行游戏？实际上，并非只有一个人，还有一个叫做“自然”（Nature）的参与者。“自然”可以理解为无所不能的上帝，上帝现在有两种策略，让人生病或不生病。人一旦生病，就不得不根据生病的信息判断上帝的策略，然后采取对应的策略。上帝采取让人生病的策略，人就采取吃药的策略来对付；上帝采取不让人生病的策略，人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。 “自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是：天旱、多雨、风调雨顺。农夫对应的策略分别是：防旱、防涝、放心地休息。当然，“自然”究竟采用哪种策略并不确定，于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重，就可早做防旱准备；如果估计水情严重，就早做防涝准备；如果估计是风调雨顺，农夫就可以悠哉游哉了。生活中更多的游戏不是单人博弈，而是双人或多人的博弈。比如，某一天你觉得应该是你太太的生日，但又不能肯定：如果是太太的生日的话，你可以送一束花，太太会特别高兴；你不送花，太太会埋怨你忘了她的生日；如果不是太太的生日的话，你可以送太太一束花，太太感到意外的惊喜；你不送花，结果生活同往常一样。在这个博弈里，我们看到，“自然”可以有两种策略：确定今天是太太的生日或确定今天不是太太的生日，但不论“自然”采取何种策略，你的最好行动都是买花。夫妻吵架也是一场博弈。夫妻双方都有两种策略，强硬或软弱。博弈的可能结果有四种组合：夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。根据生活的实际观察，夫软弱妻软弱是婚姻最稳定的一种，因为互相都不愿让对方受到伤害或感到难过，常常情愿自己让步。动物学的研究有相同的结论，性格温顺的雄鸟和雌鸟更能和睦相处，寿命也更长。夫强硬妻强硬是婚姻最不稳定的一种，大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种，许多夫妻吵架都是这样，最后终归是一方让步，不是丈夫撤退到院子里点根烟，就是妻子避让到卧室里号啕大哭。在竞争激烈的商业界，博弈更为常见。比如两个空调厂家之间的价格战，双方都要判断对方是否降价来决定自己是否降价，显而易见，厂家之间的博弈目标就是尽可能获得最大的市场份额，赚取最多的收益。事实上，这种有利益（或效用）的争夺正是博弈的目的，也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化，参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系，以争得效用的多少决定胜负，一定的外部条件又决定了竞争和对抗的具体形式，这就形成了博弈。如象棋对局的参与者是以将对方的军为目标，战争的目的是为了胜利，古罗马竞技场中角斗士在争夺两人中仅有的一个生存权，企业经营的目的是为了生存发展，而股市中人们所争的很实在，就是金钱。从经济学角度来看，有一种资源为人们所需要，而资源的总量具是

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P ,I)，其中P 为市场价格，I 为消费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论论文

博弈论课程论文生活中的博弈论学院：姓名：学号：

生活中的博弈论摘要：本文从实际生活入手，主要是把生活中所会出现的一些问题、一些选择用博弈论的思想进行分析。有时候看起来很简单的问题，其实深究起来并不是那么简单，不能只看表面，要仔细分析每一个问题参与者的心理，做出多种情况的假设，才能做出最有利的选择。关键词：博弈，心理，生活，假设一、博弈论简介博弈论又被称为对策论既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。类型： (1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题[1]。 (3)完全信息/不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息；反之，则称为不完全信息。 (4)静态博弈和动态博弈静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。动态博弈：指双方的行动有先后顺序并且后行动者可以知道先行动者的策略。二、博弈例证

从博弈论角度看古诺模型

从博弈论角度看古诺模型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型罗思蕴（华中师范大学数学与应用数学系，武汉430079）摘要：运用博弈论的研究方法，对古诺模型的几种变式进行分析，给出模型解法的代数表达式，并对结果进行适当的对比分析，最后总结出不同模型对结论的改变情况。关键词：古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈古诺模型（Cournot model）是博弈论中最具有代表性的模型之一，也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年，足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度，它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。在古诺生活的时代，大多数市场都只有少数的厂商经营，所以这个模型在当时是极具现实意义的。随着时间的推移，古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析，有四种情况极具代表性：完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型古诺模型最初的形态是来自于经济学的。在经济学中，寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一，

假定一个产业只有两个寡头，每个寡头生产同质产品，并追求利润最大化。二，两个寡头之间进行的是产量的竞争而不是价格竞争，且产品的价格依赖于两者生产的产品总量。三，寡头之间无勾结行为。四，每个生产者都把对方的产出水平视为定值。五，边际成本为常数。在经典的古诺模型中，每个企业具有相同的不变单位成本：需求函数为：第i个企业的利润为：最优化的一阶条件为：反应函数为：解得纳什均衡为：每个公司的利润为：古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中，每个寡头都可以准确猜测对手的产量，从而选择自己的最大产出。最重要的是，古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况，那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的，考虑无勾结寡头市场、垄断市场、自由市场，可以得到：无论是产量还是价格，无勾结寡头市场都是处于中间的位置。也就是说，如果寡头市场不存在勾结的行为，其效率高于完全垄断，低于完全竞争。 2 博弈分类下的两种古诺模型不完全信息静态博弈的古诺模型完全信息静态博弈的古诺模型即经济学中最经典的形式，它假设了厂商相互完全

博弈论论文

本科毕业论文（设计）论文（设计）题目：用博弈论思想分析经济学现象，分析生活中一个经济现象学院：计算机技术与科学学院专业：软件工程年级：软件123 学号： 1208060324 学生姓名：廖杰指导教师：刘涛 2014年 5月 23日

目录摘要 (2) ABSTRACT (3) 正文 (4) 一、完全信息讨价还价 (4) 二、不完全信息下的讨价还价 (6) 三、总结 (7) 参考文献 (7) 附录一 (8)

从讨价还价看经济、市场摘要本文阐述了博弈论在讨价还价方面的应用理论。主要在完全信息与不完全信息下，进一步针对不同的情况，综合地介绍讨价还价理论模型以及应用。讨价还价作为市场经济中最常见、普通的事情，也是博弈论中最经典的动态博弈问题。现实经济中充满了“讨价还价”的情形，大到国与国之间的贸易协定，小到个体消费者与零售商的价格商定，还有厂商与工会之间的工资协议、房产商与买者之间关于房价的确定、各种类型的谈判等等。这实际上是两个行为主体之间的博弈问题，也可以把讨价还价看作为一个策略选择问题，即如何分配两个对弈者之间的相互关联的收益问题。关键词：博弈论，讨价还价，博弈树

Viewing from the bargaining, market economy Abstract This paper expounds the bargaining game theory in the application of theory. Main under complete information and incomplete information, further according to different situation, comprehensive introduction to bargaining model in theory and application. Bargaining as the most common, ordinary things in market economy, as well as the most classical game theory of dynamic game problems. Is full of "bargain" in real economic situations, big to trade agreements between countries and agreed on the price of small to individual consumers and retailers, and manufacturers and the unions wage agreement between, between property developers and buyers about the determination of prices, various types of negotiation, and so on. This is actually a game between two agents, can also read the bargain as a strategy choice problem, namely how to divide the two players of the correlation between income problem. Key words:Game theory Argy-bargy, Game tree

博弈论论文

博弈论论文 Prepared on 22 November 2020

博弈论姓名：XXX 学号：XXXXXXXXXXX 专业班级：XXXXXXXXXXXXX 博弈论课堂回顾与总结还记得当时在纠结抢什么选修的时候，朋友说博弈论好呀！老师经常让我们玩游戏，而且可以学到很多东西。于是乎我就在朋友的强力推荐下抢到了大学的最后一门选修课——博弈论。时光匆匆，转眼12周过去，博弈论课程也接近尾声，在这我以这篇文章回顾总结一下这十三周的课堂与收获。课堂总结：博弈论的第一课老师给我们讲了博弈论的定义，让我们首次认识和了解博弈论： 1、博弈论又被称为对策论既是现代数学的一个新分支，也是运筹学的一个重要学科。 2、博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们

的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。3、博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。4、基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。在随后的课堂里，老师分别给我们讲了：纳什均衡、囚徒困境、重复博弈、一次博弈、一报还一报（以牙还牙、以眼还眼、悔过的一报还一报、以怨抱怨、以德报怨、以直报怨）、人质困境（多个人的囚徒困境）、酒吧博弈（非线性预测）、枪手博弈（先发优势与后发制人）、智猪博弈、斗鸡博弈、协和谬误等。老师详细讲解了它们的定义、条件、破解、策略以及运用。例如：一.酒吧博弈（非线性预测）前提条件限制：要做出正确的预测必须知道他人的抉择，过去的历史是“任意的”，未来就不可能得到一个确定的值。现实启示：1.从一非线性系统整体来说，其变化经济不可预测 2.对于一个混沌系统中个体来说，在无法预测过程中也可采取恰当策略，并可趋吉避凶，即少数者策略二. 囚徒困境：基本精神是背叛，处于囚徒困境时，没有什么十全十美的办法能让自己在困境中逃脱，只能尽量做到自己不受侵害，两利相对取其重，两害相对取其轻如何设计：1.博弈双方信息沟通流畅 2.博弈双方互不信任

(完整版)博弈论知识点总结

费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。比较： 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期课程名称：博弈论班级：10物流治理（采购与供应链1班）学号：1040407122 姓名：曾维乐

二〇一一年十二月十八日价格战中的博弈论浅析摘要：博弈论研究互动决策行为，大多数时候是研究对抗性行为，但并不是所有的对抗行为。博弈论是运筹学的一个重要分支，类型众多。本文在简要介绍了博弈论相关内容的基础上，重点介绍了纳什均衡。通过案例，充分运用囚徒困境、智猪博弈、反向归纳法等进行分析，从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上，结合博弈论相关知识，分析解决经济生活中的一些实际问题。如：针对商家的价格战问题。

关键词：囚徒困境懦夫博弈安全博弈纳什均衡一、理论介绍 1、博弈论简介博弈论(game theory),也称对策论，它是运筹学的一个重要分支，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题，简单讲来确实是一些个人或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自同意选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。从上述定义中能够看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人，也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般

博弈论的总结｜博弈论总结

博弈论学习的个人总结刘艳丽第一部分基本情况视频来源耶鲁公开课《博弈论》1----5讲，人人影视参考资料耶鲁校园网《博弈论--战略分析入门》，美，罗杰A麦凯恩，原毅军译，机械工业出版社，2006，42元《策略博弈》，阿维纳什迪克西特，蒲勇健译，中国人民大学出版社，第二版，2009，65元班级工商，人力08级学生课时8节我的时间投入视频26个小时；书籍，25小时；上网时间，无法统计。第二部分知识层面一、The five lessons五个基本的结论 1、Don"t play a strictly dominated strategy

2、Rational choices can lead to bad outcomes 3、You can"t get what you want 4、Put yourself in other people"s shoes 5、Yale students are evil 二、Game 2: "pick a number."数字游戏 Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class. 三、The Prisoners" Dilemmasome examples囚徒困境 A joint project Price competition

生活中的博弈论论文

生活中的博弈论这学期我在人文课的选择上，我选了“生活中的博弈论”这门课。本来以为会很枯燥乏味，现在课要结束了，回想起来觉得还是挺有趣的。其中含有很浓的智慧气息，趣味横生。下面就是我关于这门课的小论文。我们首先就会问，什么是博弈论？其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。生活中每个人，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分，并将其系统化为一门科学。事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化，通过建立完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情，以最简单的二人对弈为例，稍想一下便知此中大有玄妙：若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手，甲出子的时候，为了赢棋，得仔细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的想法… 博弈论怎样着手分析解决问题，怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢？现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立，1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。

博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，博弈论经过了这么多年的发展已经完善成为一门十分重要的经济学分支学科，不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用，尤其对于理性人来说懂得如何博弈就显得越发重要。下面我说一下我个人的想法。博弈其实就是一种游戏，是如何做出对自己有利选择的游戏，但又区别于传统的如体育运动、下棋、打牌等游戏，同时又和这些有些有本质的共同特征，如都有一定的规则，都有一个结果，策略至关重要，同时策略和得益有相互依存性，游戏者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通的游戏是一样的，其实这并不奇怪，其实博弈本身的含义就是博弈参与者在一定的规则条件下选择相应的策略以期获得足够的利益的过程，这和传统的游戏是相通的，如最常见的斗地主，就是在一定的规则下（如连牌至少5张一连等等），选择如何出牌（出牌的组合以及出牌的顺序等等）而获胜（当然也可能输）的过程，这本身就是一个三方博弈的过程。为了能够了解博弈的含义，那么下面我们来看一下经典的博弈模型。需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困境”。

博弈论培训心得

博弈论培训心得 -------李佳航经过两次对博弈论的培训本人感触很深，也看了许多关于博弈的案例也从案例从学习了很多关系学习生活为人方面的博弈。学习后现在简单总结一下： 1、博弈论中有很多的模型，其实记住模型并不是最重要的东西，掌握将问题变成博弈格局图以及进行优势策略标注法，找到纳什均衡更加重要。世界上的事情千变万化，仅仅靠这几个模型是无法全部解释的，而且模型与模型之间，仅仅变换几个数字，则发生变化。 2、博弈论可以将社会问题变成一个数学模型来计算推理，因此我们运用此模型时，需要相对准确地核定博弈各方的支付大小，解决问题的过程中，可设法改变参数让博弈对自己更加有利。 3、基本博弈模型的作用在于解决问题时更加容易去套，而不需要计算即知道博弈的结果将是什么，因此对于分析问题是有益的。有了模型在，对于一些谈判，容易让人站在博弈论的高度去分析它，这往往让人对谈判更加具有控制力。 4、对于较为简单的事件，完全不需要学习博弈论即能找到问题的答案，我们现实生活中的都自然而然的达到了博弈的均衡结果。本周培训主要是讲的卡尼曼的前景理论和损失规避。前景理论： 1、“二鸟在林，不如一鸟在手”，在确定的收益和“赌一把”之间，多数人会选择确定的好处。所谓“见好就收，落袋为安。称之为“确定效应”。 2、在确定的损失和“赌一把”之间，做一个抉择，多数人会选择“赌一把”。称之为“反射效应”。 3、白捡的100元所带来的快乐，难以抵消丢失100元所带来的痛苦。称之为“损失规避”。 4、很多人都买过彩票，虽然赢钱可能微乎其微，你的钱99.99%的可能支持福利事业和体育事业了，可还是有人心存侥幸搏小概率事件。称之为“迷恋小概率事件”。 5、多数人对得失的判断往往根据参照点决定，举例来说，在“其他人一年挣6万元你年收入7万元”和“其他人年收入为9万元你一年收入8万”的选择题中，大部分人会选择前者。称之为“参照依赖”。损失规避：如何理解“损失规避”？用一句话打比方，就是“白捡的100元所带来的快乐，难以抵消丢失100元所带来的痛苦”。前景理论最重要也是最有用的发现之一是：当我们做有关收益和有关损失的决策时表现出的不对称性。对此，就连传统经济学的坚定捍卫者保罗·萨缪尔森，也不得不承认：“增加100元收入所带来的效用，小于失去100元所带来的效用。” 这其实是前景理论的第3个原理，即“损失规避”（lossaversion）：

博弈模型

有趣味的博弈论模型按语：本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页；在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”；2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”（请看最后附录），这篇科普文章名列首位，我们还有一篇文章名列第七。如果读者有兴趣可以去看看，或等我有时间找出来。我觉得，把新兴科学应用通俗易懂的语言写出来，有利于科学知识普及。这也应该是一个科学工作者的责任。在自然界和人类社会经济等领域中广泛存在合作与竞争，而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论（Game Theory），也称对策论，它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论，研究个体之间行为的相互影响和相互作用规律，它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是，有三次诺贝尔获奖者是博弈论的杰出科学家，他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家，1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末，随着复杂网络科学的一些新的发现，博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。博弈论对人有一个最基本假定：人是理性的，人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的，因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究，并获得了丰富多彩的结果，利用博弈论可以解读人类的社会行动或集体行动，更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响，人们已经提出和研究了许多博弈模型，比较著名的有三个模型：囚徒困境、“雪堆”博弈和“少数者”博弈，下面笔者通过对这三个模型进行简单而通俗的介绍，让大家了解博弈论及其应用概况。 “囚徒困境”模型囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕，分别关在不同的屋子里，如果双方都拒绝承认同伴的罪行，则由于证据不足两人都会被轻判（收益为）；为此，警方设计了一个机制：如果一方出卖同伴，而另一方保持忠诚，则背叛者将无罪释放（收益为T ）；坚持忠诚的一方将被重判（收益为）；如果双方都背叛了对方，则双方都会被判刑（收益为R S P ）。这里假设上述收益参数满足下面的条件：。对每个参与者来说，如果对手坚持忠诚，则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ；如果对手选择背叛，则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见，无论对手采取哪种策略，自己的最佳策略就是背叛，双方都选择背叛称为囚徒困境的唯一“纳什均衡”（纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖）；同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下，理性参与者面临着两难的困境。自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

博弈论期末论文

博弈论期末论文 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

城市公交优先机制中的博弈论分析摘要：针对我国城市交通拥堵问题严重的现状，通过建立基于完全信息条件下的静态博弈模型，验证了交通公共资源利用方面常出现的问题。为促进公共资源优化配置，避免公共资源悲剧的发生，通过建立类似于“公共地悲剧”的完全信息静态模型，对均衡条件进行讨论分析，以有限理性的复制动态和优化稳定策略分析为基础理论，建立动态博弈模型并进行求解，在此基础上提出解决交通问题相关对策与建议办法，为政府实行公交优先机制提供了有力论证。关键词：交通拥堵；博弈；公共地悲剧；公交优先一、引言随着社会经济的发展，城市化水平的不断提高，城市交通中所面临的交通拥挤、能源短缺、环境污染等问题日益严重。针对这一系列的城市交通问题，公交优先发展政策在20世纪60年代初由法国巴黎首先提出，随后被众多专家认为是解决城市交通问题的最有效的途经之一，它是对城市道路交通资源进行优化，保证城市交通可持续发展的一项有效、可行的政策措施。“公交优先”是优先发展公共交通系统的简称，不仅是专指常规公交通行权上的一种片面优先，且从广义上讲，凡是有利于公共交通优先发展的政策和措施均可称之为公交优先。目前，在我国提出大力发展城市公共交通的良好机遇下，确定公共交通优先发展的政策和措旌是保证公共交通优先发展的前提和基础，也是新的历史时期摆在我们面前的重大课题。在本研究中，运用博弈理论的概念与方法，通过研究交通需求者的出行决策与公共资源利用之间的关系，剖析交通需求与交通供给矛盾的实质，为促进公共资源优化配置，避免“公共地悲剧”的发生，以有限理性的复制动态和优化稳定策略分析为基础理

博弈论理论经典讲解

博弈论经典案例冰晶淩（杂物区）2010-04-09 22:31:28 阅读258 评论0 字号：大中小订阅引用光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家：纳什，泽尔腾和海萨尼．而博弈论可以划分为合作博弈和非合作博弈．那三位博弈论专家的贡献主要是在非合作博弈方面，而且现在经济学家谈到博弈论，一般指的是非合作博弈，很少指合作博弈．合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时，当事人能否达成一个具有约束力的协议，如果有，就是合作博弈；反之，就是非合作博弈．非合作博弈强调的是个人理性，个人最优决策，其结果可能是有效率的，也可能是无效率的．而合作博弈强调的是团体理性．下面是我收集的张维迎教授的几个有关博弈论的经典案例．＜案例一：囚徒困境＞囚徒困境讲的是两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里审讯．警察告诉他们：如果两人都坦白，各判刑8年；如果两个都抵赖，各判1年(或许因证据不足)；如果其中一人坦白一人抵赖，坦白的放出去，不坦白的判刑10年(这有点＇坦白从宽，抗拒从严＇的味道)．这里，每个囚徒都有两种战略：坦白或抵赖．表中每一格的两个数字代表对应战略组合下两个囚徒的支付（效用），其中第一个数字是第一个囚徒的支付，第二个数字为第二个囚徒的支付．战略形式又称标准形式，是博弈的两种表述形式之一，它特别方便于静态博弈分析．在这个例子里，纳什均衡就是（坦白，坦白）：给定B坦白的情况下，Ａ的最优战略是坦白；同样，给定Ａ坦白的情况下，Ｂ的最优战略也是坦白．事实上，这里，（坦白，坦白）不仅是纳什均衡，而且是一个占优战略均衡．就是说，不论对方如何选择，个人的最优选择是坦白．比如说，如果Ｂ不坦白，Ａ坦白的话被放出来，不坦白的话判１年，所以坦白比不坦白好；如果Ｂ坦白，Ａ坦白的话判８年，不坦白的话判１０年，所以，坦白还是比不坦白好。这样，坦白就是Ａ占优战略；同样，坦白也是Ｂ的占优战略．结果是，每个人都选择坦白，各判刑８年．＜案例二：智猪博弈＞这个例子讲的是，猪圈里有两头猪，一大一小．猪圈的一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有１０个单位的猪食进槽，但谁按按钮需要付２个单位的成本．若大猪先到，大猪吃到９个单位，小猪只能吃１个单位；若同时到，大猪吃７个单位，小猪吃３个单位；若小猪先到，大猪吃６个单位，小猪吃４个单位。表中第一格表示两猪同时按按钮，因而同时走到猪食槽，大猪吃７个，小猪吃３个，扣除２个单位的成本，支付水平分别为５和１．其他情形可以类推．在这个例子中，什么是纳什均衡？首先我们注意到，无论大猪选择＂按＂还是＂等待＂，小猪的最优选择均是＂等待＂．比如说给定大猪按，小猪也按时得到１个单位，等待则得到４个单位；给定大猪等待，小猪按得到－１单位，等待则得０单位，所以，＂等待＂是小猪的占优战略．给定小猪总是选择＂等待＂，大猪的最优选择只能是＂按＂．所以，纳什均衡就是：大猪按，小猪等待，各得４个单位．多劳者不多得！＜案例三：性别战＞

博弈论论文

鲁东大学法学院2010－20 11学年第一学期《博弈论》课程论文课程号：1230060 任课教师邵慧燕成绩正文生活中的博弈摘要：用一句俗话说：人在江湖，身不由己。当我们面临纷杂的社会生活，面临着诸多的选择，我们都不可避免的要卷入到一场场“博弈之战”中去，无论你愿不愿意，都无法逃避。在学习了选修课的“博弈论”基础的知识后，竟然会很容易的发现，博弈如同空气般，围绕在我们身边，无处不在。关键字：博弈；实例；运用一、博弈的概论什么是博弈？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化，通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情，以最简单的二人对弈为例，稍想一下便知此中大有玄妙：若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手，甲出子的时候，为了赢棋，得仔细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾，博弈论怎样着手分析解决问题，怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢？现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开

始创立，1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈，诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球，一个人赢一着则另一个人必输一着，净获利为零。在这里抽象化后的博弈问题是，已知参与者集合(两方) ，策略集合(所有棋着) ，和盈利集合(赢子输子) ，能否且如何找到一个理论上的“解”或“平衡”，也就是对参与双方来说都最“合理”、最优的具体策略？怎样才是“合理”？应用传统决定论中的“最小最大”准则，即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利，并据此最优化自己的对策，诺伊曼从数学上证明，通过一定的线性运算，对於每一个二人零和博弈，都能够找到一个“最小最大解”。通过一定的线性运算，竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤，就可以最终达到彼此盈利最大且相当。当然，其隐含的意义在於，这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说，这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望，做最坏的打算”。二、生活中博弈论的实例在生活中博弈的现象比比皆是，或许你很难想象，自己一天24小时，甚至包括睡觉的时间在内，你都无法逃避博弈这个问题。生活中的大小事怎么个博弈法，下面的内容将娓娓道来。而说到睡觉，难道也有博弈在作祟？当然！一定程度上，你大脑有意识无意识地选择做不做梦，这可能就是一个混沌的博弈问题了。大到美日贸易战，小到今天早上你突然生病，都有博弈在其中。可能有人会疑问，贸易争端用博弈论来分析是可以的，但对自己生病也可以用博弈论来理解就有点不可思议，因为自己就一个人，和谁进行游戏？实际上，并非只有一个人，还有一个叫做“自然”（Nature）的参与者。“自然”可以理解为无所不能的上帝，上帝现在有两种策略，让人生病或不生病。人一旦生病，就不得不根据生病的信息判断上帝的策略，然后采取对应的策略。上帝采取让人生病的策略，人就采取吃药的策略来对付；上帝采取不让人生病的策略，人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。 “自然”是研究单人博弈的重要假定然而，生活中更多的游戏不是单人博弈，而是双人或多人的博弈。比如，某一天你觉得应该是你太太的生日，但又不能肯定：如果是太太的生日的话，你可以送一束花，太太会特别高兴；你不送花，太太会埋怨你忘了她的生日；如果不是太太的生日的话，你可以送太太一束花，太太感到意外的惊喜；你不送花，结果生活同往常一样。在这个博弈里，我们看到，“自然”可以有两种策略：确定今天是太太的生日或确定今天不是太太的生日，但不论“自然”采取何种策略，你的最好行动都是买花。“家家有本难念”，就是司空见惯的夫妻吵架也是一场博弈。