文档库 最新最全的文档下载
当前位置:文档库 › 博弈与社会第二次作业

博弈与社会第二次作业

博弈与社会第二次作业
博弈与社会第二次作业

博弈与社会第?次作业

请于2016年5?3?提交本次作业!

1、(该当何罪?)江洋?盗?枝花被官府擒获了。按照律例,要对其进?三堂会审。审判的结果可能有三种:“?罪释放(A)”、“流放三千?(B)”和“斩?决(C)”。参与会审的三位??分别是刑部尚书、?理寺卿和左都御史,且他们对三种判决结果的偏好分别为:A?B?C、B?A?C、C?B?A。依据惯例,任何?项决定都需要得到到两位以上??认同,才能得到通过。

(1)朝廷律例规定,审判总共要进?两轮。在第?轮审判中,三位??同时给出提案,确认?枝花是否有罪。如得到定罪,则审判进?第?轮。在第?轮审判中,三位??同时给出量刑?案,决定?枝花该当何罪。如果三位??都试图让审判结果尽可能符合??的偏好,请问这个博弈的?博弈精炼均衡是什么?在这个均衡中,?枝花该当何罪?

(2)假设刑部尚书可以承诺如果?枝花被定罪后??在第?轮中?动,这会对审判的结果产?什么影响?你认为,尚书??的承诺是可信的吗?

(3)如果审判程序改为,在第?轮审判中决定?枝花是否应被处斩。如决定不处斩,则在第?轮中决定他是否?罪释放。请问,在这种审判程序下,?博弈精炼均衡又是什么?在这个均衡中,?枝花又该当何罪?

2、(?腐市场)在?个?镇的市场上,有两位?腐卖家,西施同学与貂蝉同学,两位美?为了抢占市场展开了激烈的竞争。假设整个市场上,?腐的逆需求曲线为p=a?bQ,其中Q=q1+q2表?市场上?腐的产量,q1和q2分别表?西施同学和貂蝉同学的产量。假设?产?单位?腐的成本均为c。

(1)如果??同时选择??的产量,则这是?个什么竞争模型?竞争均衡是什么?

(2)现在,由于?边有著名经济学家范蠡同学出谋划策,西施同学决定先发制?,?先决定??的产量。因此貂蝉同学只好在观察到西施同学的产量之后,再决定??的产量。在此情形下,?博弈精炼均衡是什么?

(3)美?们(?嫱啦,李夫?啦,?君啦,班婕妤啦,……)发现卖?腐是?个?常有前途的职业,于是……(好吧,这个故事我编不下去了……咳咳……)假设这个市场上有n个卖家,其中m个卖家(1≤m≤n?1)先?动决定产量,其余n?m个卖家后决定产量,那么这?博弈的?博弈精炼均衡是什么?这?均衡是如何随n和m的变化?变化的?

3、(海盗分?)五名海盗A、B、C、D、E得到了?个宝箱,宝箱??有100块?币。作为“民主”的海盗,他们打算?海盗特有的?式来分配这批?币。分配的规则是:海盗A提出分配?案,然后所有海盗(包括提出?案者)就此?案进?表决。如果有超过50%(含50%)的海盗?持这??案,则将按照这??案分配?币。否则,海盗A将被扔进?海,然后重复以上过程,由海盗B再提出新的分配?案。以此类推下去。所有的海盗都乐于看到他们的?位同伙被扔进海?,不过,如果让他们选择,他们更愿意得到?笔现?(即使只拿?个?币,也?只看同伙被扔进?海?????所获强)。当然,他们也不愿意??被扔到海?。所有的海盗都是理性的,?且知道其它的海盗也是理性的。此外,规定这些?币不能被共享,?币也?法被再分割。

请问,如果你是海盗A,你应该提出怎样的分配?案,以获得更多的?币呢?

4、(荒岛谈判)鲁滨孙和星期五流落在荒岛上,他们?头仅剩的给养是100公?的??

(C)和100公?的??(P),他们需要为分配这些物资?进?讨价还价。已知鲁滨孙的效?函

,?星期五的效?函数则为U2=C+P。如果他们不能通过?明的讨价还价数为U1=C+P

2

达成协议,就将诉诸武?,通过决?决定物品归属。决?胜利的??将获得全部物资,?失败的??则将??所获。由于鲁滨孙受过良好的格?训练,因此如果决?,他将以80%的概率获得胜利。请问:

(1)如果按照平均原则,简单地将物资向两?平均分配,两?的效?各是多少?这种分配?式是帕累托最优的吗?

(2)如果双?进?纳什讨价还价,鲁滨逊和克鲁索的“威胁点”分别是什么?请在效?空间上画出两?效?和的帕累托前沿,以及两?的“威胁点”。

(3)根据纳什讨价还价规则,最终物资将如何进?分配?两?分别可以获得多?的效??

(4)由于鲁滨孙受过城市教育的影响,在荒岛上他悟出了?种新的烹饪?法,使得他的效?函数变成U1=2C+P。若仍然按照纳什讨价还价规则,物资的分配结果又会是怎样?这个分配结果体现了纳什讨价还价所满?的哪?条前提公理?

(注:课上与书中混淆了Nash Bargaining Solution与Shapley Value Solution的概念。在Nash Bargaining Solution中,并?明确的边际贡献的概念,亦即书中h与k均取1。感兴趣的同学可以参考:Mas-Colell,A.,Whinston,M.D.,&Green,J.R.(1995).Microeconomic theory (Vol.1).New York:Oxford university press,Chapter22.或MASCHLER,M.S.,&ZAMIR,

E.Sh.(2013):Game Theory,Chapter15-18.)

5、(导弹危机?)反弹道导弹(Anti-Ballistic Missile,简称ABM)是?种重要的战略防御武器,它能够有效防御来?敌国的核导弹打击。虽然反弹道导弹本?并不能被?作攻击武器,

但它的存在会破坏?国之间?核武器构建起的“恐怖均衡”,因此它可能成为和平的重要威胁。由于这个原因,在冷战时期美国和前苏联签订了《限制反弹道导弹系统协议》(以下简称《协议》),要求两国不部署反弹道导弹。

由于世界上并不存在?个国家或组织能采?强制?来迫使两个超级?国遵守以上协议,因此协议主要依靠美、苏两国?愿执?。本题中,我们将对美、苏两国的?为进?分析。

假设美、苏两国都可以选择不部署ABM、布置低?平ABM或布置??平ABM。其?付状况如以下表格所?:

苏联

?ABM低ABM?ABM

?ABM10,106,120,18

美国低ABM12,68,82,14

?ABM18,014,23,3

(1)如果博弈只进??期,请问纳什均衡是什么?

(2)当然,美、苏之间的争霸不会是单期的。为简单起见,我们不妨假设这个博弈将重复?穷多期。和之前讨论过的其它问题不同的是,由于ABM系统是国家的军事机密,因此两国并不能确知对?是否曾对其进?部署,?只能根据监测系统提供的情报推测对?的部署情况。假设在现有技术条件下,如果对?未部署ABM,则永远不可能监测到;如果对?部署了低?平的ABM,则有10%的概率被监测到;如果对?部署了??平的ABM,则有50%的概率被监测到。

假设在初始时,双?都没有部署ABM。考虑如下这样?个战略:如果在某?时期监测到对?部署了ABM系统,就在今后?直选择部署??平的ABM;?如果没有监测到对?部署ABM系统,则选择不部署ABM系统。在此策略下,两国的贴现因?δ需要满?怎样的条件才能让《协议》得到遵守?

博弈论作业汇总

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

博弈论作业

博弈论作业

博弈论作业 一、 下面的得益矩阵表示博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 博弈方 2 L C R 博 弈 T 方 M 1 B 答:此博弈有两个纳什均衡:1、ML 得益(3,4) 2、TR 得益(4,2) 二、 求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡与得益。 博弈方 2 L R 博弈 T 方 B 1 答:(一)求混合策略均衡 1、博弈方1的概率P 则对博弈方2而言,有 1×P +2(1-P )=2×P +0(1-P ) 2-P =2P P =2/3 当P ﹤2/3,2-P ﹥2P ,则q ﹡=1是最合适的策略,即选择L 。 当P =2/3,2-P =2P ,则q ﹡∈(0,1)是最适合反应。 当P ﹥2/3,2-P ﹤2P ,则q ﹡=0是最适合策略,即选择R 。 2、给定博弈方2的概率q 则对博弈方1而言,有 2×q +0(1-q )=1×q +3(1-q ) 2q =3-2q q =3/4 当q ﹤3/4,2q ﹤3-2q ,则P ﹡=0是最合适的策略,即选择B 。 当q =3/4,2q =3-2q ,则P ﹡∈(0,1)是最适合反应。

当q﹥3/4,2q﹥3-2q,则P﹡=1是最适合策略,即选择T。 所以: 混合策略的均衡点为(2/3,3/4)。 (二)得益: ∪1=2×P×q+0×P×(1-q)+1×(1-P)×q +3(1-P)(1-q) =2×2/3×3/4+1×1/3×3/4+3×1/3×1/4 =3/2 ∪2=1×P×q+2×P×(1-q)+2×(1-P)×q +0(1-P)(1-q) =1×2/3×3/4+2×2/3×1/4+2×1/3×3/4 =4/3 三、设一四阶段两博弈方之间的动态博弈如下图所示。试找出全部子博弈, 求子博弈完美纳什均衡策略组合和博弈的结果。 答:依据逆推归纳法得出:此博弈均衡为b,得益(5,3); 路径为b, d, e, h。 四、两次重复下面的得益矩阵表示的静态博弈。设计一个处罚策略。 博弈方 2 L R S 博 弈 T 方 M 1 B

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论作业

关于中国城市交通拥堵的博弈论分析 随着现代化发展和人民生活水平提高,城市马路上车流量越来越大,人们出行时感觉拥堵。公共交通优先发展是城市交通问题获得解决的有效举措,也是城市交通实现可持续发展的内在要求。目前我国很多城市相继出台和实施了多元化的优惠公交政策,鼓励公交优先发展。 博弈论是研究互动环境下具有竞争或对抗性质的博弈行为的理论和方法。博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到了广泛的应用。博弈论研究的问题是,给定信息结构下,决策主体的决策如何使自己的效用最大化,并可以在其他决策主体中取得均衡。一个基本博弈由博弈三要素构成,即决策主体,策略集及效用。其中,决策主体是指参与人或局中人;策略集,即信息结构,是决策主体可以选择策略及行动的范围;效用,即偏好或支付函数,是指可以被量化的决策主体的利益。 在城市交通中,车辆与车辆之间、车辆与行人之间以及行人与警察之间,每天不间断地发生着竞争、互动和选择。可以说,在城市交通过程中,无时无刻不存在着博弈。用博弈论来分析城市交通问题,可使我们对身边的交通现象有更深的感悟和理解。 在城市交通博弈过程中,所对应的基本要素可理解如下: 局中人:各种交通参与者,包括机动车、非机动车、行人。 策略:出行时,采用什么出行方式是其策略,步行、骑自行车、乘公交车、自驾车等;交通过程中,遵守或不遵守交通法规也是其策略。局中人在不同的博弈中会有不同的策略。 得失:不同的出行方式,会有不同的成本和收益,出行者一般只会考虑到自己在选择某种交通方式时将要付出的成本,而不会考虑到自己的出行会给其他人带来什么影响;交通过程中,遵守或不遵守交通法规也会有不同的得失。 最后得出博弈的结果——不同的博弈会有不同的结果。 我们可以试着以博弈论的视角分析拥堵问题: 囚徒困境模型分析。囚徒困境是指两个被捕的囚徒之间的一种博弈,解释了为什么合作对双方都有利时,保持合作也是困难的,具体内容如下。警方逮捕了甲、乙两名嫌疑犯,但没有足够的证据证明二人有罪。于是警方分开囚禁两名嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证指证对方犯罪(即背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(即双方合作),则二人同样判监1年。若二人都互相背叛,则二人分别判监8年 从上图的四种行动选择组合中,我们可以看出(沉默、沉默)是帕累托最优的,“背叛”是任一犯罪嫌疑人的占优战略,而(背叛、背叛)是一个占优战略均衡。 囚徒困境模型属于博弈论中的非零和博弈,表明个人最佳选择并非团体最佳选择。城市交通拥堵问题的本质是“公共地悲剧”。在共享公有物的社会中,每个人,也就是所有人都追求各自的最大利益,这就是悲剧的所在。因为对公共资源的无限制和过度使用,必然会给所有人带来毁灭。在城市交通领域,由于私人小汽车无限制的发展,造成了整个城市,特别是

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

《博弈与社会》读后感

《博弈与社会》读后感 各位读友大家好,此文档由网络收集而来,欢迎您下载,谢谢 《博弈与社会》读后感 原创:何徐任 《博弈与社会》这本书是大二时教授《经济学原理》的老师推荐的,老师曾无数次在课堂上提起过“博弈论”这个概念,对于这个概念我的初步认识是:博弈论的全称是“非合作博弈理论”——这是我从百度百科中得到的。“非合作博弈理论”?!在我第一次接触到这个概念时,不自觉的在心里默念了好多遍,说实话,心里充满了不解——难道博弈论是在讨论如何不合作吗?带着这个疑惑,我开始看起了《博弈与社会》这本书,从书中寻求解释。 该书开篇便向我们抛出了两个问题——协调问题与合作问题。 张维迎说:“人是群居动物,群体人

具有社会属性”。这个不难理解,毕竟人类在历史长河中从来都不是具有“个体优势”的生物,为了生存我们不得不选择聚集在一起——生活在“社会”中而不是“孤岛”里,这也让生活在其中的我们无法“独善其身”。简单地说,即你的“所思所想”不仅仅取决于自己还会受到群体的影响;你的“所作所为”不仅影响自己还有他人——这就是我们的“社会属性”。 人的社会属性意味着生活在群体中的个体将不得不与其他人频繁打交道,这个过程必然涉及彼此之间的合作与协调,而如何解决合作与协调问题,是这个社会运行的基础——决定了这个社会能否顺畅的运行。 该书在开始探讨博弈论前向我们抛出这两个问题,用意十分明显——能否深刻的认识协调与合作问题,是我们掌握后续博弈论知识的前提和基础。为什么这样说呢?因为特定的博弈论是以特定的社会作为载体的——也就是说关于

博弈论的一切讨论都是以一个特定的社会为背景展开的。因此,在揭开博弈论的神秘面纱前,搞懂这个特定的社会是如何运行的将是必要的,这让我们能够更好的去理解和接受后续的博弈理论。可以说,这本书的结构安排对一个博弈论领域的小白是十分友好的,很适合初学者阅读。 当然仅仅讨论载体是远远不够。载体——特定的社会、主体——博弈的双方、以及两者之间的交互关系——博弈知识,这是博弈论的三大构成部分,它们一起组成一套完整的知识理论体系。 书中把博弈论主体定义为:理性人——有限理性的人。 所谓理性人,就是在给定的条件下,总是追求自身利益的最大化。用张维迎的话说,便是“可以为了追求自己的利益做出最好的选择”。虽然在现实世界中不可能存在完全理性的人——理性人是不现实的。然而理性人假设的存在却是有一定道理的:张维迎的解释是“人都是趋

电大 《经济学与生活》第2次平时作业答案

电大《经济学与生活》第2次平时作业答案 一、配伍题(将名词解释的标号填在名词前的括号里。每小题1分,共10分) (B)1.总效用 (C)2.边际效用 (A)3.收入效应 (D)4.替代效应 (H)5.二级价格歧视 (F)6.纳什均衡 (E)7.博弈论 (I)8.三级价格歧视 (G)9.边际效用递减规律 (J)10.巿场失灵 A.由于商品价格变动而引起的消费者实际收入的变动对需求数量产生的影响。 B.消费者在一定时间内消费一定数量商品或服务所带来的满足程度的总和。 C.在一定时间内消费者增加一个单位商品或服务所带来的新增效用。 D.指商品价格的变动而引起的相对产品价格变化对商品需求数量产生的影响。 E.研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。 F.所有参与人最优策略组成的策略组合 G.一个人连续消费某种物品时,随着所消费的该物品的数量增加,其总效用虽然相应增加,但物品的边际效用有递减的趋势。 H.即垄断厂商了解消费者的需求曲线,把这种需求曲线分为不同段,根据不同购买量,确定不同价格,垄断者获得一部分而不是全部买主的消费剩余。

I.垄断厂商对不同市场的不同消费者实行不同的价格,在实行高价格的市场上获得超额利润。 J.指巿场无法有效率地分配商品和劳务的情况。 1.消费者从物品与劳务的消费中得到的满足程度称为(B)。 A.欲望B.效用 C.边际效用 D.偏好2.某人愿意用20元买第一件衬衫,愿意用35元买头二件衬衫。第二件衬衫的边际效用是(C)。 A.55 B.35 C.15 D.27.5 3.同一条无差异曲线上的不同点表示(B)。 A.效用水平相同,所消费的两种商品组合比例也相同 B.效用水平相同,所消费的两种商品组合比例不同 C.效用水平不同,所消费的两种商品组合比例也不同 D.效用水平不同,所消费的两种商品组合比例也相同 4.在消费者收入与商品价格既定条件下,消费者所能购买到的两种商品数量的最大组合的线叫做(B)。 A.无差异曲线B.消费者预算约束线 C.等产量线 D.企业预算线 5.消费者剩余是消费者的(B)。 A.实际所得B.主观感觉

《博弈与社会》第4次作业

《博弈与社会》第4次作业 (北京航空航天大学校级通识课程 2017年春季学期) 姓名: 学号: 成绩: 1. 考虑以下的道德风险 (moral hazard) 问题。代理人 (agent) 有3种可能的“努力程度”: {}123,,e e e e ∈ 而委托人 (principal) 可能获得两种不同的结果:10H π=或者0L π=。代理人选择的努力程度不能完全决定委托人获得的结果,但是对于委托人获得的结果具有依概率的影响: {}123 23,12,13,H e e Prob e e e e e π====????? 当然,代理人选择不同的努力程度,也要承担不同的“努力成本 (相当于‘负效用’)”: ()123 5843,e e g e e e e e ====????? 假设当代理人获得一笔确定的收入w 时,他因此获得的效用是: ( )u w = 而如果代理人面对不确定性的收入,则其效用函数具有von Neumann-Morgenstern 期望效用函数的形式。也就是,如果代理人以概率分布()12,, ,m p p p p =获得收入()12,,,m w w w w =, 其中[]0,1i p ∈表示代理人获得收入i w 的概率,满足: 11m i i p ==∑ 那么代理人获得的效用是: 11m m i i A i i U p u p ====∑∑ (结合代理人的确定性效用函数,这也意味着代理人是“风险厌恶型的”) 相对于代理人,委托人来自不确定性收入的效用函数相对简单,等于各种情况之下收入的加权平均:

1m i P i i U p π==∑ 假设: (a) 委托人可以设计并向代理人提供一个工资合同,而代理人只能选择接受或者不接受 (take it or leave it)。 (b) 如果委托人可以观察到代理人的努力程度,则工资可以直接联系努力程度,()w w e =;否则,工资只能联系“业绩”,() w w π=。 (c) 委托人和代理人都需要最大化自己的效用,代理人只接受能够向其提供非负的期望效用水平的合同。 (1) 如果委托人可以直接观察到 (并且证实) 代理人的努力水平,委托人应该提供怎样的工资合同 (2分)?这时委托人能够获得的期望利润是多少 (1分)? 解: (2) 如果委托人不能直接观察到 (或者不能证实) 代理人的努力水平,证明代理人的努力程度2e 是不可实现的 (2分)? 解:

博弈论第2次作业

第2次作业 1.在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。 给定企业1的产量q1,企业2和企业3的最优化问题分别为 ()23210m ax 2q c q q q a q ----≥, ()33210m ax 3q c q q q a q ----≥从而得到企业2和企 业3的最优反应函数为q 2=231q q c a ---,q 3=2 21q q c a ---,联立得纳什均衡为:q N 2=31q c a --,q N 3=3 1q c a --.给定企业2和企业3的最优反应,企业1的最优化问题为:()13210m ax 1q c q q q a N N q ----≥,由此得企业1的最优产量为 2 c a -,q 2=q 3=6 c a - 2、两个寡头企业进行价格竞争博弈,企业1的利润函数是q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1的价格,q 是企业2的价格。 求: (1)两个企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡; (4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决策?

(1):(a b-c ,b ) (2):(a b-c ,b ) (3):(a 2/2+ab-c ,a/2+b ) (4):a<0,b>-a/2,c

博弈论作业

课程名称:信息经济学与博弈论课程编号:SX0071F23 课程类型:非学位课考核方式:考查 学科专业:管理科学与工程年级:2014 级姓名:学号:10076140185 河北工程大学2014 ~ 2015学年第2学期研究生课程论文报告 基于GA一RL的进化博弈求解主从博弈结构的供应链协调问题摘要:供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构,理论求解主从博弈问题就变得困难。因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分别设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径。 关键词:供应链协调;进化博弈论;强化学习(RL);遗传算法(GA) Coordinating supply chain of Stackelberg game model based on evolutionary game with GA一RL Abstract: Problems of coordinating supply chain are based on Stackelberg game model, but if research object is complex supply chain, it is difficult to find equilibrium of Stackelberg game ,so evolutionary Game theory was introduced. According to characteristics of leaders and followers in Stackelberg game model, learning Meehan is designed for each Player respectively. An algorithm of reinforcement learning combined with genetic searching is proposed for leaders, and a learning model of best一reply is designed for followers(retailers). Keywords: supply chain coordination; evolutionary game theory; reinforcement learning(RL);genetic algorithm(GA) 1引言 供应链协调问题是研究如何订立协调机制使分散控制的供应链中个体与整体之间的目标一致,解决供应链中企业个体自身的优化目标与供应链整体的最优解相冲突的状况。目前关于不同协调机制研究可以分为以下几类,一类是根据数量给予价格折扣,如根据经销商的销售量给予目标折扣(Sale re-bate)的问题[1],根据订货量给予线性折扣(Quantity discount)的问题[2];第二类是根据

《博弈与社会》第2次作业 (参考答案)

《博弈与社会》第2次作业 (北京航空航天大学校级通识课程 2017年春季学期) (参考答案) 1. 有两个国家,记为()1,2i ∈。每一个国家有一家厂商,生产的产品可以同时供给两个国家 (给定利润大于0)。劳动是唯一的生产要素,在任何一个国家i ,厂商i 的生产函数是: i i q L = 其中,i L 表示i 国就业量。i 国产品需求函数是: i i p a Q =- 其中,i p 表示i 国产品价格,i Q 表示i 国市场产品销售数量。每一个国家存在一个工会,该工会可以完全决定本国的工资水平。在任何一个国家i ,工会i 的目标函数是: ()i i i i U w w L =-? 其中,i w 表示i 国工资水平,i w 表示i 国劳动者的“保留工资”(可以理解为失业保障,或者劳动者另谋职业可以获得的收入),也就是,如果不能获得不少于这一水平的工资,i 国劳动者将选择不就业。在任何一个国家,工会先决定本国工资水平,厂商再决定最优的产量 (假设厂商的目标是最大化利润)。 (1) 在0t =时期,两国的产品关税都非常高,以至于完全没有国际贸易。求这时每个国家的就业量i L 、工资水平i w 、厂商利润i π和工会收益i U (4分)。 解: 对于()1,2i ?∈:在第1阶段,公会决定工资水平i w ,最大化i U ;在第2阶段,厂商决定生产产品的数量i Q 和雇佣劳动的数量i L ,最大化利润i π。用反向归纳的方法求解。 在第2阶段,给定工资水平i w ,厂商最大化问题是: () max i i i i i i i L p Q L w L π=?-?

()()i i i i i a Q Q L w L =--? () i i i i a L L w L =--? 可以得到该最大化问题的一阶 (必要) 条件 (F.O.C.): ()() 2i i i L w a w *=- 在第1阶段,工会的最大化问题是: ()max i i i i i w U w w L =-? 工会在决定工资水平时,会预期到厂商在第2阶段的生产决策 (和劳动雇佣决策) 依赖于工资水平。将()()2i i i L w a w *=-带入工会的目标函数,工会的最大化问题转换成: ()()max 2i i i i i w U w w a w =--? 可以得到该最大化问题的一阶 (必要) 条件 (F.O.C.): () 2i i w a w *=+ 带入相关表达式,可以得到就业量: ()()24i i i L a w a w ** =-=- 产品产量: ()4i i i Q L a w **==- 产品价格: ()34i i i p a Q a w **=-=+ 厂商利润: i i i i i p Q w L π*****=?-? ()()()()3168i i i i a w a w a w a w =+--+- ()216i a w =-

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论作业上课用

1.可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; (4)如果双方都涨价,可口可乐利润140,百事可乐利润35; 请写出博弈的战略式表述并求出纳什均衡。 2. 北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一博弈用战略式表述方式加以表示。 (2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 3. 设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:

(1 )有哪些结果是纳什均衡? (2)两厂商合作的结果是什么? 4. 根据两人博弈的损益矩阵回答问题: 甲 乙 左 右 上 下 (1)写出两人各自的全部策略。 (2 )找出该博弈的全部纯策略纳什均衡。 (3)求出该博弈的混合策略纳什均衡。 5.求出下面博弈的纳什均衡(含纯策略和混合策略)。 甲 乙 L R U D 6.企业甲和企业乙是两家彩电制造商,都可以选择生产低档产品和高档产品,每个企业在不同情况下的利润如以下支付矩阵所示,如果企业甲先于企业乙进行产品选择并投入生产,即企业乙在决定生产时已经知道企业甲的选择,而且这一点双方都清楚。 (1)用扩展式表述表示这一博弈。

经济博弈论第1次作业

博弈论第1次作业 1、两个人分4只乒乓球,每个人同时独立地提出自己想得到的球数。设参与人1想得到s 1只,参与人2想得到s 2只球,分配的规则是:如果s 1 + s 2 ≤4,那么每个参与人均能得到自己想要的数量;如果s 1 + s 2 >4,那么两个参与人什么也得不到。 (1)写出参与人1,2的战略空间S 1,S 2; (2)画出该博弈的双变量收益矩阵; (3)用划线法找出该博弈的全部纯战略纳什均衡。 2、精神病医生A 、B 同时在一条很长的公路边选择各自的诊所位置,这条公路用从0到1的区间表示。公路0到1/4这个区间属于俄勒冈州,从1/4到1这个区间属于加利福尼亚州。医生A (参与人1)同时拥有俄勒冈州和加利福尼亚州的行医执照,而医生B (参与人2)只有俄勒冈州的行医执照。假设病人沿这条公路是均匀分布的,每个病人都就近看病,每个医生的收益就是到他诊所就诊的病人比例。设医生A (参与人1)的战略空间(选择诊所的位置)为{}10,1/8,1/4,3/8,1/2,5/8,3/4,7/8,1 S =;医生B (参与人2)的战略空间为{}20,1/8,1/4S =。 (1) 试画出博弈的双变量收益矩阵; (2) 利用划线法找出该博弈的纯战略纳什均衡。 3、在下图所示的战略式表述的博弈中,有没有占优战略均衡?有没有重复剔除严格劣战略的占优均衡?有没有纳什均衡?如果有,请写出相应的均衡。 参与人2 参与人1 L M R U M D 4、下图是两人博弈的战略式表述形式,其中参与人1的战略空间S 1={U,D},参与人2的战略空间S 2={L,R}。

参与人2 L M 参与人1 U D 这里a ,b ,c ,d ,e ,f ,g ,h 为参数。 (1) 设S*=(U,L )是此博弈的严格占优战略均衡,问:上述参数之间应满 足哪些条件? (2) 设S*=(U,R )是此博弈的重复剔除严格劣战略的占优均衡,问:上述 参数之间应满足哪些条件?(用两种剔除顺序讨论) (3) 设S*=(D ,R )是此博弈的纳什均衡,问:上述参数之间应满足哪些 条件? (4) 设S 1*=(U ,L )和S 2*=(D ,R )是此博弈的纳什均衡,问:上述参数 之间应满足哪些条件?这时两个参与人有无严格劣战略? 5、求下图所示战略式表述的博弈的混合战略纳什均衡。 参与人2 L R 参与人1 U D 6 B A L R U D 7、A 、B A 企业可以获得18万元利润,B 企业可以获得10万元利润;若A 企业做广告,B 企业不做广告,A 企业可以获得30万元利润,B 企业可以获得4万元利润;若A 企业不做广告,B 企业做广告,A 企业可以获得13万元利润,B 企业可以获得16万元利润;若A 、B 两企业都不做广告,A 企业可以获得35万元利润,B 企业可以获得8万元利润。 试求:(1)画出A 、B 企业的支付矩阵。(2)求出该博弈的纯策略纳什均衡。 8、两个厂商生产一种完全同质的商品,该商品的市场需求函数为P Q -=100,设厂商1和厂商2都没有固定成本。若他们在相互知道对方边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。问这两个厂商的边际成本各是多少?各自的利润是多少?

2006年《博弈与社会》期中考试试题

2006年《博弈与社会》期中考试试题 考试时间:1.5小时请在答题纸上做答,本试题纸不需交回! 1.根据两人博弈的支付矩阵回答问题: A B (1)6分) (2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效, 以及Kaldor-Hicks有效?(7分) (3)求出该博弈的混合策略纳什均衡。(7分) (1)策略 甲:AB 乙:ab 博弈树(草图如下:没打虚线的说明没认真听习题课,扣扣扣,哈哈) (2)Pure NE (A, a); (B, b) 都是Pareto有效,仅(B, b)是K-H有效。(还在用支付表示NE的,扣扣扣)(3)Mixed NE ((2/5, 3/5); (2/3, 1/3)) 2.受物流成本的限制,中低档啤酒市场往往呈现出一定的地区垄断性,只有在本地开设工厂才能分享当地市场。假设北京地区人们对啤酒的需求函数为P(Q)=9-Q,Q为市场上啤酒的总供给。而市场只有一家啤酒生产商(用“燕京啤酒”表示),其成本函数为C(q1)=2q1,q1为其产量。现有另外一家啤酒厂商(用“青岛啤酒”表示)希望进入北京市场,一旦进入市场,其成本函数为,C(q1)=q1, q2为其产量,可以看出青啤生产成本更低。青岛啤酒进入市场的时候面临一个一次性的进入成本F(可以理解为开设工厂的成本)。 这样一个市场进入博弈分为两期:第一期青岛啤酒决定是否进入市场,如果不进入,燕京啤酒在第二期处于垄断地位,而如果进入,二者在第二期进行一个同时决策的产量竞争。不考虑贴现的问题,回答下面的问题: (1)求青岛啤酒选择不进入的时候,燕京啤酒的产量和利润(5分) (2)求青岛啤酒选择进入的时候,燕京啤酒的产量和利润(8分) (3)讨论F在不同取值下市场的纳什均衡(7分)

博弈与社会第五次作业答案

博弈与社会第五次作业(答案) 第1题 旧车市场中由于买卖双方信息不对称,造成“劣车驱逐良车”的市场失灵。解决这类逆向选择问题的一种方式是信息优势一方(卖者)发送信号(signaling ),高质量车的车主通过主动提供一定年限保修的做法让自己被买主识别出来,从而与低质量车的卖主区分开。这种机制可以实施的前提是为不同质量的车提供保修的成本是不同的,在这一前提下,还可以通过一种方向相反的机制解决这个问题,那就是信息劣势一方的甄别机制(screening )。 考虑一种简单的情况,旧车的质量只有两种,高质量旧车和低质量旧车,卖主清楚汽车的质量,但买主一无所知。为两种旧车提供保修的成本是不同的,高质量的旧车由于需要售后维修的概率更小,因此提供保修的成本更低。假设买者可以公开向市场“招标”,看到买者的采购条件,卖主可以自行决定是否将自己的车卖给买主,一旦将车卖给买主,卖主必须遵守采购协议的要求。买方提出的采购协议主要包括两方面的规定,一个是价格,一个是保修年限。根据博弈论的知识我们知道,制订一个合理的“价格-保修年限”的组合能够有效的从市场上选出高质量的旧车,看下图回答问题,平面的点表示买主提出的“价格-保修年限”组合,两条曲线分别代表不同质量车卖者的无差异曲线: (1)粗线和细线各代表那种车卖主的无差异曲线?为什么? 粗线代表低质量的车主,因为车坏的概率比较高,提供单位年限保修的成本更高,也就是说更陡峭 (2)如果买主的采购条件落在A 、B 、C 、D 四个区域内,分别会出现什么样的结果?哪个区域是买主的有效甄别区域?为什么? A 两种车主都会卖 B 只有低质量的车主会卖 C 只有高质量的车主会卖——有效甄别区域 D 都不会卖 第2题 401宿舍的四位同学赵、钱、孙和李在领到奖学金后面临着两个选择,集体买一台洗衣机或者买一台电冰箱,难以取舍时大家决定分别写出洗衣机和电冰箱对自己的价值, 然后将

《博弈与社会》读后感

竭诚为您提供优质的服务,优质的文档,谢谢阅读/双击去除 《博弈与社会》读后感 《博弈与社会》读后感 原创:何徐任 《博弈与社会》这本书是大二时教授《经济学原理》的老师推荐的,老师曾无数次在课堂上提起过“博弈论”这个概念,对于这个概念我的初步认识是:博弈论的全称是“非合作博弈理论”——这是我从百度百科中得到的。“非合作博弈理论”?!在我第一次接触到这个概念时,不自觉的在心里默念了好多遍,说实话,心里充满了不解——难道博弈论是在讨论如何不合作吗?带着这个疑惑,我开始看起了《博弈与社会》这本书,从书中寻求解释。 该书开篇便向我们抛出了两个问题——协调问题与合作问题。 张维迎说:“人是群居动物,群体人具有社会属性”。这个不难理

解,毕竟人类在历史长河中从来都不是具有“个体优势”的生物,为了生存我们不得不选择聚集在一起——生活在“社会”中而不是“孤岛”里,这也让生活在其中的我们无法“独善其身”。简单地说,即你的“所思所想”不仅仅取决于自己还会受到群体的影响;你的“所作所为”不仅影响自己还有他人——这就是我们的“社会属性”。 人的社会属性意味着生活在群体中的个体将不得不与其他人频繁打交道,这个过程必然涉及彼此之间的合作与协调,而如何解决合作与协调问题,是这个社会运行的基础——决定了这个社会能否顺畅的运行。 该书在开始探讨博弈论前向我们抛出这两个问题,用意十分明显——能否深刻的认识协调与合作问题,是我们掌握后续博弈论知识的前提和基础。为什么这样说呢?因为特定的博弈论是以特定的社会作为载体的——也就是说关于博弈论的一切讨论都是以一个特定的社会为背景展开的。因此,在揭开博弈论的神秘面纱前,搞懂这个特定的社会是如何运行的将是必要的,这让我们能够更好的去理解和接受后续的博弈理论。可以说,这本书的结构安排对一个博弈论领域的小白是十分友好的,很适合初学者阅读。 当然仅仅讨论载体是远远不够。载体——特定的社会、主体——博弈的双方、以及两者之间的交互关系——博弈知识,这是博弈论的

本科博弈论2014年第二次作业

Homework two Note: 1. You can write in Chinese or English, printed or hand written. 2. No late homework will be accepted. Please staple your homework and write your name and ID number on the cover. 3.The deadline is Nov.12. 1) 5.4 Splitting Pizza: You and a friend are in an Italian restaurant, and the owner offers both of you a free eight-slice pizza under the following condition. Each of you must simultaneously announce how many slices you would like; that is, each player i ∈{1, 2} names his desired amount of pizza, 0 ≤si≤8. If s1+ s2 ≤8 then the players get their demands (and the owner eats any leftover slices). If s1+ s2 > 8, then the players get nothing. Assume that you each care only about how much pizza you individually consume, and the more the better. a. Write out or graph each player’s best-response correspondence. b. What outcomes can be supported as pure-strategy Nash equilibria? 2) 5.9 Tragedy of the Roommates: You and your n ? 1 roommates each have five hours of free time you could spend cleaning your apartment. You all dislike cleaning, but you all like having a clean apartment: each person’s payoff is the total hours spent (by everyone) cleaning, minus a number c times the hours spent (individually) cleaning. That is, vi(s1, s2, . . . , sn)=?c . si+ n j=1sj . Assume everyone chooses simultaneously how much time to spend cleaning. a. Find the Nash equilibrium if c < 1. b. Find the Nash equilibrium if c > 1. c. Set n = 5 and c = 2. Is the Nash equilibrium Pareto efficient? If not,can you find an outcome in which everyone is better off than in the Nash equilibrium outcome? 3) 5.16 Hotelling’s Price Competition: Imagine a continuu m of potential buyers, located on the line segment [0, 1], with uniform distribution. (Hence the “mass” or quantity of buyers in the interval [a, b] is equal to b ? a.) Imagine two firms, players 1 and 2, who are located at each end of the interval (player 1 at the 0 point and player 2 at the 1 point). Each player i can choose its price pi , and each customer goes to the vendor who offers him the highest value. However, price alone does not determine the value; distance is important as well. In particular each buyer who buys the product from player i has a net value of v ? pi? di , where di is the distance between the buyer and vendor i and represents the transportation costs of buying from vendor i. Thus buyer a ∈[0, 1] buys from 1 and not 2 if v ? p1? d1>v ? p2 ? d2 and if buying is better than getting zero. (Here d1 = a and d2 = 1? a. The buying choice would be reversed if the inequality were reversed.) Finally, assume that the

相关文档
相关文档 最新文档