博弈论第二次作业
1. 一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况是双方都知道的。请问
(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博弈并作简单分析。
(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示并简单分析。
2. 博弈方1和博弈方2就如何分10 000万元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额000 10,0 ,2121≤≤s s s s 和。如果000 1021≤+s s ,则两博弈方的要求都得到满足,即分别得21s s 和,但如果000 1021>+s s ,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额,为什么?
3. 两个企业1、2各有一个工作空缺,企业i 的工资为i w ,并且1212)2/1(w w w <<。设有两个工人同时决定申请这两个企业的工作,规定每个工人只能申请一份工作,如果一个企业的工作只有一个工人申请,该工人肯定得到这份工作,但如果一个企业的工作同时有两个工人申请,则企业无偏向地随机选择一个工人,另一个工人则会因为错过向另一个企业申请的时机而失业(这时收益为0)。该博弈的纳什均衡是什么?该博弈的结果有多少种可能,各自的概率是什么?
4. 考虑如下的双寡头市场战略投资模型:企业1和企业2目前情况下的单位生产成本都是2=c 。企业1可以引进一项新技术使单位成本降低到1=c ,该项技术需要投资f 。在企业1做出是否投资的决策(企业2可以观察到)后,两个企业同时选择产量。假设市场需求函数为q q p ?=14)(,其中p 是市场价格,q 是两个企业的总产量。问上述投资额f 处于什么水平时,企业1会选择引进新技术?
5. 两个兄弟分一块冰激凌。哥哥先提出一个分割比例,弟弟可以接受或拒绝,接受则按
哥哥的提议分割,若拒绝就自己提出一个比例。但这时候冰激凌化得只剩1/2了。对弟弟提议的比例哥哥也可以选择接受或拒绝,若接受则按弟弟的提议分割,若拒绝冰激凌会全部化光。因为兄弟之间不应该做损人不利己的事,因此我们假设接受和拒绝利益相同时兄弟俩都会接受。求该博弈的子博弈完美纳什均衡。如果冰激凌每阶段只化掉1/3,博弈的子博弈完美纳什均衡是什么?
第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2 《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。 三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b 博弈论作业 博弈论作业 一、 下面的得益矩阵表示博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 博弈方 2 L C R 博 弈 T 方 M 1 B 答:此博弈有两个纳什均衡:1、ML 得益(3,4) 2、TR 得益(4,2) 二、 求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡与得益。 博弈方 2 L R 博弈 T 方 B 1 答:(一)求混合策略均衡 1、博弈方1的概率P 则对博弈方2而言,有 1×P +2(1-P )=2×P +0(1-P ) 2-P =2P P =2/3 当P ﹤2/3,2-P ﹥2P ,则q ﹡=1是最合适的策略,即选择L 。 当P =2/3,2-P =2P ,则q ﹡∈(0,1)是最适合反应。 当P ﹥2/3,2-P ﹤2P ,则q ﹡=0是最适合策略,即选择R 。 2、给定博弈方2的概率q 则对博弈方1而言,有 2×q +0(1-q )=1×q +3(1-q ) 2q =3-2q q =3/4 当q ﹤3/4,2q ﹤3-2q ,则P ﹡=0是最合适的策略,即选择B 。 当q =3/4,2q =3-2q ,则P ﹡∈(0,1)是最适合反应。 当q﹥3/4,2q﹥3-2q,则P﹡=1是最适合策略,即选择T。 所以: 混合策略的均衡点为(2/3,3/4)。 (二)得益: ∪1=2×P×q+0×P×(1-q)+1×(1-P)×q +3(1-P)(1-q) =2×2/3×3/4+1×1/3×3/4+3×1/3×1/4 =3/2 ∪2=1×P×q+2×P×(1-q)+2×(1-P)×q +0(1-P)(1-q) =1×2/3×3/4+2×2/3×1/4+2×1/3×3/4 =4/3 三、设一四阶段两博弈方之间的动态博弈如下图所示。试找出全部子博弈, 求子博弈完美纳什均衡策略组合和博弈的结果。 答:依据逆推归纳法得出:此博弈均衡为b,得益(5,3); 路径为b, d, e, h。 四、两次重复下面的得益矩阵表示的静态博弈。设计一个处罚策略。 博弈方 2 L R S 博 弈 T 方 M 1 B 《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益 关于中国城市交通拥堵的博弈论分析 随着现代化发展和人民生活水平提高,城市马路上车流量越来越大,人们出行时感觉拥堵。公共交通优先发展是城市交通问题获得解决的有效举措,也是城市交通实现可持续发展的内在要求。目前我国很多城市相继出台和实施了多元化的优惠公交政策,鼓励公交优先发展。 博弈论是研究互动环境下具有竞争或对抗性质的博弈行为的理论和方法。博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到了广泛的应用。博弈论研究的问题是,给定信息结构下,决策主体的决策如何使自己的效用最大化,并可以在其他决策主体中取得均衡。一个基本博弈由博弈三要素构成,即决策主体,策略集及效用。其中,决策主体是指参与人或局中人;策略集,即信息结构,是决策主体可以选择策略及行动的范围;效用,即偏好或支付函数,是指可以被量化的决策主体的利益。 在城市交通中,车辆与车辆之间、车辆与行人之间以及行人与警察之间,每天不间断地发生着竞争、互动和选择。可以说,在城市交通过程中,无时无刻不存在着博弈。用博弈论来分析城市交通问题,可使我们对身边的交通现象有更深的感悟和理解。 在城市交通博弈过程中,所对应的基本要素可理解如下: 局中人:各种交通参与者,包括机动车、非机动车、行人。 策略:出行时,采用什么出行方式是其策略,步行、骑自行车、乘公交车、自驾车等;交通过程中,遵守或不遵守交通法规也是其策略。局中人在不同的博弈中会有不同的策略。 得失:不同的出行方式,会有不同的成本和收益,出行者一般只会考虑到自己在选择某种交通方式时将要付出的成本,而不会考虑到自己的出行会给其他人带来什么影响;交通过程中,遵守或不遵守交通法规也会有不同的得失。 最后得出博弈的结果——不同的博弈会有不同的结果。 我们可以试着以博弈论的视角分析拥堵问题: 囚徒困境模型分析。囚徒困境是指两个被捕的囚徒之间的一种博弈,解释了为什么合作对双方都有利时,保持合作也是困难的,具体内容如下。警方逮捕了甲、乙两名嫌疑犯,但没有足够的证据证明二人有罪。于是警方分开囚禁两名嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证指证对方犯罪(即背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(即双方合作),则二人同样判监1年。若二人都互相背叛,则二人分别判监8年 从上图的四种行动选择组合中,我们可以看出(沉默、沉默)是帕累托最优的,“背叛”是任一犯罪嫌疑人的占优战略,而(背叛、背叛)是一个占优战略均衡。 囚徒困境模型属于博弈论中的非零和博弈,表明个人最佳选择并非团体最佳选择。城市交通拥堵问题的本质是“公共地悲剧”。在共享公有物的社会中,每个人,也就是所有人都追求各自的最大利益,这就是悲剧的所在。因为对公共资源的无限制和过度使用,必然会给所有人带来毁灭。在城市交通领域,由于私人小汽车无限制的发展,造成了整个城市,特别是 博弈论基础作业及答案Last revision on 21 December 2020 博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。 课程名称:信息经济学与博弈论课程编号:SX0071F23 课程类型:非学位课考核方式:考查 学科专业:管理科学与工程年级:2014 级姓名:学号:10076140185 河北工程大学2014 ~ 2015学年第2学期研究生课程论文报告 基于GA一RL的进化博弈求解主从博弈结构的供应链协调问题摘要:供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构,理论求解主从博弈问题就变得困难。因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分别设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径。 关键词:供应链协调;进化博弈论;强化学习(RL);遗传算法(GA) Coordinating supply chain of Stackelberg game model based on evolutionary game with GA一RL Abstract: Problems of coordinating supply chain are based on Stackelberg game model, but if research object is complex supply chain, it is difficult to find equilibrium of Stackelberg game ,so evolutionary Game theory was introduced. According to characteristics of leaders and followers in Stackelberg game model, learning Meehan is designed for each Player respectively. An algorithm of reinforcement learning combined with genetic searching is proposed for leaders, and a learning model of best一reply is designed for followers(retailers). Keywords: supply chain coordination; evolutionary game theory; reinforcement learning(RL);genetic algorithm(GA) 1引言 供应链协调问题是研究如何订立协调机制使分散控制的供应链中个体与整体之间的目标一致,解决供应链中企业个体自身的优化目标与供应链整体的最优解相冲突的状况。目前关于不同协调机制研究可以分为以下几类,一类是根据数量给予价格折扣,如根据经销商的销售量给予目标折扣(Sale re-bate)的问题[1],根据订货量给予线性折扣(Quantity discount)的问题[2];第二类是根据 电大《经济学与生活》第2次平时作业答案 一、配伍题(将名词解释的标号填在名词前的括号里。每小题1分,共10分) (B)1.总效用 (C)2.边际效用 (A)3.收入效应 (D)4.替代效应 (H)5.二级价格歧视 (F)6.纳什均衡 (E)7.博弈论 (I)8.三级价格歧视 (G)9.边际效用递减规律 (J)10.巿场失灵 A.由于商品价格变动而引起的消费者实际收入的变动对需求数量产生的影响。 B.消费者在一定时间内消费一定数量商品或服务所带来的满足程度的总和。 C.在一定时间内消费者增加一个单位商品或服务所带来的新增效用。 D.指商品价格的变动而引起的相对产品价格变化对商品需求数量产生的影响。 E.研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。 F.所有参与人最优策略组成的策略组合 G.一个人连续消费某种物品时,随着所消费的该物品的数量增加,其总效用虽然相应增加,但物品的边际效用有递减的趋势。 H.即垄断厂商了解消费者的需求曲线,把这种需求曲线分为不同段,根据不同购买量,确定不同价格,垄断者获得一部分而不是全部买主的消费剩余。 I.垄断厂商对不同市场的不同消费者实行不同的价格,在实行高价格的市场上获得超额利润。 J.指巿场无法有效率地分配商品和劳务的情况。 1.消费者从物品与劳务的消费中得到的满足程度称为(B)。 A.欲望B.效用 C.边际效用 D.偏好2.某人愿意用20元买第一件衬衫,愿意用35元买头二件衬衫。第二件衬衫的边际效用是(C)。 A.55 B.35 C.15 D.27.5 3.同一条无差异曲线上的不同点表示(B)。 A.效用水平相同,所消费的两种商品组合比例也相同 B.效用水平相同,所消费的两种商品组合比例不同 C.效用水平不同,所消费的两种商品组合比例也不同 D.效用水平不同,所消费的两种商品组合比例也相同 4.在消费者收入与商品价格既定条件下,消费者所能购买到的两种商品数量的最大组合的线叫做(B)。 A.无差异曲线B.消费者预算约束线 C.等产量线 D.企业预算线 5.消费者剩余是消费者的(B)。 A.实际所得B.主观感觉 博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。 第2次作业 1.在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。 给定企业1的产量q1,企业2和企业3的最优化问题分别为 ()23210m ax 2q c q q q a q ----≥, ()33210m ax 3q c q q q a q ----≥从而得到企业2和企 业3的最优反应函数为q 2=231q q c a ---,q 3=2 21q q c a ---,联立得纳什均衡为:q N 2=31q c a --,q N 3=3 1q c a --.给定企业2和企业3的最优反应,企业1的最优化问题为:()13210m ax 1q c q q q a N N q ----≥,由此得企业1的最优产量为 2 c a -,q 2=q 3=6 c a - 2、两个寡头企业进行价格竞争博弈,企业1的利润函数是q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1的价格,q 是企业2的价格。 求: (1)两个企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡; (4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决策?博弈论期末习题
博弈论作业
《经济博弈论》期末考试复习
博弈论作业
博弈论基础作业及答案
博弈论作业
电大 《经济学与生活》第2次平时作业答案
博弈论基础作业及答案
博弈论第2次作业