文档库 最新最全的文档下载
当前位置:文档库 › 博弈论判断题

博弈论判断题

博弈论判断题
博弈论判断题

博弈论

一、判断题

1. 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√)

2. 子博弈精炼纳什均衡不是一个纳什均衡。(×)

3. 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。(×)

4. 博弈中知道越多的一方越有利。(×)

5. 纳什均衡一定是上策均衡。(×)

6. 上策均衡一定是纳什均衡。(√)

7. 在一个博弈中只可能存在一个纳什均衡。(×)

8. 在一个博弈中博弈方可以有很多个。(√)

9. 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√)

10. 在博弈中纳什均衡是博弈双方能获得的最好结果。(×)

11. 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)

12. 上策均衡是帕累托最优的均衡。(×)

13. 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。(×)

14. 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)

15. 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。(√)

16. 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。(×)

17. 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合(√)

18. 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√)

19. 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√)

20. 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

21. 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。(√)(或:零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。(×))

22. 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。(√)

23. 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。(√)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(×))

24. 根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。(√)

25. 如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。(√)

26. 逆向归纳法并不能排除所有不可置信的威胁。(√)

27. 单人博弈就是个人最优化决策,与典型的博弈问题有本质区别。(√)

28. 博弈方的策略空间必须是数量空间,博弈的结果必须是数量或者能够数量化。(×)

29. 多人博弈中的“破坏者”会对所有博弈方的利益产生不利影响。(×)

30. 合作博弈就是博弈方采取相互合作态度的博弈。(×)

31. 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(×)

32. 如果一博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。(√)

33. 纯策略纳什均衡和混合策略纳什均衡都不一定存在。(×)

34. 上策均衡一定是帕累托最优的均衡。(×)

35. 在动态博弈中,因为后行为的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)

36. 动态博弈本身也是自己的子博弈之一。(×)

37. 逆推归纳法并不能排除所有不可置信的威胁。(×)

38. 如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,就是该动态博弈的一个子博弈完美纳什均衡。(√)

39. 颤抖手均衡与第二章的风险上策均衡都是在有风险和不确定性情况下的稳定性策略组合,因此它们本质上是一样的。(×)

40. 有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。(×)

41. 有限次重复博弈的子博弈完美纳什均衡的晟后一次重复必定是原博弈的--个纳什均衡。(√)

42. 无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。(×)

43. 无限次重复古诺产最博弈不一定会出现台谋生产垄断产世的现象。(√)

44. 如果博弈重复无限次或每次结束的概率足够小,而得益的时间贴现率占充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。(√)

45. 触发策略所构成的均衡都是子博弈完美纳什均衡。(×)

46. 每个有限理性进化博弈的ESS,都对应完全理性博弈问题的一个纳什均衡。(√)

47. 静态博弈的所有纯策略纳什均衡都是进化博弈的ESS.(×)

48. 一个复制动态的ESS就是这样的博弈均衡:复制动态会趋向它,少数博弈方的错误不会毁掉它。(√)

49. 如果一种策略或策略组合是一个ESS,那么进化博弈的动态调整一定会收敛于它。(×)

50. 对一个非对称博弈,如果(X,Y)是一个ESS,那么它必须是一个严格纳什均衡,即每个博弈方的策略都是对其他博弈方策略的惟一最优反应的纳什均衡。(√)

51. 非对称博弈的ESS必须都足纯策略的。(√)

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)

d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i, si*称 为参与人i的严格占优战 略,如果满足: ui(si*,s-i)>ui(si',s- i) ? s-i, ? si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设 s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就 是各参与人在其各自策略集 中,不断剔除严劣策略…如 果最终各参与人仅剩下一个 策略,则该策略组合就被称 为重复剔除严劣策略均衡。

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例一一“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢 “挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方 案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就_ 大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5 号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何? 通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论 教案

《两种常见的博弈论模型》一课教案 审签: 2010 年 4 月 13日 班 级 课程名称 经济学基础 教 师 授课 时间 课 型 授课地点 课 题 项 目 认识完全信息静态博弈、完全信息动态博弈 课 时 任 务 通过学习完全信息静态、动态博弈,认识价格战及搭便车现象。 任务分解 1、知识准备:明确博弈论常见的5种分类及类型。 2、案例举例:囚徒困境、智猪博弈 3、模拟测试:分小组,应用所学独立解决智猪博弈问题。 教学 目标 专业能力 通过学习,能够运用博弈论知识分析解决“双寡头价格战问题”及生活中的搭便车现象。 知识目标 1.掌握博弈论的分类; 2.掌握完全信息静态及完全信息动态博弈论模型; 3.学会运用博弈论知识分析、解决分析价格战、搭便车的问题。 方法能力 1、培养学生的独立思考的能力; 2、培养学生学习博弈论的兴趣及爱好; 2、培养学生的团队合作及逻辑思维能力。 重 点 掌握完全信息静态博弈及其扩展运用。 难 点 运用博弈论知识解决分析价格战等恶性竞争问题及搭便车现象。 课堂练习 小组合作完成完全信息动态博案例—“卖鞭炮的选择” 课后作业 完成课后思考题 教学策略与方法 启发 讲解 任务驱动 多媒体演示 自主 描述 案例 分析 小组 讨论 归纳总结 实践 操作 √ √ √ √ √ √ √ √ 课后回顾 本次课程的优点: 存在的问题: 改进设想:

项目名称:博弈论与决策策略 任务:能够自主分析博弈论的模型并分析解决问题 一教学组织活动总过程设计:1、师生问好2、班长报告人数 老师活动:1、问好2、环顾学生 学生活动:1起立问好2、坐姿端正3、班长清 点人数,向老师报告。 活动达到的目标时间分配 创设情境,使学生注 意力集中,进入学习 状态 1分钟 二课程导入情境导入: 复习旧课,导入新课 以《囚徒困境》博弈论案例视频引入 老师活动: (1)老师引导学生回忆上节 课所学的内容,复习博弈论的五种 基本分类方式及类型。(2)播放关 于囚徒困境的视频,点出其中的重 点,并向学生提问。 学生活动: 跟着老师的思路回 忆上节课所学的内容。 认真观看视频并思考老 师所提问题。 活动达到的 目标: 复习旧课内 容为新课做 铺垫,视频 引入抓住学 生焦点。 时间分 配: 5分钟 三教学过程认识完全信息静态博弈 活动项目一:囚徒困境(11分钟) 1、首先,老师给出囚徒困境的博弈论模型。“囚徒困境模型”:该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑6年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑3年,而坦白者有功被减刑6年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 提问:对于囚犯A而言,他会选择什么样的策略,囚犯B如何呢?(给2分钟时间让学生思考并分析此问题,并让他们尝试通过表格表达出囚犯A及B可能选择的策略及面临的后果) 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑6年。(老师讲解,板书,学生对照自己所写跟老师是否一致) 提问:那么囚徒困境在我们生活中的哪些地方同样存在呢? 补充介绍“囚犯困境”的扩展:双寡头企业价格战、军备竞赛等。 归纳总结完全信息静态博弈的3点特性:(1)同时做出选择;(2)明确对方的选择与游戏规则(共同知识);(3)不管是否沟通过,无法做出有约束力的承诺(非合作)(最好由学生归纳出)

西方经济学课本知识点总结2

西方经济学课本知识点总结2

微观经济学 第一章导论 第二章需求曲线和供给曲线概述以及有关的基本概念 第三章效用论 第四章生产论 第五章成本论 第六章完全竞争市场 第七章不完全竞争市场 第八章生产要素价格决定的需求方面 第九章生产要素价格决定的供给方面 第十章一般均衡和福利经济学 第十一章市场失灵和微观经济政策 第一章导论 1.马歇尔综合及20世纪30年代西方经济学的三次补充 第二章需求曲线和供给曲线概述以及有关的基本概念 1.理性人假设

2.微观经济学的核心思想 3.需求—需求函数—需求表—需求曲线 供给—供给函数—供给表—供给曲线 4.供求定理 5.弹性(定义公式) (1)需求价格弹性:弧弹性—中点公式 点弹性—几何意义特征 不同弹性商品 P变化对P、Q的影响 影响需求价格弹性的因素 (2)扩展: 供给价格弹性 需求交叉价格弹性→替代关系互补关系 需求的收入弹性→正常品劣等品 6. 恩格尔定律 第三章效用论(消费者行为理论) 1.基数效用论 2.偏好的假定无差异曲线 3.商品的边际替代率公式 商品的边际替代率递减规律 4.预算线

5.消费者效用最大化的均衡条件 6.价格—消费曲线→需求曲线 7.收入—消费曲线→恩格尔曲线 8.替代效应收入效应 9.低档品正常品吉芬物品(吉芬难题) 10.不确定性风险 11.期望效用期望值效用 12.消费者风险态度 13.保险 第四章生产论 1.企业的本质 2.短期生产理论:一种可变生产要素的生产函数 边际报酬递减规律 MPL APL TPL关系 短期生产三个阶段 3.长期生产理论:两种可变生产要素的生产函数 边际技术替代率公式 边际技术替代率递减规律 4.等成本线 5.最优的生产要素组合

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

西方经济学课本知识点总结

微观经济学 第一章导论 第二章需求曲线和供给曲线概述以及有关的基本概念 第三章效用论 第四章生产论 第五章成本论 第六章完全竞争市场 第七章不完全竞争市场 第八章生产要素价格决定的需求方面 第九章生产要素价格决定的供给方面 第十章一般均衡和福利经济学 第十一章市场失灵和微观经济政策 第一章导论 1.马歇尔综合及20世纪30年代西方经济学的三次补充 第二章需求曲线和供给曲线概述以及有关的基本概念 1.理性人假设 2.微观经济学的核心思想 3.需求—需求函数—需求表—需求曲线 供给—供给函数—供给表—供给曲线 4.供求定理 5.弹性(定义公式) (1)需求价格弹性:弧弹性—中点公式 点弹性—几何意义特征 不同弹性商品P变化对P、Q的影响 影响需求价格弹性的因素 (2)扩展: 供给价格弹性 需求交叉价格弹性→替代关系互补关系 需求的收入弹性→正常品劣等品 6. 恩格尔定律 第三章效用论(消费者行为理论) 1.基数效用论 2.偏好的假定无差异曲线 3.商品的边际替代率公式 商品的边际替代率递减规律 4.预算线 5.消费者效用最大化的均衡条件 6.价格—消费曲线→需求曲线 7.收入—消费曲线→恩格尔曲线 8.替代效应收入效应 9.低档品正常品吉芬物品(吉芬难题) 10.不确定性风险

11.期望效用期望值效用 12.消费者风险态度 13.保险 第四章生产论 1.企业的本质 2.短期生产理论:一种可变生产要素的生产函数 边际报酬递减规律 MPL APL TPL关系 短期生产三个阶段 3.长期生产理论:两种可变生产要素的生产函数 边际技术替代率公式 边际技术替代率递减规律 4.等成本线 5.最优的生产要素组合 (1)成本既定,产量最大化 产量既定,成本最小化 (2)利润最大化→最有生产要素组合 (3)扩展线→规模报酬长期生产中规模报酬变化规律 第五章成本论 一、概念: 机会成本显成本-隐成本经济利润-正常利润 二、短期成本理论 1.边际报酬递减规律→决定短期成本曲线特征边际产量-边际成本 2.MC→TC AC 3.TC→AC MC 4.短期成本曲线与短期产量曲线的关系 MC-MPL AVC-APL 三、长期成本理论 1.长期总成本(推导):包络线 2.长期平均成本 (a)推导:由LTC推导包络线 (b)形状决定因素:规模(不)经济 (c)位置决定因素:外在(不)经济 3.长期边际成本推导:由LTC 由SMC 第六章完全竞争市场 1.市场划分市场类型的因素 2.完全竞争市场的四个条件 3.完全竞争厂商短期均衡 ◆需求曲线收益曲线 ◆利润最大化条件MR=MC ◆短期均衡MR=SMC ◆短期供给曲线 ◆生产者剩余 完全竞争厂商长期均衡 ◆厂商的两个选择

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论信息经济学知识点

博弈论与信息经济学 完全信息静态博弈 考察占优战略均衡概念及求解 解题思路:理性参与人做出是最优选择,该博弈存在占优战略均衡,据此可知答案为(3)。 考察重复剔除劣战略占优战略均衡概念及求解 说明:考察重复剔除劣战略,求解占优均衡的方法。答案:(U,L) 下面考察PNE及其解法

妻子 丈夫 (a )请检验,纳什均衡(最优战略组合)是同生共死;均衡结果是同生,或者共死; (b )请检验,占优均衡(占优战略组合)是坚强活着;均衡结果是同生(互相煎熬); (c )请检验,纳什均衡(最优战略组合)是你死我活;均衡结果是死活,或者活死; 显然,(c )情形之下,二人之间的仇恨比(b )中更深。 一些类型的博弈中,PNE 未必存在。以下考察MNE 及其解法 说明:猜谜游戏,是一种典型的零和博弈。这类博弈没有纯战略NE ,但是却存在混合战略 (c ) 活着 死了 (b ) 活着 死了 活着 死了 (a ) 活着 死了 活着 死了

NE。希望大家通过这个例子,加深对NE的概念及NE存在性定理的理解。同时,混合战略NE求解也是本题考察点。以下两个例子,与此相同,供大家练习使用。 模型化如下博弈:两个小朋友一起做猜拳游戏,每人有三个纯战略:石头、剪刀、布。胜负规则为:石头胜剪刀,剪刀胜布,布胜石头,如二人出手相同则未分胜负。二人同时出手。胜者的支付为1,负者的支付为-1,未分胜负时支付均为0。(1)请写出该博弈的支付矩阵,并判断其是否存在占优战略均衡。(2)该博弈是否存在纯战略纳什均衡,是否存在混合战略纳什均衡?如果存在,请写出。 下例来自张维迎,P131。 美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案? 与零和博弈不同,有些博弈既有PNE,又有MNE。如以下性别战博弈和斗鸡博弈。 性别战博弈:

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论经典案例《智猪博弈》

在经济学中,在经济学中,智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭 便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之 间的距离。 如果改变一下核心指标,猪圈里还会出现同样的小猪躺着 大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小 猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡

献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然 是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小 猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效 果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费 宀 完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最 大。 原版的智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规 则的设计者是不愿看见有人搭便车的,政府如此,公 司的老板也是如此。而能否完全杜绝搭便车”现象,就要看游戏 规则的核心指标设置是否合适了。

博弈论知识点总结完整版

博弈论知识点总结完整 版 集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)

c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975) Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述 (Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i, si*称 为参与人i的严格占优 战略,如果满足: ui(si*,s-i)>ui(si',s- i) ? s-i, ? si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣” 的含义: 设 s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i (s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。

相关文档