博弈论学习心得
(全校性选修课期末论文)
序:初识博弈论
通过“囚徒困境”,我走进了博弈论这一精彩世界。为了让大家对博弈思想有一认识与掌握,老师课堂上让我们思考了不少或生动或实际的问题,比如“帽子”问题、强盗分金币问题、猜
全班数字的平均数问题、拍卖问题、市场进入问题等等。我曾自嘲地对舍友说:博弈论简直就
是对智商的考验,总觉得自己脑子不够使啊。不过,我相信,学习博弈论是会使人变聪明的,脑子越用越灵嘛。
学习博弈论的过程中,脑子里经常出现的几句话是:原来这个问题可以这么去想,原
来这种问题还可以用博弈的思想来解决,原来博弈的应用范围这么广,原来看似与数学无
关的问题都可以通过数学来解决。
博弈论,为我呈现了一方新天地。我好奇它的广度,敬畏它的深度,视之如导师如利器,小心摸索着。
一、博弈思想
学习博弈论,我最大的收获不是记住了什么模型、公式、转换,而是博弈思想。“授之
以鱼,不如授之以渔”,博弈思想尤如“渔”一般重要,是分析问题的基础。
博弈,需要换位思考,需要知已知彼。一定要充分考虑自己和其他参与者的各种战略
以及对彼此的影响,从而采取最佳行动。
比如课堂上一个问题:让每个人选一个介于1~100的数,谁的数字最接近全班平均
数的2/3,谁就是赢家。如果每个人随机选择的话,大家平均值应该在50 左右,50 的2/3
应该是33. 3,不过其他人可能也想到了这一点,这样就应该写22.2。如果继续想下去,
大家的平均值应该越来越小,最后1应该是理性分析的最佳答案。实际结果,普通如我的
只想了一步,33,有的人多想了一步,有的人多想了两步……答案总不会是1。
其实答案是什么不重要了,重要的是一个思考的过程。是一个“你知道我知道你知道
我知道你知道……”的N次换位思考的过程,你要知道他人有有多聪明,还要站在对方的
角度考虑对方认为你有多聪明……
面对一些事情时,可能不需要过分多虑,太过天才,在一群平凡人中,反而不会是赢家。比如那些选了1的人。但是换位思考的方式却是受用终生的,可指导我们少吃亏、少
走弯路、尽可能快乐且适如地生活在复杂的社会中。
博弈的另一个重要思想,我认为是缜密的逻辑推理、全局意识以及化繁为简的转换。
比如在不完全信息博弈中,你所了解的信息是有限的,这就需要你想出各种可能性以及各
种战略组合下的收益。要分析别人的心理、分析影响别人行动的因素,分析各种战略组合
的概率,从而执果索因,比如完全信息动态博弈中的“逆向归纳法”,比如通过“海萨尼转换”将不完全信息博弈表述为完全但不完美信息的博弈(市场进入问题),从而充分利用已
有信息找到最优战略或均衡。可谓是“眼观六路,耳听八方”,“运筹帷幄”。
二、博弈案例分析两则
博弈论与环境评价
联系我的专业,我想到了环境监测部门与化工厂之间的博弈。现以我浅薄的知识试分
析之:
环境监测部门有两个选择:检查与不检查;化工厂有两个选择:排污与不排污。检查
成本为a,排污罚款为b,在排污的情况下工厂收益为c,不排污对废物的处理成本为d,
此时收益为c-d。双变量收益矩阵如下:
排污不排污
不检查
假设环境监测部门的混合战略为p1=(p,1-p),即以概率p 选择“检查”;工厂的混合战略
为p2=(q,1-q),即以概率q 选择“排污”。
则监测部门的期望收益函数为:v1(p1,p2)=pq(b-a)+p(1-q)(-a)=p(qb-a)
化工厂的期望收益函数为:v2(p1,p2)=pq(-b)+p(1-q)(c-d)+(1-p)qc+(1-p)(1-q)(c-d)
=-pq(b+c)+c-d+qd
下面求解最优化问题,寻求混合战略均衡(p1*,p2*),用微积分求极值的方法,得P*=d/(b+c),q*=a/b
结果分析:假设监测部门的检查成本a 一定,则罚款b 越高,工厂排污的概率q*就越
小;罚款b、工厂收益c 越高,处理废物的成本d 越小,监测部门的检查概率就越小,这
种情况下处理废物对工厂收益带来的损失很小,而一旦被罚款反而得不偿失,故选择不排
污的比率大,检查的概率小。
这就解释了为什么在现实中,工厂规模越大越不容易排污,相反,排污的大多是收益
较低的小厂子。同时,运用博弈的思想分析还具有指导意义,我们能够得出结论,为了减
少污染,一方面可提高罚款,但有时这一措施对于那些甘愿冒着被罚的风险也不愿处理废
物的小工厂是无用的,所以另一方面,需要科研人员的努力,去开发出可行的低成本的废
物处理方法。
另外,政府可以合作博弈的方式,与化工厂签订协议,协议中写明希望工厂完成的环
保目标,然后给予工厂税收优惠或一定金额的奖励、补贴等。同样可通过博弈论来分析,
苦税收优惠、奖励等取到合适的数值,则可以完美地完成这一合作,工厂既无大损失,同
时环保事业也得到了发展。
保护区旅游开发、西部开发、环境法规制定等过程中均存在博弈,可见博弈的作用之
重大。
博弈论与民事诉讼
民事纠纷是经常发生的事情,结果是私了还是上诉、胜诉还是败诉,可以通过博弈来
分析。比如A、B 发生了纠纷,若私了则B 赔偿给A 损失费c;若上法庭,原先A 知道如果
上法庭自己能否胜诉;被告B 知道A 有1/3 的概率胜诉,B 也知道A 知道谁能胜诉。假设
原先胜诉获得的赔偿为a;诉讼费为b。若原先胜诉,诉讼费由被告承担。该博弈用博弈树
表示为:
原告有两种类型,被告有一种类型。
〈情况一〉原先知道如果上诉自己能够胜诉。
则A愿意私了的前提是c>=a。在被告看来,原告胜诉概率为1/3,自己的期望收益为-
1/3(a+b),只有-1/3(a+b)<-c 时才会同意私了即c>=a,c<1/3(a+b)同时满足才可私了。若
c>=a,c>1/3(a+b),被告不同意私了,在c>=a 满足下,原先可不停降低c 直到c<1/3(a+b),
若c 小于a 了仍不满足c<1/3(a+b),则原告上诉。
〈情况二〉原先知道上诉的话自己会败诉
原先倾向于私了,此时原告就要保证c<1/3(a+b)从而避免损失。
结果分析:以上讨论与实际生活中一致。而实际中还要考虑被告的经济条件,比如穷人撞了富豪的车,富豪要上诉肯定会胜诉,但巨额的赔偿是穷人承担不起的,也许抵押了所有的财产还不够,而富豪会嫌打官司麻烦,况且修车的费用对自己算不得什么,打官司劳神费力,又使对方穷困潦倒,实在不划算,往往私了或不了了之。又如民告官,如果法制不够公正,即使民百分百有理,也极可能败诉,而官员为维护自身形象往往会提议私了,给予民一定赔偿,出于对自身利益的考虑,多数情况下原先会选择妥协。
打官司的种类多种多样,单从收益考虑,大多可以用博弈论的知识分析,构建其扩展
式表达式(利用海萨尼转换),求其精炼贝叶斯均衡。
三、博弈与道德
博弈分析的前提总是“参与人是理性的”,博弈的目的是获取最大收益。但现实中,并
非所有人都完全理性,也并非任何人任何情况下都把收益放在首位。完全被博弈统治的世界,应该是冰冷残酷的。
如果说博弈应用于立法,促成了法律的完善与效用如果说博弈用于经济,为经济良好运转贡献了力量;如果说博弈用于商业,将品牌发扬光大;如果说博弈用于政治,是国际关系的润滑剂……那么在这井井有条的框架下,我们还需要一些温情的东西,无关博弈,有关道德。有时是责任感,有时是大公无私,有时只是为了爱。
有人为了一元钱的赔偿打官司,这是法制意识的体现,不为钱为的就是个理,如果人人有这种境界,而同时执法公正严明,那我们离真正的法制社会就不远了。
之前民告官的例子,多数会私了,可有的人偏不,宁肯撞得头破血流也要告你,这是一种正气。
有人去偏远山区支教,而原本可以有很好的生活。如果人人都拿博弈来分析一番,恐怕就没人去了。他们是心中无我,有的是穷苦的孩子、对孩子的怜悯、爱以及期盼。
还有还有……
原谅我如此感性,还有一句话经常在我脑海中出现的,“序”中未提到的:“又是收益!”我有时会莫名地讨厌这个词语。可我马上会平静下来:亲爱的,你是在学博弈论。
博弈论教我成为一个理性的人,教我思考问题的方法,教我为人处事的技巧。我现在
了解的还很少很少,但是学博弈一学期,用博弈一生一世,博弈是受用终生的。Ps:曾在博弈论贴吧看到某人用树状图分析搓男追女神的收益,结论是“大胆去追!”哈哈,也许以后生活中一些事情,我还会画上一幅图(或矩阵或树形)分析一番,上贴吧观摩一
下大神级别的讨论,上文库搜索相关的内容。学了一学期博弈,课堂上老师讲的例子倒听
得清楚,也学会了一些简单的计算分析,轮到自己写些东西时,却越读越觉肤浅与粗鄙,
望您笑纳。