《博弈论基础》学习笔记

A-A+
方法 2015-09-15 08:50:08 来源：作者：鲁峰 0

前言

博弈论在经济学理论中的重要地位不用赘述，但是博弈论的学习却令国内很多经济学学生头疼。特别是对那些进入graduate阶段学习高级微观经济学的学生而言，更是如此。他们在学习中往往不知教材所云为何，非常容易陷入一些概念或定理而难以自拔，更遑论将博弈论灵活应用于实际了。简而言之，学生们要么是根本学不懂，要么是钻进去就钻不出来。我在自学过程中体会到，学好graduate水平博弈论的关键在于学好undergraduate水平的博弈论。[其实，经济学的高级课程学习都有此现象存在。例如，要学好高级计量的林文夫（2000）和伍德里奇（2002），除了要具有较好的线性代数、概率统计等背景知识外，首先应该认真学习伍德里奇的《现代观点》或者古扎拉蒂的《计量基础》。所以，国外著名高校的经济学院特别重视为本科生开设的经济理论课程，一般而言主要有：中级微观、中级宏观、计量经济导论、博弈论和经济数学课程（含微积分、线性代数、微分方程和概率统计）等。]

虽然目前国内一流高校已经开始为经济类本科生开设专门的博弈论课程，但是仍有一些一般院校没有开设；也还有一些虽然不在高校，但是想自学博弈论的学生。他们没有很好的老师进行指导，只能凭自己的主观努力拿着一本张维迎《博弈论与信息经济学》或者吉本斯《博弈论基础》生啃。这种没人指点的学习效率自然低下，因为我就是这样啃过来的，所以深知在迷惑中没人点拨的痛苦。这促使我利用工作闲暇，重新翻阅了吉本斯的《博弈论基础》一书，并开始写作这个“学习笔记”，以供后来者少走弯路。

具体而言，这个“学习笔记”的目标主要有三：

第一、如前文所述，许多学生不会学习，只会死读书，非常容易陷入个别概念、定理而不能自拔，尽管他们非常努力。的确，学术需要严谨，一个概念与另一个相似概念的区分是深刻理解理论的基础。但是绝不能因这就犯“只见树木，不见森林”的毛病。要知道，任何人对于一个概念或定理的理解，不是你对着一个个概念和定理反复读、反复背就有效果的。真正意义上的理解必须要经过一个实际应用的过程，在应用中逐渐的加深理解，绝非一蹴而就。爱因斯坦对时空概念的理解不也是先狭义而后广义的吗？伟人尚且如此，何况我辈？这也是做好课后题的作用——在一个题做错的时候，才会促使你回头发现原来自己对一个概念、定理理解偏颇的地方，从而加深你的理解。这篇笔记，就是希望能帮助这样的学生从这个学习陷阱里跳出来。

第二、根据我的自学经验，在这个笔记中对一些初学者容易混淆的概念和定理意义做出简单的阐述，希望帮助初学者更深刻、准确的理解基础博弈论的主要思想。

第三、很多人选用吉本斯的《博弈论基础》一书作为教材，但是这本经典教材语言却过于精炼，加之翻译问题，使得中译本（中国社会科学出版社）出现很多语句不通、晦涩难懂之处。为了便于读者自学该书，我对这些“语句不通、晦涩难懂”的地方，进行了详细阐述。希望可以较为准确的表达吉本斯的原意。

当然，这个学习笔记是我自己的理解，其中不准确之处在所难免，欢迎大家指正！

鲁峰

2011年5月

教材选用篇

一、必备：Robert Gibbons《A Primer in Game Theory》【本书又名《GameTheory for AppliedEconomists》】社科中文版以及英文电子版（中文译本印刷错误太多，英文版供对照使用）。本文后面提及的教材页码均为中文版。

二、补充：MIT本科博弈论讲义（Muhamet Yildiz，2005）;哈佛本科博弈论讲义（Markus M.Mobius，2004或2006均可）。都是本科生讲义，但是后者比前者在数学上略显严格。

学习方法篇

一、熟悉目录安排及教材写作结构的内在逻辑，因为这一般是该学科的发展脉络，所以有助于在学完一本书之后对该学科形成整体、系统的印象。

二、第一遍学习一定抓住最主要的章节，毫不犹豫的舍弃那些一时难以理解的高深部分以及技术细节。就Gibbons的教材来看，“主要章节”可以适当（非绝对）参考MIT或哈佛的课程提纲。

三、阅读主要章节的时候，就不能再囫囵吞枣了，一定要搞清楚每句话的含义。因为博弈论前后连贯性很强，前面的论述没有理解透彻，后面的学习必然是云里雾里，慢慢的就会丧失学习信心。因此，对于主要章节那些一时难以理解的部分，不要怕进展慢，一定要反复读，直到完全理解。慢慢的，你就会真正理解“书读百遍、其义自见”的真理！

四、博弈论这一学科本身比较抽象，再加上使用翻译的外国教材，在学习中第一次看到某一概念（定理），不一定马上明白它说的什么意思。这时，最好在草纸上将这一个概念（定理）抄一遍，边抄写边思考、理解。这种看似很“笨”的方法，其实有助于大脑注意力集中在这一概念（定理）上，提高了你的理解力。

五、在理解了抽象的概念（定理）之后，务必紧紧抓住其内在的经济含义不放。因为经济含义往往是直观的、具体的，它有助于加深我们的学习效果，使我们能真正的灵活运用相关概念（定理）进行证明、解题、分析实际问题。千万不要觉得利用直观的、具体的经济含义帮助理解意味着智商低。恰恰相反，最牛的科学家们观察世界的时候，都很善于将抽象概念在他们脑中直观化，伽利略、牛顿、爱因斯坦无不如此，不信的话，可以去翻阅他们的传记。

六、认真完成课后习题。不要求100%作对，至少要达到80%作对。对剩下的20%技术性较强的或者模型方面较复杂的可以暂时略过，而不影响对课程内容的理解。

七、教材的“1.3B纳什均衡的存在性”后半部分不要看，写的不清楚。强烈建议用哈佛M.Mobius的讲义“第6讲”来代替。这篇讲义写的真是太漂亮了。一定能在本科生的水平上告诉你纳什均衡存在性，究竟是如何被证明的！

八、2.4节“完全非完美信息动态博弈”要放在2.3节“重复博弈”之前学习，同时配合MIT 的Yildiz讲义的“Lectures3-6”学习。这样安排不仅符合博弈理论发展逻辑，也利于学习和理解。

九、3.3节属于微观经济学中的机制设计理论，跳过不看。而且，吉本斯的书也没有把这个定理讲清楚，看它纯属浪费时间。以后在高级微观经济学中学习即可。

十、在学习第四章的内容时，不要因为沉溺于对某一个均衡的论证细节而忽略对该类博弈均衡的整体论证思路。例如，通过劳动力市场学习“信号博弈”的时候，除了要理解（注意是理解，它比“掌握”要低一层）信号博弈的分离均衡、混同均衡和杂合均衡的具体证明思路之外，更关键的是要掌握论证信号博弈的三个要求：1、信号接收者的最优行为方程是什么？如何找出？2、信号发送者的最优信号是什么？如何确定？3、信号接收者的推断如何根据贝叶斯法则、信号发送者行为来得到？

只有掌握了这些纲领性的东西，才能在日后的建模、解题中做到以不变应万变。

十一、学习第四章的信号博弈模型时，4.2.D节可以跳过不看。事实上，只要熟练掌握了斯彭斯的就业市场模型，就基本达到信号博弈的学习要求了。另外，4.3.C节讲的是“合作博弈”。“合作博弈”是博弈论的一个研究方向，在本科水平的课程了解即可，所以这一小节建议浏览。

理论内容篇

（按照Gibbons教材顺序列出）

1、明确完全（不完全）信息、完美（不完美）信息的含义。

2、严格区分“战略”与“行动”这两个不同的概念。

3、牢牢记住并准确理解“纳什均衡”的概念：它是战略的均衡，不是行动的均衡。

4、要理解“战略”就是“最优反应对应”（注意不应该说成“最优反应函数”。“对应”仅是曲线，而非函数），而“行动”就是曲线上具体的点。

5、纳什均衡存在性证明思路：首先，根据不动点的定义，可以从2×2博弈中直观的看出混合战略纳什均衡（纯战略NE是其特例）是一个“最优反应对应”的不动点（这一步需要知道“笛卡尔乘积”的概念）。很容易将此概念扩展至有限博弈中。其次，角谷（Kakutani）不动点定理证明了在满足一系列条件下的最优反应对应至少存在一个不动点。第三，有限博弈参与者的最优反应对应，恰好符合角谷不动点定理的前提要求。所以，有限博弈最优反应对应至少存在一个不动点，也即至少存在一个纳什均衡。

6、熟练运用“斯塔克尔伯格”类模型的简单逆向归纳求解法，同时务必将两参与者“讨价还价模型”自己完整推导一遍。最好能理解教材中给出的Shaked& Sutton(1984)解法，如果不能，则可结合Yildiz 讲义的 “Lectures7-9”学习归纳求解法（哈佛M.Mobius 的讲义这部分理论性较强，不推荐在博弈论基础阶段学习）。

7、逆向归纳发在完全不完美信息情况下的应用就是“子博弈精炼纳什均衡”。这里需要提醒的是：一定要把一个博弈整体视为其自身的一个子博弈，而不是教材所讲的那样。（我个人认为，这样理解在理论上才是一致的，而不仅是个人喜好问题，MIT和哈佛的讲义也都是这样的。）

8、掌握在无限重复博弈下，一个既定战略是子博弈精炼纳什均衡的证明步骤：首先，根据single-deviation principle（MIT 的讲义这样命名，哈佛讲义则将该原理叫做“single-period deviationprinciple”）证明触发战略在主要参数（一般是贴现率）满足一定的条件下是纳什均衡；其次，根据“无限重复博弈 G(¥,d )的每一个子博弈都等同于 G(¥,d )自身”这一原则，证明该纳什均衡在两类子博弈中都是纳什均衡。

9、明确无限重复博弈中的“阶段”概念与“阶段博弈”为一个“有限动态博弈”时，“动态博弈的阶段”概念的区别：无论该重复博弈的阶段博弈为静态还是动态，前者都存在，而且只有前者需要折现计算总收益；后者只在“阶段博弈”为动态博弈时才会出现，并且其收益不折现，因为阶段博弈尚未进行完。

10、理解“弗里德曼（无名氏）定理”的现实含义并会应用。从帕累托最优与福利经济学基本定理的角度去理解——一个能使所有参与人收益得到改善的均衡状态，可以是一个子博弈精炼均衡，即这种状态可以通过博弈达到。

11、学习第三章之前，先复习一下基础概率论知识（经济类本科水平即可）：条件概率、贝叶斯定理、概率分布的定义、概率密度函数的定义、条件期望及其相关公式。还可以先读一下张维迎《博弈论与信息经济学》的3.1节，该节对不完全信息静态博弈理论做了明晰、直观的概述。

12、正如在前面学习博弈论首先要严格区分“战略”与“行动”一样，此处必须理解“参与者i 的私人信息空间等价于其类型空间”。

13、结合3.1.A 节中的不完全信息古诺模型，理解教材P116-117中，作者所谓的“两个技术性较强的问题”，因为这两个问题在教材中写的很晦涩。作者的意思是：首先，静态不完全信息博弈参与者不仅知道自己的类型空间，而且还都知道其他参与人的类型空间；其次，静态不完全信息博弈参与者不仅知道自己的类型到底是什么，而且还都知道其他参与人的类型概率分布。例如，在不完全信息古诺模型中，企业1知道企业2 的类型空间为{ CH , CL },而且知道其类型空间的概率分布为{ p(t2= CH |t1 ) = q， p(t2= CL |t1 ) = 1 -q }。

14、仔细理解课本P118中的一、二两段内容。需知在求解贝叶斯纳什均衡的时候，参与人的类型空间很重要（比其他参与人的推断还重要），因为要根据它来确定战略空间。而一个参与人的类型是根据他的私人信息划分的，因此明确一个贝叶斯博弈中各参与人的私人信息非常重要。例如，在不完全信息古诺模型中，企业1知道企业2 的类型空间为{ CH , CL }，而{ CH ,CL}正是企业2 的私人信息。

15、“不完全信息静态博弈纳什均衡（BNE）”概念理解的要点：首先，一个BNE是将参与人i 在所有类型下的最优反应集合起来，假如参与人i 有三个可能类型（即类型为离散的），则i的均衡战略是一个三维向量si*= { s * (t1) ，s * (t2) ，s * (t3) }，如果参与人i的类型是连续的，则其战略就变成了一个函数；其次，一个BNE考察的一定是参与人的期望收益，因为定义式中的概率分布乘数pi (t-i | ti )（在n人参与的博弈中，t-i 为（n-1）维向量）表明参与人i不知道其他参与人的类型到底是怎样的。

16、在求解不完全信息静态博弈时，应该遵循以下步骤：第一、明确参与人i 的私人信息到底是什么，然后才能根据这个私人信息对参与人i的类型空间做出判断；第二、据此结合参与人i 的行动空间构造他的战略空间（重点考虑对称线性均衡解）及其收益函数；第三、设定参与人i对其他参与人类型的“推断”；第四、最大化参与人i的“收益函数”与“对其他参与人类型推断”的乘积，得到一阶条件方程组；第五、求解该方程组得到静态BNE。

同时学习Yildiz讲义“Lectures17-18”中归纳的求解不完全信息静态博弈的“对称线性均衡”、“对称非线性均衡”和“非对称线性均衡”的步骤，写的非常好。

17、教材的4.1节至少要读上三遍（我没有开玩笑），只有这样才能真正读懂并理解什么是“精炼贝叶斯均衡”。学习这一节要注意三个主要问题：第一、子博弈精炼纳什均衡（SPE）为何不再适用不完全信息动态博弈了？因为不完全信息动态博弈往往从第二阶段开始就存在“非单节信息集”，自然就不存在真正意义上的子博弈了。所以SPE不能帮助我们排除那些含有不可置信威胁的均衡；第二、明确精炼贝叶斯均衡（PBE）的定义，此处学习必须要结合M.Mobius讲义第17讲中的前两节。搞明白如何运用贝叶斯法则计算参与人的推断；第三、为何逆向归纳法不能用于求解PBE？因为PBE中参与人的最优战略依赖于参与人的对不确定性的推断（这种“不确定性”表现为对所处同一信息集中决策节的不确定或者是对其他参与人类型的不确定），而参与人持有的推断又依赖于其他参与人的最优战略选择。因此逆向归纳法会导致循环求解，从而失效。

18、这里再对PBE的概念进行一个整体探讨。教材中通过四个“要求（requirement）”来定义PBE，而M.Mobius的讲义是通过两个“准则(principle)”来定义。严格来讲，后者的定义方式更准确一些，但是前者更易于理解。前者的“requirement-1 、2 ” 对应了M. Mobius 讲义中的“principle-1”，它们都说明了：在PBE中，每一个参与者的个人战略在给定其推断和其他参与人战略的条件下都是最优的。而前者的“requirement-3、4”对应了M.Mobius讲义中的“principle-2”，它们都说明了：在PBE 中，每一参与者对所处决策节的推断都是最优的。因此，一个PBE是由参与者的最优战略组合和最优推断组合构成。

19、对PBE概念理解的难点和关键点在于如何理解教材中要求4的“可能情况下”。教材对此没有讲解，只是举了两个例子。对此，M.Mobius的第17讲中在给出PBE定义后，有简要解释：“Branches of the game tree which arereached with zero probability cannot be derived using Bayes rule:here you can choose arbitrary beliefs.”在数学上的表达就是贝叶斯公式的分母不能为0，即

中的分母不能为0。

如果仍然觉得这个说法难以理解，那么还有一种不严格的理解方法：若在参与人i之前行动的参与人j的具体行动，使参与人i在行动时进入了这样一个信息集——在该信息集中，参与人i并不面临任何除自身之外的其他参与人，那么参与人i对该信息集中的决策结就不持有任何推断。

20、在理解了PBE的要求4以后，就能明白为何教材中讲：“要求4在信号博弈中没有意义了”。因为，按照信号博弈的过程，可知信号接受者总是能接收到发送者的信号。也就是说，接受者在其面临的任何信息集中都面临着“发送者”这个博弈参与人。

21、学习信号博弈的关键在于熟练的利用贝叶斯公式写出“分离均衡”、“混同均衡”、“杂合均衡”三种条件下，信号接收者持有的推断。为了达到这一目的，自己不妨对教材中没有展开阐述的均衡进行详细分析，看看能否得出与教材同样的答案。除“4.2.D货币政策”一小节可以略过不看以外，教材4.2.C和4.2.B中给出的每一种均衡都要自己会推导。另外，习题4.7一定认真做一下，检验自己是否真的理解了劳动力市场中的“学历信号”博弈问题。

22、掌握空谈博弈起作用的三个必要条件是理解该博弈运行的核心。另外，将其与信号博弈区分开的根本是“空谈博弈的信号发出者没有发送成本”，表现在空谈博弈双方的收益函数上——双方收益函数均不依赖于信号。

23、对于教材P168-171介绍的克劳福德&索贝尔（1982）模型，能理解多少就理解多少，不必强求。这个模型的介绍就是想告诉读者——空谈博弈可能存在部分混同均衡。另外，作者在介绍该博弈模型时，给出了一个引理“上面的一段比下面的一段要长4b。”但是其证明却很晦涩，这里我给出一个简单的证明：利用

这一推理过程（利用图4.3.2，可以直观的理解该等式），可知，对于任意两个相邻且长度相等的区间 [ xk -1, xk]、 [ xk , xk+1]，都有下式成立

稍加整理得

[xk +1 -xk ]- [xk-xk -1]= 4b

该式即为引理结论，证毕。

24、我个人认为，4.3.B节要认真学习和揣摩，它给出了PBE概念的另一个重要应用——考虑了折现因素的谈判问题。要知道，讨价还价一类的博弈理论，是理解许多博弈问题，乃至经济问题的核心。所以，此节内容如果读一遍不能领会，就再读第二遍，直到自己完全推出均衡结果。

25、4.4节很重要，特别是对信号博弈而言。读至此节，全书接近尾声，经过对全书的学习，我们可以知道：博弈理论的发展过程，就是不断对博弈模型施加限制，以排除那些“不可置信均衡”的过程。而就动态贝叶斯博弈模型来讲，博弈论是通过对“参与者i的处于非均衡路径之外的信息集中各节点所持有的推断”施加限制条件以排除那些不可置信均衡的。这一节通过引入两个适用于信号博弈的，比要求4更具体的“信号要求5”、“信号要求6”来排除那些信号博弈中的不可置信均衡的。

26、要熟练运用“信号要求5”、“信号要求6”，必须仔细理解“严格劣信号”和“均衡劣信号”。理解前者的要点在于：对相同的类型i t和信号接收者行动k a 而言，信号发送者选择“非劣信号”的最低收益大于“严格劣信号”的最高收益。理解后者的要点在于：对类型为i t的信号发送者而言，只要其均衡A的收益有可能大于其选择信号j m 时的最高收益，则信号j m就是相对于均衡A而言的“均衡劣信号”。

27、作者利用信号要求5、6对就业市场信号博弈进行的分析阐述有些模糊，我在此处做一点补充。针对图4.4.5而言：

在高能力工人随机选择信号的杂合均衡中，混同均衡必然在红色阴影区域中，此区域中低能力工人可以获益，而高能力工人得到的工资少于其为教育而付出的成本，故 e*(L) £ e£ e1是他的严格劣信号，所以这一杂合均衡不符合要求5。

在低能力工人随机选择信号的杂合均衡中，混同均衡必然在蓝色阴影区域中，此区域中高能力工人可能（仅仅是可能，如在点es 处）获益，而低能力工人则一定不能获益，故 e1<</span> e £ es 是他的严格劣信号，所以这一杂合均衡不符合要求5。

类似的可以理解图4.4.6和图4.4.7。

28、最后，我想谈一下自己对于应用博弈模型（不是对博弈理论本身进行研究）研究经济问题的看法：由全书的学习可知，博弈模型的抽象性使得一个模型可能存在若干个均衡。但是现实中，与该模型对应的经济问题也许只有一个合理的均衡，那么我们研究的重点就是——考虑通过加入哪些前提假设或者限制条件可以排除那些现实中没有发生的均衡？这些前提假设或者限制条件的现实经济意义是什么？如果现实中发生的均衡是低福利的，那么通过对该博弈模型施加何种限制，可以排除低福利的均衡而得到高福利的均衡？这种限制的现实经济含义又是什么？

以上就是我目前理解的，博弈论模型在经济学研究中的主要用法。

《博弈论基础》学习笔记

天津大学马寅初经济学院2022年预聘教

北京大学国家发展研究院招聘事业编制

北大汇丰智库研究实习岗位招聘启事

24人看过

23人看过

16人看过

10人看过

7人看过