2012年诺贝尔经济学奖相关评析

A-A+
论坛精华 2012-11-13 15:26:58 来源：中国社会科学院经济研究所作者： 0

中国社会科学院经济所《宏观经济与政策跟踪》课题组

[导读：2012年10月15日，瑞典皇家科学院宣布，哈佛大学教授埃尔文-罗思（Alvin E. Roth）和加州大学洛杉矶分校（University of California Los Angeles）教授劳埃德-沙普利（Lloyd S. Shapley）凭借“稳定匹配和市场设计实践理论”（The theory of stable allocations and the practice of market design）获得2012年诺贝尔经济学奖。]

沙普利与罗思的稳定分配理论
    瑞典皇家科学院经济科学奖评审委员会在其编写的2012年诺贝尔经济学奖科学背景的解释中，阐述了两位教授在稳定分配理论及市场设计实践上的成就。
    资源配置的理论框架与实证研究
    经济学家研究社会如何分配资源。一些分配问题可以在价格体系中获得解决，例如，某一职位用高工资吸引劳动者，高能源价格引导消费者去节约能源。但在许多情况下，使用价格体系会遭致法律和道德上的异议，如公立学校在学童中的分配，或人体器官在需要移植的病人中的分配。并且，许多市场中虽然存在价格体系运作，但传统上假设的完全竞争仍未接近于实现。尤其是许多商品是由不同的商品组成且是不可分割的，而每一分类商品的市场十分稀薄。这些稀薄的市场如何配置资源取决于管理这些交易的体系。
    今年获奖的成就包括一个用于分析资源配置的理论框架，以及对现实世界中的体系（如劳动力市场交流中心和学校招生程序）进行的实证研究和真实再设计。这一理论框架的基础是1962年戴维•盖尔（David Gale）和劳埃德•沙普利建立的对特定一类分配问题进行的数学探讨。二人考察的模型由两组必须相互匹配的对象组成，例如劳动者和公司。如果其中一位劳动者被A公司雇佣，但这位劳动者更青睐B公司，且B公司本来也想雇佣这位劳动者，那么，这次交易中就存在未被利用的收益，因为如果这位劳动者由B公司雇佣，那么对于双方来说会更好。盖尔和沙普利定义，如果交易中不存在这种未被利用的收益，那么这次匹配就是“稳定”（stable）的。在一个理想的市场下，劳动者和公司有无限制的时间和能力去达成交易，其结果总是稳定的。当然，现实中的市场可能在许多重要方面与理想中的不同，但盖尔和沙普利提出的“延迟接受”（deferred-acceptance）程序易于理解，且总能达到稳定的结果。该程序说明市场一方中的对象（如雇佣者）如何向另一方中的对象提出要约，而后者如何根据一定的规则接受或拒绝要约。
    该理论框架的实证意义由阿尔文•罗思证明。罗思在1984年发表的研究文章中发现，美国的新医生市场长久以来受到一系列市场失灵因素的影响，但一家集中的交流中心由于采用了本质上相当于盖尔和沙普利的延迟接受的程序而大大改善了当时的情况。罗思的这篇文章阐明了市场所执行的任务，并说明这个稳定概念如何提供了一个组织原则，帮助我们理解为何市场有时运转正常，有时不正常。
    之后，罗思和他的同事利用这个理论框架，结合实证研究、对照实验室实验和计算机模拟，对其它市场的运作进行了研究。研究结果不仅揭示了这些市场的运作方式，还证明了体系设计有助于帮助市场更好地运行，这些设计常常利用演绎后的盖尔-沙普利程序或拓展后的盖尔-沙普利程序。这已经促使一门被称作“市场设计”的新兴经济学分支出现。需要注意的是，这里所说的“市场”并不假定存在一个价格体系。事实上，货币转移在许多重要应用中都被排除在外。
    如何实现“稳定分配”
    今年获奖的成就使用了非合作博弈理论与合作博弈理论的工具。非合作博弈理论也是1994年诺贝尔经济学奖得主约翰•海萨尼（John C. Harsanyi）、约翰•纳什（John Nash）、莱因哈德•泽尔腾（Reinhard Selten）及2005年诺贝尔经济学奖得主罗伯特•奥曼（Robert Aumann）和托马斯•谢林（Thomas Schelling）的研究主题。非合作分析的出发点是对个体决策者面临的策略性问题进行详细的描述。相比之下，合作博弈理论则研究个人集合团体（“联盟”）如何通过合作扩大自己的利益，因此，合作分析的出发点是对每个联盟所能达成的结果进行分析。对合作博弈理论的发展做出主要贡献的是劳埃德•沙普利。
    合作与非合作分析方法在许多方面相辅相成。市场设计的两个关键属性是稳定性（stability）和激励相容（incentive compatibility），二者阻止对市场的策略性操纵。“稳定性”这个概念来自于合作博弈理论，“激励相容”则来自于机制设计理论非合作博弈理论的一个分支，这也是2007年诺贝尔经济学奖得主莱昂尼德•赫维奇（Leonid Hurwicz）、埃里克•马斯金（Eric Maskin）及罗杰•迈尔森（Roger Myerson）的研究主题。
    对照实验室实验是市场设计领域经常使用的方法。弗农•史密斯（Vernon Smith）因其在实验经济学方面的成就分享了2002年诺贝尔经济学奖。今年获奖的阿尔文•罗思是另一位为这一领域做出重大贡献的人。
    合作博弈理论研究个体形成联盟的激励因素，其假定一个联盟内部的任何潜在利益冲突都可以通过约束性协议解决。这些协议引导联盟成员采取行动以使联盟“盈余”（一定数额的货币）最大化，而最大化的盈余就是联盟的价值。但是，如果盈余还取决于非联盟成员的行动，困难就会出现。这时候，可以通过假设非联盟成员努力最大化自己的回报，以一致的方式确定联盟的价值。
    在“可转移效用博弈”中（一旦联盟形成，其成员可以以他们希望的任意方式分割盈余，每个成员的“效用”等于他们各自分割的盈余份额，这就是“可转移效用”），隐含的假设是联盟中的个体之间可以自由地转移效用，实际上通过“单边支付”（side-payments）来完成转移。但在一些情况下，单边支付受到限制，效用无法（完美地）转移。例如人体器官捐赠，此时单边支付会被视为“令人反感的”（罗思，2007年）。合作博弈理论能够处理这种情况，因为它在一般的非转移效用博弈理论层面也得到了非常好的扩展。
    某个联盟的成员如果可以利用自己的资源让自身的境况更好，那么就可以说这个联盟能够“改进”回报向量。一般来说，一个分配如果不能被任何联盟“改进”，那么它就是稳定的分配。事实上，没有联盟能够通过利用自己的资源，带来令所有成员更青睐的结果，就是所谓的稳定分配。合作博弈理论中的稳定性与非合作博弈理论中的“纳什均衡”（Nash equilibrium）相对应，后者指没有个人可以单独背离并让自身的境况更好。
    稳定分配是否总是存在？一般来说，如果无法得到足够多的盈余，那么就不可能对其进行稳定的分割。邦达列娃（Bondareva，1963年）和沙普利（1967年）各自发展出一个精确的公式，用于计算要使可转移效用博弈中的“核心”（core，即“稳定分配的集合”）非空则需要多少盈余。两人的研究成果被斯卡夫（Scarf，1967年）和比莱拉（Billera，1970年）进一步拓展至不具有可转移效用的合作博弈中。沙普利（1971年）又证明，如果博弈是“凸博弈”（即参与者对联盟的边际贡献值如果在其他参与者加入联盟后提高），那么“核心”就总是非空的。
    双边匹配算法的基本原理
    在许多市场中，商品是私人的，但是由不同的商品组成且是不可分割的，传统上假设的完全竞争是无法维持的。重要的例证包括熟练工就业市场。由于不可能存在两位特征完全一样的劳动者，因此面向每个特定劳务群的市场可能非常稀薄。在这样的市场中，参与者必须适当匹配才能相互交易。
    考虑到一个市场有两个不相交的对象集（如买家和卖家，劳动者和公司，学生和学校）必须互相匹配以进行交易。盖尔和沙普利（1962年）研究的就是这种双边匹配市场。他们排除了单边支付工资（等匹配特征）不在谈判内容中。
    稳定匹配（stable matchings）。具体而言，假设市场的一方为医学院学生，另一方为医疗机构，每个机构需要一名实习生，每个医学院学生都想获得一个实习职位。很自然，学生和医疗机构对对方都有偏好的选择。为了方便起见，我们假设偏好是严格的（也就是没有关系的）。对于双方的任何一个对象来说，如果匹配之后不如未匹配之前，那么这个匹配就是“不可接受的”。
    一般来说，一个分配如果不能被任何联盟“改进”，那么它就是稳定的分配。在上述这个模型中，稳定的匹配必须满足以下两个条件：（1）没有一个对象认为匹配不可接受，（2）没有任何一对机构和学生希望是他们之间匹配，而不是各自目前的匹配。条件1即“个体理性”（individual rationality）条件，条件2则是“成对稳定性”（pairwise stability）。两个条件意味着没有一个联盟、没有一对机构和学生能对目前的配对进行改进。
    盖尔-沙普利算法（the Gale-Shapley algorithm）。盖尔和沙普利为了寻找一个稳定匹配设计出了“延迟接受算法”（deferred-acceptance algorithm）。市场一方中的对象（医疗机构）向另一方中的对象（医学院学生）提出要约，每个学生会对自己接到的要约进行考虑，然后抓住自己青睐的（认为它是可接受的），拒绝其它的。该算法一个关键之处在于，合意的要约不会立即被接受，而只是被“抓住”（hold on to），也就是“延迟接受”。要约被拒绝后，医疗机构才可以向另一名学生发出新的要约。整个程序一直持续到没有机构再希望发出新的要约为止，到那个时候，学生们才最终接受各自“抓住”的要约。
    在这个过程中，每个医疗机构首先向被自己列为第一位的求职者发出要约，也就是最想接收为实习生的那个医学院学生。如果这个要约被拒绝，这家机构才能向被自己列为第二位的学生发出要约，依次类推。因此，在该算法的操作中，医疗机构的预期随着要约对象所处偏好排序降低而下调（当然，医疗结构不会对不可接受的求职者发出要约）。反过来说，由于学生总是抓着所接收要约中最合意的那个，且要约不能被撤回，因此每个学生的满意度在该算法的操作中是单调递增的。当医疗机构下降的预期与学生提高的志向变得相一致时，该算法停止。
    盖尔和沙普利（1962年）证明，延迟接受算法是稳定的，也就是说，它总能产生一个稳定的匹配。该算法为这种类型的双边匹配问题提供了一个存在性证明：既然它总会终止于一个稳定匹配，那么稳定匹配是存在的。
    激励相容（incentive compatibility）。盖尔-沙普利算法能帮助真实世界市场中的参与者找到稳定匹配吗？回答这个问题需要非合作分析，也就是对控制匹配过程的规则和对策略性行为的激励因素进行详细的分析。
    延迟接受算法被解释为一个由求职、发出要约、拒绝和接受组成的分散化的程序。但在实践中，该算法由人才交流中心以集中的方式应用。每个求职者和雇主向交流中心提出自己的偏好排序，基于提交的偏好，交流中心履行算法的各项步骤。用机制设计理论的术语来说，交流中心运行着一个“揭示机制”（revelation mechanism），这是一种虚拟市场，不存在一些真实市场遭遇的某些问题。揭示机制诱发同步行动博弈（simultaneous-move game），所有参与者都会提交自己的偏好排序，考虑到他们完全理解该算法如何将提交的偏好排序映射到分配中。可以用非合作博弈理论对这个同步行动博弈进行分析。
    如果讲实话是占优策略，那么揭示机制是激励相容的，这样，参与者总是发现提交自己真实的偏好排序是最佳的。由雇主发出要约的算法（被视作揭示机制）对于雇主来说是激励相容的：没有雇主甚至雇主联盟可以通过虚报偏好排序获益。但该机制对于求职者来说就不是激励兼容的了，例如上述某个医学院学生可以通过操纵或策略性虚报自己的真实偏好排序让自己获得更中意的实习职位。这说明，讲实话对于求职者来说不是占优策略。罗思（1982年）证明，当讲出真实的偏好不是每个对象的占优策略时，稳定的匹配机制不存在。但需要指出的是，尽管有一名学生有操纵行为，但最终的匹配结果在真实的偏好下是稳定的。并且，这是不被占优的纳什均衡结果。这说明了盖尔-沙普利算法的一个一般事实，并被罗思证明（1984年）：偏好操纵博弈的一切不被占优的纳什均衡结果，对于真实的偏好都是稳定的。
    但罗思（1984年）这项研究结果的用处受到下面这个事实的限制：求职者识别自己的最佳反应可能是困难的，但这正是纳什均衡定义中所要求的。例如，上述虚报偏好排序的学生如果知道其他求职者都诚实，但不知道他们的偏好具体是什么，那么这个学生仍无法完全预见最终结果，因此他不能确认通过操纵一定会带来利益。这个论点暗示，在大而多样化的市场，参与者对于其他人的偏好信息了解有限，策略性操纵的范围可能因此非常局限。罗思和罗思布鲁姆（Rothblum，1999年）证实，当一位求职者的信息足够有限，他就无法通过提交一份将真实意愿中两名雇主的排序对调的偏好排序来获益。但是，他可以通过假称一名可接受的雇主是不可接受的来获益。

稳定分配：从理论到实践
    今年的诺贝尔经济学奖关注了一个经济学的中心问题：如何尽可能恰当地匹配不同的市场主体。通俗地讲，沙普利和罗思的成就是为了“如何让不同人为了互惠互利而走到一起”，他们的研究成果构成了很多事情的理论基础，诺贝尔奖授予这两位学者，是为了奖励他们的抽象理论研究，也奖励他们努力将这些研究成果应用于实践。
    评委会主席、新宏观经济学创始人Per Krusell指出，此次经济学奖中，金钱不再是研究活动的主角，尽管其确与人息息相关，但并非生活的全部；本次奖项中，人成为了主体，学校与学生间的关系，学校与学校的关系，甚至人在婚姻中的关系都成为研究对象。评委会委员Peter Gardenfors进一步谈到，有很多经济学问题并不能通过正常的市场机制得到解决；在Gale-Shapley算法下，问题的解决不需要涉及金钱，而只需要寻找到偏好种类，即人们互相之间愿意和谁配对。
    英国《金融时报》的一篇评论指出，诺贝尔委员会此举也使其避免在围绕危机、紧缩和财政政策的宏观经济辩论中站在任何阵营，因为这两位得主的经济学研究领域与这场辩论相距甚远。相反，这个决定体现了找到一个重要研究领域，把诺贝尔经济学奖授予其中几名领军人物（即便他们从未在一起合作）的传统。
    《金融时报》的社评认为，现在才授予沙普利和罗思诺贝尔经济学奖太迟了：沙普利早在1994年就应该与约翰•纳什（John Nash）及其他人分享该奖项，而罗思则是近年来强有力的竞争人选。这次的选择尤为明智，因为经济学家已经染上了一些坏习性，罗思树起的榜样可能有助于打破它们。
    沙普利是研究合作博弈论的重要人物。数十年来，合作博弈论看上去既抽象又毫无意义，与常规博弈论之间关联甚少。然而，合作博弈论最终找到了用武之地：在一群人中使用计算机化的拍卖授予资产或者签订合同。沙普利教授在上世纪50和60年代对这些市场的稳定合作匹配进行了理论研究。一个稳定匹配的定义是，在有许多可能选择的时候，双方都认为寻求别的匹配没有益处的那一对匹配。
    在实践中，这个问题的第一个、同时也是最出名的实例是找到婚姻伴侣。沙普利在1962年与戴维•盖尔（David Gale）合写的一篇《大学录取和婚姻稳定》(注：D. Gale and L.S. Shapley: College Admissions and the Stability of Marriage, The American Mathematical Monthly, Vol. 69, No. 1 (January, 1962), pp. 9-15)的文章，首先提出了后来被称为盖尔-沙普利算法的稳定配对（stable matching）问题。
    相比之下，罗思理论的实际应用从未遭到质疑。罗思的成果睿智实用，但在其他方面他也为经济学家同行树起了榜样。在其他人为买卖器官是否合法争论不下之际，罗思尝试弄明白我们为什么厌恶这种交易，并设计了一套实用的替代方案。他还大力倡导在经济学中引入工程学方法：他不是简单地证明某事能做还是不能做，而是在匹配理论上探究更为模糊的问题，例如“这在多数情况下能奏效吗？”或者“这是我们能取得的最佳结果吗？”总而言之，罗思明白，如果你在真实环境中测试理论，理论就会改善。或许现实世界也是如此。

沙普利和罗思的研究成果给我们带来了什么？
    今年的诺贝尔奖评选结果说明了经济学前沿对现实问题的关注，两位学者获奖的依据——“稳定匹配理论和市场设计实践”恰恰说明了诺奖对“理论”与“实践”的并重。
    比如“快速相亲”活动，这个配对过程就是对盖尔-沙普利（Gale-Shapley）“延迟接受”（deferred acceptance）程序的一次运用。而从上世纪80年代开始，罗思先是考察了用来将医学院毕业生分配到医院的住院实习医师系统，并确定这个系统可以形成“稳定匹配”。2004年，罗思帮助重新设计了纽约市高中生择校入学过程。根据旧的系统，学生要列出自己最希望进入的五所高中。而学校则更可能接收那些将自己列为第一选择的学生。经过三轮选择后，剩下的学生通过行政过程分配给高中，每年有约三万名学生被分到他们未选的学校。罗思根据沙普利和盖尔最初的算法，设计了一个新的系统，解决了这类问题。新系统实施的第一年，被分到自己未选的学校的学生人数减少了90%，也就是说使得没能被自己所选任一学校录取的学生人数从2002年的3万名降至2003年的3000名。
    当该理论及其应用为人们所理解时确实如此。但直到近期，这些匹配机制才被用于改善我们的生活。因此，要说服我们不再使用不够稳定的匹配机制，显然需要聪明的头脑。
    在结果公布后接受诺贝尔奖委员会电话采访时，罗思坦言对理论的应用很有兴趣，他说，“经济学是关注现实生活的。”在他现在开设的课程中，一门叫做“市场设计”，另一门叫做“实验经济学”。实验经济学就是进行实验，把经济学带入实验室，或者在这个领域里建立可控条件，以帮助人们理解不可控环境中发生的现象。而市场设计是有关市场运行的细节的，理解了足够的市场细节，就可以在市场失灵时修复它。
    可见，无论是“配对理论”也好，“市场设计”也好，都是要解决价格机制不能发挥资源优化配置的功能，或者其他市场失灵的问题。这对现在陷入停滞的全球经济而言，都极具现实意义。过于迷信市场的自我修复能力的“市场原教旨主义”者，或者过度依赖政府“看得见的手”干预的凯恩斯主义者，也许都不是危机的对症药方，反而可能延误时机，或者加重病症。相对而言，“制度设计”可能是更加理性的选择。
    有评论指出，这次诺贝尔经济学奖的评选秉承了诺奖一贯的严苛标准：一个杰出的理论贡献必须经过足够长时间的检验。上世纪60年代，盖尔-沙普利的算法虽然着眼于对现实问题的研究，但似乎过于阳春白雪，很难说有什么现实意义。但经过50年的发展，这一成果却在深深地影响政策与实践，以及经济理论。
    还有评论指出，自金融危机爆发以来，近几年的诺贝尔经济学奖所评奖项也显现出回归社会价值的趋势。究其原因，也很可能是科学家希望通过诺奖的评奖结果，让人们更加理性地关注现存的社会问题。他举例称，2009年，美国经济学家Elinor Ostrom与另一位经济学者分享了诺贝尔经济学奖，作为有史以来第一位获得诺贝尔经济学奖的女性，Elinor Ostrom的研究领域正是对公共资源管理的分析，她在对资源使用者管理的鱼塘、森林、湖泊和地下水资源进行了大量研究之后，发现了公共事务的治理秩序和机制。

背景资料1：诺贝尔经济学奖与博弈论
    博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。属应用数学的一个分支，已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。
    从1994年诺贝尔经济学奖授予3位博弈论专家开始，迄今为止，共有6届的诺贝尔经济学奖与博弈论的研究有关，作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。
    与博弈论研究有关的诺贝尔经济学奖分别为：
    1994年，授予美国伯克利加利福尼亚大学的约翰•海萨尼（J.Narsanyi）、普林斯顿大学约翰•纳什（J.Nash）和德国波恩大学的赖因哈德•泽尔滕（Reinhard Selten）。
    1996年，授予英国剑桥大学的詹姆斯•莫里斯（James A. Mirrlees）与美国哥伦比亚大学的威廉•维克瑞（William Vickrey）。
    2001年，授予美国加州大学伯克莱分校的乔治•阿克尔洛夫（George A. Akerlof ）生于1940年、美国斯坦福大学的迈克尔•斯宾塞（A. Michael Spence ）和美国纽约哥伦比亚大学的约瑟夫•斯蒂格利茨（Joseph E. Stiglitz）。
    2005年，授予美国马里兰大学的托马斯•克罗姆比•谢林（Thomas Crombie Schelling）和耶路撒冷希伯来大学的罗伯特•约翰•奥曼（Robert John Aumann）。
    2007年，授予美国明尼苏达大学的里奥尼德•赫维茨（Leonid Hurwicz）、美国普林斯顿大学的埃里克•马斯金（Eric S. Maskin）以及美国芝加哥大学的罗杰•迈尔森（Roger B. Myerson）。
    2012年，授予哈佛大学教授埃尔文-罗思（Alvin E. Roth）及加州大学罗伊德-沙普利（Lloyd S. Shapley）。
背景资料2：近五年诺贝尔经济学奖得主与主要成就回顾
    2011年，美国普林斯顿大学的克里斯托弗•西姆斯（Christopher A. Sims）及纽约大学的托马斯•萨金特（Thomas J. Sargent）。两名获奖者的研究成果解答了许多有关经济政策与宏观经济变量之间的关系问题，例如提高利率或减税将对国内生产总值和通货膨胀产生何种影响，中央银行调整通货膨胀目标将产生何种后果等。
    2010年，美国经济学家彼得•戴蒙德（Peter A. Diamond）和戴尔•莫滕森（Dale T. Mortensen），以及具有英国和塞浦路斯双重国籍的经济学家克里斯托弗•皮萨里季斯（Christopher A. Pissarides）。这三名经济学家凭借对“经济政策如何影响失业率”理论的进一步分析，摘得2010年诺贝尔经济学奖桂冠。
    2009年，美国经济学家埃莉诺•奥斯特罗姆（Elinor Ostrom）和奥利弗•威廉森（ Oliver E. Williamson）。奥斯特罗姆因为“在经济管理方面的分析、特别是对公共资源管理的分析”获奖，威廉森则因为“在经济管理方面的分析、特别是对公司边界问题的分析”获奖。
    2008年，美国经济学家保罗•克鲁格曼（Paul Krugman）。克鲁格曼整合了此前经济学界在国际贸易和地理经济学方面的研究，在自由贸易、全球化以及推动世界范围内城市化进程的动因方面形成了一套理论。
    2007年，美国经济学家莱昂尼德•赫维奇、埃里克•马斯金和罗杰•迈尔森。他们在创立和发展“机制设计理论”方面做出了贡献。“机制设计理论”最早由赫维奇提出，马斯金和迈尔森则进一步发展了这一理论。这一理论有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效，哪些情况下市场机制无效。        （完）

2012年诺贝尔经济学奖相关评析

天津大学马寅初经济学院2022年预聘教

北京大学国家发展研究院招聘事业编制

北大汇丰智库研究实习岗位招聘启事

17人看过

11人看过

15人看过

15人看过

9人看过