一报还一报

A-A+
书摘 2008-06-23 08:48:01 来源：《财经》杂志作者：梁捷 0

　　合作与信任是人类社会得以存在和发展的基础，但它们总会被自私所侵蚀。霍布斯认为，无论人与人还是国与国的关系，随着资源稀缺的加剧，都会变得更接近狼与狼的关系。但是，现代社会终究没有沦为原始丛林，有合作善意的人群还没有灭绝，人与人之间的温情和信任也没有消失——自私和克制自私，似乎同样属于人类本能。
　　由此，密歇根大学政治学家罗伯特·阿克塞尔罗德（Robert Axelrod）开始思考：在现代复杂社会中，何种行为规则才是个人收益最大化的最优竞争策略？
　　上世纪80年代，他写信给不同学科的学者，让他们提供自以为最佳的行为规则，然后编成电脑程序，相互竞赛。第一场锦标赛，他共收到14个程序，在捉对厮杀中，程序运转了十多万次，最后按照总得分排出名次。胜出的程序，竟是其中最简单明了的“一报还一报”（Tit for Tat）。
　　“一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人，在没有被欺骗之前，永远不要主动欺骗他人；但一旦发现他人的欺骗，下次交往时要毫不犹豫地报复、惩罚；惩罚过后，又回到起点，继续善意待人。这种行为规则中，永远只需记忆最近一次的对方行为，宽容看待对方的过往行为，除了上一次背叛。
　　很快，阿克塞尔罗德又组织了第二场锦标赛。这次他收到了62个程序，其中还有不少程序针对“一报还一报”做了专门改进。一场混战的结果是，“一报还一报”再次排名第一。
　　这两次锦标赛充分证明了“一报还一报”策略的威力。阿克塞尔罗德后来曾公开征集可能打败它的策略程序，但20多年过去，还没有程序能做到这一点。阿氏把“一报还一报”所体现的精神归纳为“KISS”（Keep It Simple，Stupid）原则，即尽可能简单、愚蠢。简单到可以用一句话概括，又愚蠢到不记忆对手的历史行为，正应了“大智若愚”的中国老话。
　　阿克塞尔罗德继续发展这套工具，开始研究不同策略行动在大规模、长时段、更复杂的社会演化过程中的表现。他发现，一旦在电脑锦标赛中加入博弈者之间的误解、合谋、垄断等更贴近现实社会的要素，就会出现新问题。以“一报还一报”策略为例，单纯的“一报还一报”不大可能成为“坏策略”，因为它不会总被人利用；但它也不见得永远都是“好策略”，因为有时它不够宽容。
　　真实的社会交往中，我们只能通过他人行动来推测其动机，这样很容易产生误解，既会误解别人，也被别人误解。当两个都采用“一报还一报”策略的人相遇，其中一方偶尔误解对方，实行报复，双方就可能陷入报复循环，不能自拔。此时，附加一些宽容条件，如容许对方偶尔犯错，容许对方自我悔悟等，这样的策略会取得更好的结果。
　　这表明，社会秩序和规范并非由简单利诱或威慑压力造成，必须考虑总体环境与各种文化、制度的影响。个人行动策略必须置于总体社会的演化过程之中，意义才可能凸现。行动者在选择行动策略时，真正要面对的不仅是单个竞争对手，还有各自所处的小团体和大团体，各式各样的显规则和潜规则。这时，威慑、法律、声誉、社会认同、成员身份等非经济约束都可能起到很大作用。
　　尤其值得一提的是，阿克塞尔罗德发现了“元规范”的作用。所谓“元规范”，就是行动者不仅自身遵循社会规范，而且也不惜付出代价，主动惩罚不遵守规范的人。从短视的经济人角度看，个人付出代价来维护集体利益并不理性，但“元规范”在稳定的人类社会中却广泛存在，对社会进步起到极大作用。阿氏的大型计算机仿真实验，有力地证明了这一点——虽然个人在短期内看不到收益，但在足够长的时间内，良好的社会秩序总会逐步回馈个人。
　　阿克塞尔罗德指出，设定行动者的策略，利用大型计算机仿真程序来研究人类社会演化过程，已经成为现代社会科学中的一种基础研究方法。它不仅适用于生物进化、历史发展研究，还被广泛运用到国际关系、商业联盟、文化传播等领域，取得许多重要成果，并为现实数据所验证。因此，为当代社会科学研究引介一套利用计算机仿真的研究方法，恐怕才是阿氏此书的真正目的。
　　不过，如康德所言，应然世界与实然世界之间存在不可逾越的鸿沟。完全信赖计算机对真实世界的仿真和引导是荒谬的。在并不清楚为什么要合作的时候，人类已经广泛开展合作。从这个意义上说，阿克塞尔罗德的研究只是再次证明了人类的合作本能。但毕竟，他揭示出了社会合作互动中的一些关键环节，因而极大增进了人类对自身的理解。

　　《合作的复杂性：基于参与者竞争与合作的模型》，（美）罗伯特·阿克塞尔罗德著，梁捷、高笑梅等译，上海人民出版社2008年4月第一版。
　　本文作者为复旦大学经济学院博士研究生

一报还一报

天津大学马寅初经济学院2022年预聘教

北京大学国家发展研究院招聘事业编制

北大汇丰智库研究实习岗位招聘启事

17人看过

23人看过

18人看过

21人看过

3人看过