注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

一报还一报

  合作与信任是人类社会得以存在和发展的基础,但它们总会被自私所侵蚀。霍布斯认为,无论人与人还是国与国的关系,随着资源稀缺的加剧,都会变得更接近狼与狼的关系。但是,现代社会终究没有沦为原始丛林,有合作善意的人群还没有灭绝,人与人之间的温情和信任也没有消失——自私和克制自私,似乎同样属于人类本能。 
  由此,密歇根大学政治学家罗伯特·阿克塞尔罗德(Robert Axelrod)开始思考:在现代复杂社会中,何种行为规则才是个人收益最大化的最优竞争策略? 
  上世纪80年代,他写信给不同学科的学者,让他们提供自以为最佳的行为规则,然后编成电脑程序,相互竞赛。第一场锦标赛,他共收到14个程序,在捉对厮杀中,程序运转了十多万次,最后按照总得分排出名次。胜出的程序,竟是其中最简单明了的“一报还一报”(Tit for Tat)。 
  “一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人,在没有被欺骗之前,永远不要主动欺骗他人;但一旦发现他人的欺骗,下次交往时要毫不犹豫地报复、惩罚;惩罚过后,又回到起点,继续善意待人。这种行为规则中,永远只需记忆最近一次的对方行为,宽容看待对方的过往行为,除了上一次背叛。 
  很快,阿克塞尔罗德又组织了第二场锦标赛。这次他收到了62个程序,其中还有不少程序针对“一报还一报”做了专门改进。一场混战的结果是,“一报还一报”再次排名第一。 
  这两次锦标赛充分证明了“一报还一报”策略的威力。阿克塞尔罗德后来曾公开征集可能打败它的策略程序,但20多年过去,还没有程序能做到这一点。阿氏把“一报还一报”所体现的精神归纳为“KISS”(Keep It Simple,Stupid)原则,即尽可能简单、愚蠢。简单到可以用一句话概括,又愚蠢到不记忆对手的历史行为,正应了“大智若愚”的中国老话。 
  阿克塞尔罗德继续发展这套工具,开始研究不同策略行动在大规模、长时段、更复杂的社会演化过程中的表现。他发现,一旦在电脑锦标赛中加入博弈者之间的误解、合谋、垄断等更贴近现实社会的要素,就会出现新问题。以“一报还一报”策略为例,单纯的“一报还一报”不大可能成为“坏策略”,因为它不会总被人利用;但它也不见得永远都是“好策略”,因为有时它不够宽容。 
  真实的社会交往中,我们只能通过他人行动来推测其动机,这样很容易产生误解,既会误解别人,也被别人误解。当两个都采用“一报还一报”策略的人相遇,其中一方偶尔误解对方,实行报复,双方就可能陷入报复循环,不能自拔。此时,附加一些宽容条件,如容许对方偶尔犯错,容许对方自我悔悟等,这样的策略会取得更好的结果。 
  这表明,社会秩序和规范并非由简单利诱或威慑压力造成,必须考虑总体环境与各种文化、制度的影响。个人行动策略必须置于总体社会的演化过程之中,意义才可能凸现。行动者在选择行动策略时,真正要面对的不仅是单个竞争对手,还有各自所处的小团体和大团体,各式各样的显规则和潜规则。这时,威慑、法律、声誉、社会认同、成员身份等非经济约束都可能起到很大作用。 
  尤其值得一提的是,阿克塞尔罗德发现了“元规范”的作用。所谓“元规范”,就是行动者不仅自身遵循社会规范,而且也不惜付出代价,主动惩罚不遵守规范的人。从短视的经济人角度看,个人付出代价来维护集体利益并不理性,但“元规范”在稳定的人类社会中却广泛存在,对社会进步起到极大作用。阿氏的大型计算机仿真实验,有力地证明了这一点——虽然个人在短期内看不到收益,但在足够长的时间内,良好的社会秩序总会逐步回馈个人。 
  阿克塞尔罗德指出,设定行动者的策略,利用大型计算机仿真程序来研究人类社会演化过程,已经成为现代社会科学中的一种基础研究方法。它不仅适用于生物进化、历史发展研究,还被广泛运用到国际关系、商业联盟、文化传播等领域,取得许多重要成果,并为现实数据所验证。因此,为当代社会科学研究引介一套利用计算机仿真的研究方法,恐怕才是阿氏此书的真正目的。 
  不过,如康德所言,应然世界与实然世界之间存在不可逾越的鸿沟。完全信赖计算机对真实世界的仿真和引导是荒谬的。在并不清楚为什么要合作的时候,人类已经广泛开展合作。从这个意义上说,阿克塞尔罗德的研究只是再次证明了人类的合作本能。但毕竟,他揭示出了社会合作互动中的一些关键环节,因而极大增进了人类对自身的理解。

  《合作的复杂性:基于参与者竞争与合作的模型》,(美)罗伯特·阿克塞尔罗德著,梁捷、高笑梅等译,上海人民出版社2008年4月第一版。
  本文作者为复旦大学经济学院博士研究生

相关阅读
文章评论
关注我们

快速入口
回到顶部
深圳网站建设