注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

故事接龙:孙子兵法中的博弈论思想

讨论兵法艺术和博弈论之间的某种微妙的关系绝对不是一个人的突发奇想。迄有生民以来,人类战争工具的军备竞赛几乎一次又一次地改变历史的方向。古代的中华文明以其富庶而闻名于世,但是不幸成为军备竞赛中的失败者,它似乎无法发展出一种比战马更有效的战争工具,因而吃尽了战马给它带来的苦头。近代以来的战争工具更是日新月异。让人惊奇的是战争的理论长期被人们称作战争的艺术,几千年以来它就象长不大的孩子一样,一直变化不大。难怪《孙子兵法》这部伟大军事理论著作在今天还是经典中的传奇。早在两千多年前孙子就给我们描绘了一个马基雅维利的世界——狮子般的凶猛,狐狸般的狡猾,预计它在遥远的未来还将在人们的头脑中留下深刻的痕迹。现代社会是科学昌明的社会,它满脑子充满对经验的拷问,它甚至成功地把战争理论中的经验性科学部分分离出来,但是它还能够向纯理论方向再进一步吗?所幸战争给予了这样的机会,早期的博弈论就是从二战的实践中发展出来。讨论《孙子兵法》中的博弈论思想,除了满足人们对博弈论的兴趣之外,主要的目的还是老问题:科学还是艺术。不要指望能够得到什么二者择一的回答,因为科学源于自然而非社会。自然科学是幸运儿,爱因斯坦说:“上帝精明,但无恶意。”可怜我们的社会科学面临更多的却是心怀叵测的人类,战争的理论恰如其分的显示了人类身上的这种魔性。或许一番有意义的讨论会向我们表明,博弈论正是战争理论经验性科学部分中基石。


待续

*我在人大论坛写的,算胡诌吧。在那边没有人评价一下,不知道写得怎样,到这边碰碰运气,没人觉得有意思就不接下去了。


一、战争本质

《孙子》始计篇开篇就道出慎战的思想,始计篇认为“兵者,国之大事,死生之地,存亡之道,不可不察也”。慎战的思想向来为兵家所推崇,也是现代博弈论的主要结论之一。孙子阐述的思想正好符合博弈论认为战争是零和博弈的研究,表明孙子已经认识到战争的本质就是零和博弈了。在孙子的意识中,战争本身就是为了争利,《孙子》处处渗透出争利的思想。作战篇提出,将帅不知道战争的害处,就不可能理解战争的好处。谋攻篇更是提出著名的“百战百胜,非善之善也;不战而屈人之兵,善之善者也”论断。孙子的利等于博弈论的得益,根据利来决定战争的行动或者策略,无疑等于说战争的行动以及战争决策本身内生于博弈的得益结构。现代博弈论在此作出了非常有说服力的推理,其经典做法是应用鹰鸽进化博弈来模拟战争中的侵略和反抗。鹰鸽博弈的ESS策略表明诸侯国之间和平关系的主流情况,以非战争手段欺压对手的情况次之,双方兵戎相见的情况最少。ESS策略是慎战思想的有力证据。谋攻篇说:夫用兵之法,全国为上,破国次之;全军为上,破军次之;全旅为上,破旅次之;全卒为上,破卒次之;全伍为上,破伍次之。孙子明白地告诉人们,武力战争是下策,引而不发大棒式威胁是上策。当然平等的交往排除在战争的考虑之列。


二、战争贴现率

经济学和博弈论的世界是一个利率和贴现率满天飞的世界。普通人经常以为此乃平常之物而怠慢于它,当然就无法体会它的强大威力了。讨价还价博弈和重复博弈都把贴现率看作是耐心的度量,以此平衡现在和未来。经济学干脆就把利率看作是人们不耐心的冲动。孙子看出了战争的得益也面临这种危险的贴现。谋攻篇说:“日费千金,然后十万之师举矣。”战争需要一个庞大的消耗流量来支撑,消耗的流量意味着战争每进行一天,战争的得益就减少相应的数量。于是现在和未来之间达成一种微妙的平衡,人们赋予现在一个更大的权重,博弈论用贴现率标识这样的世界。所以孙子得出结论:“故兵贵胜,不贵久”。这是战争最重要的原则之一。

谋攻篇说:“故兵闻拙速,未睹巧之久也。”这是理解我国历史上无数战争局势的关键所在,也是先人最擅长的智慧。在判断一场旗鼓相当的战争时,我们的先人首先看到的是战争双方的贴现率,也就是双方不耐心的冲动指数,“吾故知其败”。一场力量不对称战争中,战争的局势及其容易演化成一方高挂免战牌另一方求战不得之后退兵的情形。三国时刘备入川苦战几年最后攻到成都之下,这是一场微妙的战争。许多刘璋的下属劝刘璋把成都外围的百姓迁入成都,粮食烧光,来一个壁野清坚。刘璋没有采取这些意见,史书记载由于仁慈和懦弱刘璋选择了投降,后人读到这里不免叹息。我认为历史几乎不可能出错,这只能证明刘备是一个贴现率很低的怪物。刘备在荆州人多地窄,没有发展土地势必会崩溃,因而时时充满着危机感,未来价值太低。虽然刘备本人有“折而不饶”人格,刘备是一个非常注重未来价值的人,但是时局迫使他采取鱼死网破的策略。刘璋输的合情合理。

贴现率不是一成不变的,孙子提出“因粮于敌”可以提高自身的贴现率。因粮于敌后来也成为一个有名的战术。但是,“夫兵久而国利者,未之有也。”


三、没有行动的参与人

大凡我们考察一个博弈,首先要明白的是博弈规则,其中最为基本的问题是数一数博弈的参与人。博弈论的一个可贵之处在于,即使对最基本问题的追究,也能够给我们提供某些深刻的洞见。人类的思维实在存在设计上的大谬误。你可能在温润的阳光中享受太阳给予的恩赐,你甚至看到了阳光普照大地,但是你的脑袋可能根本就不会去想像天上存在一个太阳。有些显而易见的东西,你不去想像它的存在,直到它强烈刺激你的心灵。

作战篇说:“夫钝兵挫锐,屈力殚货,则诸侯乘其弊而起,虽有智者不能善其后矣。”孙子的战争参与人已经超越了作战的双方了,用博弈论的话语来说,就是博弈中存在某些没有机会行动的参与人。当然这些战争参与人出于非均衡路径之上,但是非均衡路径上的行动强烈地影响到博弈的均衡,他们只是看上去没有“行动”,他们的行动其实就是选择不加入战争。后来的人们根据经验提出很多法则,有人说眼界要开阔,有人说要用发展的、运动的眼光看问题,有人说要看到万事万物的普遍联系,而我以为这些话都有一点玄,哲学味道太浓了,唯有博弈论在这点上表现出真正的纯理论。

以我们得到的观点来看曹丕,此人和陆逊、孔明的智慧相差远矣。刘备一场夷陵大战打得一塌*涂,陆逊和孔明都对未来了如指掌,他们都已经看出夷陵大战其实存在三个战争参与人:蜀、吴、魏。曹丕自以为得计,起兵攻吴,结果失败。


四、最大化最小

如果你处在人人心怀恶意的世界,你应该怎么办呢?战争把人与人之间的恶意发挥到了极至,以至于哲人断言:对敌人的仁慈就是对自己人的残忍。军形篇提出原则:“昔之善战者,先为不可胜,以待敌之可胜。”孙子说胜利是不可强求的,将帅的立足点应该是制造敌人不能战胜的局面。孙子可能已经意识到了战争的原则应该最大化最小得益。在形成某种均势的情况下,战争的一方是可以努力得到最小得益:不被敌人战败,最大化战争得益是不可能的,因为对方总是一个心怀恶意的敌人。我们可以把先为不可胜理解成最小得益,把待敌之可胜理解成最大化得益,于是整句话就是最大化最小得益了。先为不可胜,以待敌之可胜是考虑到敌我互动而提出的明智原则,初步地具有博弈论纳什均衡解概念的身影。孙子明了战争攻守双方力量的不对称性,一般情况下守方具有多种优势可以弥补兵力的不足,所以战争很少一开始就出现一边倒的情况,必须在确保自身不被敌人战败的情况下争取胜利。至于如何待敌之可胜,有时候也许只能指望上天的垂青了。这让我想起了五仗原的秋风、衰草、沙场和兵营,孔明长叹:“悠悠苍天,曷此其极!”。孔明用生命下注。可是孙子说:“胜可知,而不可为也。”


五、承诺和反承诺

九地篇说:“投之亡地而后存,陷之死地然后生。”可惜的是大多数人已经不知道这个警句了,孙子的两个追随者的话倒是成为朗朗上口的成语,项羽留下著名的“破釜沉舟”,韩信则来一个“背水一战”,或者是“置之死地而后生”。这些有关承诺行动的著名故事,我相信读者已经一听到就已经产生亲切的感觉了,所以无需再说。承诺行动从含义上来讲是在非均衡路径上创造有成本的行动来改变均衡路径,至于均衡路径上的行动是什么,需要仔细地分析。例如韩信背水一战,韩信希望的行动应该理解为汉军选择勇敢。如果没有背水布阵,汉军面对人数多出十几倍的赵军,均衡路径上的行动就是懦弱了。
反承诺本来是博弈论中没有的概念,只是为了方便而引进来。孙子在军争篇说:“归师勿遏,围师遗阙,穷寇勿追。”在有些情况下,如果我方力量没有压倒性优势,不能主动给敌人造成承诺行动的局势。归心似箭的军队是不可阻挡的,你想一下消灭它,切断它的归路,那么你只会引火烧身,你改变了它在均衡路径上的行动。围师遗阙后来也变调了,在三国中变成了“围城必阙”,关羽走麦城精彩地表演这一军事原则。
承诺和反承诺在《孙子》中只是作为战术来加以阐述的,我认为它们实际上可以作为军事思想来加以阐述的,因为现实生活中非均衡路径上行动影响均衡路径上的行动的例子比比皆是,构建一个承诺和拆卸一个承诺不局限于特定的行动。反承诺还有特殊的意义,有时它可以演变成一个动态过程。考虑围城必阙的案例,给定围困敌人在一个城市,三个城门堵住,一个城门放开。这时敌人最佳行动是逃,第一波杀伤之后,敌人最佳行动还是逃,如此动态循环,可以得到最大得益。
我毕竟不是军事专家,许多事情其实是不知道的。举一个例子:在一战的时候,英国和德国海军展开日德兰大海战,德国海军想引诱英国一只舰队到指定区域,其主力则埋伏在一边伺机消灭英国人。不幸的是英国人破译了德国人的密码,于是也把主力调往该区域,想凭借海军优势一举消灭德国人。两只主力海军相遇,德国人不敢决战,于是往北逃跑。英国海军司令作出一个关键性决定,他没有追击德国海军,而是等在德国海军返回母港的路上等着和德国海军决战。这是一个紧张的时刻,英国人忘记了归师勿遏的原则。说实话,看了博弈论书并不能帮助我判断英国海军的决定是正确还是错误。


六、先发优势

孙子说用兵最难的部分是军争,军争争夺的是先机,也就是博弈论中经常提到的先发优势。我们知道在序贯博弈中常常存在先发优势,首先行动的参与人能够得到更多得益。在战争的实践中,我们需要拓展先发优势的涵义,我们把敌我双方谁抢先采取某个特定行动谁就得到更多得益情况看作是先发优势,实际上谁抢先行动就引发一个局部博弈,象战争这样漫长的过程难以简化为一个单一的博弈。
回忆序贯行动的古诺博弈和多阶段讨价还价博弈,里面都存在先发优势。为什么一些博弈存在先发优势依赖于实际情况,但是在战争中确实在许多情况下存在先发优势,博弈论所能告诉人们的就是在存在先发优势的博弈中参与人需要抢先行动。孙子在军争篇中提出争夺先发优势的原则:“军争之难者,以迂为直,以换为利。”所谓迂直之计就是指这一点。
在博弈论中先发优势就是首先行动,但是在战争实践中往往会出现争夺先发优势而采取行动的博弈,则是另外一个博弈了。孙子指出在后一个博弈中需要谨慎地权衡代价。据我的理解,争夺先发优势早就成为军事指挥员的必修课了,所需要的技巧只是如何识别那种行动会导致先发优势,例如首先占领某个交通要道。孙子还提出以逸待劳的思想,这是在战略上争夺先发优势。


nftwo:
 
为你的执着多打动,就先发优势我说一下我的看法吧。对错不敢保证,可能有所启发。首先是多重均衡问题,在一个多人博弈中存在奇数个均衡点,这个用微分几何里面的旁加莱-霍普夫定理可以证明。但是在一个偏好不相容的世界中,谁拥有选择均衡点的权利谁就能够选择对自己最有利的均衡点。而先发优势首先说明的是这一点,把握战争的主动权就是把握了均衡的选择权。
其次就是时间偏好问题了。假设在某个均衡点上A方达到均衡点需要的时间为t1,而

B方达到均衡点的时间为t2。在t1

择先动,在t1时刻打响战争,这是先发优势或者先发制人。而如果B方拥有选择均衡

点的权利他并不会先动,而是采取脱的策略,这是后发优势,也可以称为后发制人。

呵呵,如果愿意学博弈论,多看点数学书吧,拓扑学和几何可能能够帮助你建立起抽象思维的框架。而优化理论如动态规划和动态优化又能够使你的思维框架能够很好的运用。这仅仅是参考建议。另外,博弈一般都是多重均衡的,近三十年以来已经有不少学者在这个领域进行研究了。放宽研究和分析的视野可能会好一点。


cluo007:

谢谢指教,我的原意是把孙子兵法中的一些片断思考一下。
离构建理论框架远十万八千里,呵呵。
或许终究会有理论框架,等大师吧。


继续:http://bbs.efnchina.com/dispbbs.asp?boardID=92512&ID=82397

文章评论
关注我们

快速入口
回到顶部
深圳网站建设