注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

关于股市里的买涨不买跌的讨论

uppsala:

前面在看网友讨论积芬商品的时候提到这点,我突然有个想法,觉得这是股市容易产生泡沫的一个根源。价格越高,需求越大。当然这里面是因为预期的不断改变,推动需求曲线不断右移。但应该可以用来解释股市频繁boom to bust的根本所在。

不过我不是搞Finance的,这里有朋友比较熟悉Finance文献的,是否知道在这个方面已经有经典的模型和理论呢,并可以提供有关文献的,谢谢!


puyjan:
 
楼主对“买涨不买跌”的理解是错误的——买涨不买跌——它不是说价格越高,需求量就越大。它说的是价格的上涨速度越大,需求量就越大。


uppsala:
 
对,我没表达清楚。我的意思是,这里出现的有趣现象是,第一,价格上升带来需求上升,用简单的一般需求理论不好解释,第二,需求对价格的反应偏导数是非对称的。有没有这方面好的文献?
不熟悉这方面,连关键词都不知道用哪个比较好去检索。


puyjan:
 
楼上,你说——价格上升带来需求上升,用简单的一般需求理论不好解释——不会吧!
买卖股票是投资行为。如果价格上涨,投资者就预期在这种上涨持续一定的时间之后,投资的回报可以补偿风险时,就买;否则就不买。不同的投资者预期的上涨持续时间和投资风险是不同的,所以,不是每个人都会在股票价格的一个上升时期会买股票的。所以,现有的理论是可以解释的。


uppsala:
 
我其实主要想从股票这里找到灵感来解释大宗商品的价格波动。
在价格快速上涨的时候,人们会被迷惑,忘记商品价格最终应该由基本面来决定。

What I am interested is how the voliate boom-to-boost cycles in prices could be due to the self-fulfilling prophecies of market participants, which can be called as "bubble". In this occasion, speculators act on “average opinion", rather than focusing on things fundmental to the market.

I begin to read some literature on "rational bubbles", but not fully satisfied yet.


util:
 
价格——需求量
预期——需求


godvsgod:
 
买涨不买跌的根本原因在于预期。试想如果价格狂跌,人们对未来的预期自然是下跌的。那么,人会买下跌的股票么,当然不会。事实上,理论上低买高卖。但那是很难实现的。人不是神,不会肯定的知道明天会发生什么事情。换句话说,人们没有经济学家想象的那么理性。很简单的事情被经济学家搞得这么复杂。叹!


puyjan:

事实上,人们的行为比经济学家想象的还要理性的多。


zhang7000:

如果具体到股票市场,我觉得不是说价格越高越买,也不是价格上涨的速度越大越买。具体来说应该区分不同的阶段。在市场上升的初期,价格越涨,交易越大,因为这时候大家预期市场的趋势是相同的,认为还会涨,所以要在低位尽可能买够,而到了相对高位的时候,由于大家对未来的趋势存在分歧,这时候价格越涨虽然交易量会比较大,但这其中主动性卖出的大于主动性买入的,因此即使交易量很大,但价格只是微涨,甚至下跌,而当大家对行情趋势逆转达成共识后,行情也就结束了。
所以你看到的交易量还应该有所区分,即是主动性买进还是主动性卖出。这是有区别的。


util:

以下是引用puyjan在2004-8-5 8:41:00的发言:
事实上,人们的行为比经济学家想象的还要理性的多。


其实经济学还应该将非理性(不是反理性)行为做为研究对象。
因为非理性同样是人对稀缺世界做出的适应性反应。稀缺性是经济学的前提,而仅对理性经济人进行假设和研究,说到底是经济学家的“偷懒”的心理,是对现实中人类行为集合的元素的歧视,是对活生生的人的阉割。


张三李四:

我觉得在讨论这个问题之前,应该把什么是“理性“说清楚


util:

主流经济学对理性的定义是:符合偏好假设的就是理性经济人。
但是实验经济学,新制度经学的成果表明,经济人应该是相同收益的成本最小化,相同支出时利润最大化。这就应该包括理性和非理性,这都是对稀缺世界做出的适应性反应。妈妈将家里的最后一点粮食流着眼泪放进同样饿得流着眼泪孩子的小嘴里,而自己最后饿死。大地震时,大人本能地用血肉之躯撑起巨大的钢筋混凝土碎块,护住身下的孩子。这都是在紧急情形下人类做出的适应性反应。这些同样是应付稀缺世界的有效方式,而且是非常必要的,因为在那个时候这是最有效的方式。
对于非理性的问题,下次再补上。食堂快没饭了,我做出一个适应性反应先。


puyjan:

科学上的假设是为了对于现象的解释与预测。如果用非理性作为假设,那么就没有解释不了的东西了,因而在其基础上作出的理论就不可能被证伪。那么,根据我们现在的判断理论是否科学的标准——证伪标准,这些理论都是伪科学理论了。所以,试图在非理性基础上建立经济理论的尝试是毫无意义得了。


util:

试图在非理性基础上建立经济理论的尝试是毫无意义得了?professor pu是满学之士,util是一个门外汉,偶尔也翻翻书。引引看到一本书关于这个问题的说明。(《经济制度演进大纲》李建德)
“经济人”,是能对稀缺作出适应性反应的人。因此,经济人的行为不仅仅是理(rational)判断的结果,也可以是非理性(irrational)的回应.因为人类的意识,不仅是理性的还是非理性的(并不是反理性的),都是对环境适应的反映。
非理性的行为主要有本能,习惯,习俗,从众等。在稀缺条件下的早期人类,作出选择所依赖的,更多地是从非理性的意识开始。本能,习惯,习俗,从众等非理性行为正是人类早期适应稀缺而产生的心理反应。这些非理性的反应是从不断的试错过程中形成的经验,又以一定的(包括宗教迷信在内的)文化形态,在早期人类中一代一代传递并积累起来。”“随着人类智能的发育,理性能力不断地提高,在稀缺条件下进行选择时,才能更多地依赖于理性的思考。就人类而言,可以把理性看成是非理性在历史演进过程中智能的进一步延伸。当然,理性要素比非理性要素有强得多的适应能力。这个意义上说,非理性往往对环境有滞后的回应。不过,在理性已经发展了的条件下,当”外界环境发生变化后,种种非理性要素是否仍然适应变化后的环境,是否需要调整,就有理性在起主导作用。由于有了理性的指导或引导,在现代社会中,环境的变迁大大习快于传统社会时,非理性的变化才能比较适应加速变化中的环境。
“从这个意义上说,不能把”非理性”理解为“对效用最大化的任何偏离“。非理性恰恰同样是人类对稀缺的一种适应。对”最大、最小“的严重偏离是反理性(anti-rational),而不是非理性。正如马斯洛所说:“在一般的本能-理性的两分法或对比中,相互对抗是被下错了定义的本能和理性。如按照现代知识来正确地划分,它们就不会被看成是相互对立或对抗。作为今天来定义的健康的理性与健康的似本能的冲动,在健康人那里并不互相排斥,而是指向同一个方向,(虽然对不健康的人而言,它们可能是互相对立的)。“”正是在这种非常明确的,可检验的意义上,我们断言似本能的需要和理性是合作的而非敌对的“。理智和冲动是协作的,而且强烈地倾向于殊途同归,而不是分道扬镖。非理性不一定是反理性的,而常常是亲理性的。“
太多了,可乐也喝光了,不打了,你们自己去看吧!


puyjan:
 
哈哈,楼上说的正是一种“理性”的固化——————进化理性,而不是什么“非理性”,看看我正在翻译的由Dixit写的一本书《Games of Strategy>中与此有关的一部分内容:

第十章进化博弈

迄今为止,我们已经研究了几种具有不同特征的博弈——同时行动的(静态)博弈、序贯(动态)博弈;零和博弈、非零和博弈 ;操纵博弈规则的战略性行动博弈,一次性博弈及重复博弈等等。 但是,在我们的讨论中,有一个基本的规则是保持不变的,即在这些博弈中的局中人都是理性的——每个局中人都有着内在一致的价值体系,能够计算其不同战略选择下的后果,并作出最有利于其利益的选择。
在运用这些规则的时候,我们只是沿用了大多数博弈论的方法,它们主要是由经济学家提出来的。经济学是建立在理性行为和均衡的双重假定之上的。的确,这些假定在博弈论中被证明是有用的。在局中人充分有规则的参与的博弈中,他们从经验中知道了他们的最优选择是什么,对此我们已经有了很好的理解。这些假定确保局中人不会错误地在对手面前显得天真无知而被对手所利用。理论也为局中人应该如何玩他们的博弈给出了一些引导。
然而,其他的社会科学家们对于理性假设持有极大的怀疑,进而对于建立在这一假设基础之上的博弈论也提出了置疑。正如我们在第七章里已经指出的那样,经济学家也不应当把理性假设视为理所当然的。麻烦的是需要找到一种可行的替换性假设。尽管我们不能把有意识的和完全可计算的理性强加于局中人,我们也不要放弃这样的一种思想,即某些战略比起其它的战略来说要好一些。我们要用较高的支付去奖赏好的战略;我们要局中人去对成功者进行观察或模仿,并用新的战略去进行尝试;当局中人从玩博弈中获得经验的时候,我们要好的战略被经常地使用,而不好的战略要更少地被使用。我们在生物进化论和进化动力学中找到了一种对于理性假设的可能的替代,于是我们就将本章用于这方面的研究。
1、 研究框架
生物学中的进化过程为社会科学家所使用的博弈论提供了一种特别有吸引力的参考。进化论的三个基础性假定是:异质性、适应性和选择。出发点是许多的动物行为是由基因决定的;一个或几个基因的复合体(遗传型)控制着特定的行为模式,被称为行为表现型(behavioral)。基因库的自然多样性保证了种群中表现型的异质性。某些行为比其它的行为更能适应当前的环境,并且表现型的成功可以被量化为适应性(fitness)。人们通常习惯于用那种众所周知的但是是误导性的词汇“ 适者生存”去进行思考;然而,对于生物学适应性的最终检验不仅仅是要看生物能否成功地生存,而且还要看生物能否成功地繁衍后代。那就是使得动物能够把它的基因传给下一代,并且使其表现型能够世代传承。于是,在下一代中更具适应性的表现型在数量上比起较不具有适应性的表现型来说就更加多一些。这种选择过程是动态的,它改变着遗传型和表现型的组合结构,并且也许最终达到一种稳定状态。
随着时间的推移,偶然的因素会带来新的基因突变。许多的这类突变产生了不适应环境的行为(即表现型),它们最终将消亡。但是偶然会有一种突变会带来一种较为适应环境的新的表现型,于是这样的一种突变基因就会成功地侵入一个种群,也就是说,它将扩散开来并且成为种群的一个显要的组成部分。
当属于某种表现型的种群不能被任何突变成功地侵入时,生物学家就称该表现型为进化稳定(evolutionary stable)的。被一种进化稳定表现型所运用的战略——它是这样的一种战略,即如果所有的现有表现型都运用这种战略,则种群里就会采用这种战略——就被称为进化稳定战略(ESS)。这是一种静态检验,但经常使用的是一种更加动态的标准:从任何一个表现型的复合体出发,如果种群进化到某种状态,其中该表现型占据了主导地位,那么该表型就是进化稳定的。[1]
表现型的适应性取决于个体与环境的关系。比如,一种鸟类的适应性就取决于它的翅膀的空气动力学特征。它还同时取决于存在于环境中的不同表现型的比例,相对于整个种群来说,它的翅膀是多大程度地利用着空气动力学原理的。因此,一种特定的动物的适应性,以及它的行为特点,诸如攻击性和社会性,是取决于种群中其它成员是不是更加具有攻击性或者是温顺的,喜欢群居的或者是独行的,等等。从我们的研究角度来说,一种物种内部的不同表现型之间的这种相互作用是故事中最令人感兴趣的方面。当然,有时一个个体也与其它物种的成员发生相互作用;于是,一种特定类型的羊的适应性就取决于当地狼群的现有特征。我们也要考虑到这种类型的相互作用,但仅仅是在我们完成了对于种群内情形的研究之后才去做。
在生物学中进化博弈的基本思路是:存在相互作用的情况下,在这样的相互作用——譬如,是进攻还是退却——中的一种动物的战略并不是经过计算而是由其表现型先天就决定了的。由于一个种群是由许多不同的表现型组成的复合体,因此其中任何一对都将带来这种战略的不同组合的相互作用。某些动物在它们所遇到的所有表现型面前,它们的战略平均看来更加适合于这种相互作用,那么它们将更加可能取得进化的成功。种群动力学的最终结果,或者说一种战略,当所有的局中人都选择它时,不会被任何其它的成功侵入所倾覆的话,就将是一种进化稳定战略。
生物学家们非常成功地运用了这一方法。攻击与合作行为的组合,巢穴的选择及其它无法用传统观点解释的更多的现象都可以理解为较为适应性的战略选择的一种进化过程的稳定结果。有趣的是,生物学家在使用已有的博弈论框架的时候发展了进化博弈的思想,他们抽取了其中的语言但却修改了有意识地最大化以适合它们需要的假定。目前,博弈论专家们又反过来运用生物进化博弈研究中所得到的启示来丰富他们自己的学科。[2]
的确,进化博弈的理论为博弈论放松理性行为假定的一种新方法提供了一个现成的框架。[3] 根据进化博弈的这种观点,局中人并没有自己选择战略的自由,有的局中人天生就得选择某种战略,而其他局中人天生就选择另外的战略。战略的遗传性思想在博弈论中比在生物学中被理解得更加广泛一些。在人类的相互作用中,有许多理由使得战略是被嵌入 到局中人的大脑里——不仅仅是由于遗传,还由于(并且可能是更加重要的)社会性,文化背景、教育及基于以往经验的大拇指法则。一种人群可能由具有不同背景或经验的不同个体的复合体组成,而这些个体先天性地被嵌入了不同的战略。所以有的政治家宁可放弃选举成功也要坚决地坚守一定的道德或伦理规范,而另外的政治家却更关心他们自己的连任;类似地,某些公司只追求利润,而另外的除了追求利润外,还有社会和生态的目标。
从具有先天性战略的异质性的种群中,挑选出许多对表现型的组合与同一种群或其它种群的表现型组合重复地进行相互作用(进行博弈)。每次相互作用中局中人的支付取决于双方的战略;这是符合通常的“博弈规则”并且在博弈表或博弈树中得到反映的。我们可以将某一战略的适应度定义为该战略与种群中所有其它战略博弈时的平均支付或总支付。某些战略的适应度比起其它的战略来看具有较高的水平,并且在种群的下一代——即下一轮的博弈中,适应度更高的战略将会被更多的局中人使用并扩散开来;而适应度较低的战略则只有较少的局中人才使用,然后就消失掉。核心的问题是种群中某些战略的选择性扩散或者消失的过程是否有一个进化稳定的结果,并且如果是这样,稳定的结果又是什么呢?回到我们刚才谈及的两个例子,社会是否最终会变成所有政治家只关心各自的连任和所有企业都只关心利润的情形呢?本章我们将提出用于回答这些问题的框架和方法来。
尽管我们使用了生物学的类比,但在社会经济博弈中为什么那些具有较高适应度的战略会扩散开来以及具有较低适应度的战略会消失的理由,是与 生物学中严格的遗传机制不尽相同的:在前一回合中混得好的局中人会将信息传递给下一回合中的朋友或同事们,而在前一回合中混得差的局中人会对成功的战略进行观察,然后接着去模仿它们,于是在随后的博弈中,局中人开始进行一些有目的的思考和对先前大拇指法则的修正。在大多数战略博弈中,这种有“社会的”和“教育的”的传递机制远比任何的生物学遗传显得更为重要,并且的确是,这种机制也正好解释了议会的重新选举机制和企业的利润最大动机为什么被增强了。最后,在博弈论中,新的战略的有意识的试验代替了生物学博弈中的偶然变异。
生物博弈的最终结果包含了一种很有意思的可能性,即单独的一种表现型不需要完全主导于进化动力学的最终结果中。两个或更多个表现型可能是同样适应的,它们各自以一定比例共存。这时我们称种群表现出多型性(ploymorphism),也就是说是多种表现型的共存。如果没有新的表现型或变异能够达到比现有多型性种群中的表现型适应度还更高的适应度,这种状态就是稳定的。多型性与博弈论中的混合战略概念是密切相关的。但是,也存在一个重要的区别。若要获得多型性,不需要个别局中人采用混合战略。每个局中人都选择纯战略,但是种群却会因不同局中人选择不同纯战略而表现出一种混合的博弈。
在本章中我们将象通常的那样,通过一系列的例子来提出某些思路。我们从对称博弈开始,其中两个局中人的特征是相同的,譬如,同一物种中的两个成员为争夺食物或配偶而相互竞争;在社会科学的理解里,他们可以是为了在公共事务方面继续行使权力而竞争着的两个候选官员。根据博弈的支付表,每个局中人都可以被安排成行局中人和列局中人而并不影响最后的结果。

2囚徒困境

假设一个种群由两类表现型组成.一类由那些天生就是合作者的局中人组成,他们在审讯下不会坦白;另一类由背叛者组成;他们准备好了要坦白。在这种博弈的一次性博弈中的各种类型局中人的支付由我们所熟悉的丈夫-妻子博弈给出,见表10.1,我们在这里用表10.1重新把它画出来,只不过这里要注意的,是在这个博弈中较高的数字是不好的.在这里,我们简单地将局中人称为“行”和“列”,因为它们可以是种群的任何对付另外的随机对手被随机吸引并且交配个体。


回忆一下,在进化博弈中,局中人不会在坦白与抵赖之间进行选择,每个局中人生来就具有这样或那样的行为特征。那么什么是种群中更为成功(更加适应)的行为特征呢?
一个坦白型的如果与另一个坦白型的配对,则得到10年的刑期;并且当它与一个抵赖型的配对时,得到1年的刑期.抵赖型的与坦白型的配对时,刑期为25年;而当它与抵赖型的配对时,刑期为3年。无论与哪种类型的个体配对,坦白型的都比抵赖型要好。因此无论种群中两种类型的比例如何,坦白型的比起抵赖型的来说都有着更高(数字更低)的期望支付(因而也更加适应)。
更形式化一些,设种群中合作者的比例为x。考虑任何一个特定的合作者,在一个随机抽取中,他会遇到另外一个合作者(刑期为3年)的概率为x,而遇到一个背叛者(刑期为25年)的概率为(1-x).因此,一个代表性的合作者的期望刑期为3x+25(1-x).对于一个背叛者,遇到一个合作者(刑期为1年)的概率为x,而遇到另外一个背叛者(刑期为10年)的概率为(1-x).所以一个代表性的背叛者的期望刑期为x+10(1-x)。现在,立即就有
x+10(1-x)<3x+25(1-x) 对于0到1的所有的x都是成立的
所以,背叛者有比较短的期望刑期(较高的支付)并且比合作者更加适应。这将会导致背叛者的比例从”一代”到下一代中增加(x减少),直到整个种群都由背叛者组成。
然而,相反的结论并不成立。如果种群最初全部由背叛者组成,则不会有突变(试验性的)性合作者会生存下来,并增加繁衍到占据整个种群;换句话说,突变性合作者不可能成功地侵入由背叛者组成的种群。即使x很小,即种群中合作者的比例很小,合作者的适应性仍不如现有的背叛者,并且其种群比例将不会上升而只会减少到0;突变就会消亡掉。
因此,处于囚徒困境博弈的种群中,坦白必定是进化稳定战略。这就是一个一般性的命题:如果一个博弈有占优战略,那么该战略也是ESS。

A.两阶段重复的囚徒困境博弈
我们在第八章中已经看到,重复进行的囚徒困境博弈是如何使得理性的局中人为了双方的利益而有意识地维系着合作。让我们来看看在进化博弈中是否也存在类似的可能。假设被选出来的每一对局中人接连不断地进行两轮的囚徒困境博弈。每个局中人从这种互动中所得的总支付为他在两个回合中得到的支付之和。
每个个体仍然是既定地只选择一个战略,但是在有两个回合的博弈中,一个战略应是一个完整的行动计划,因此,一个战略对于第二个回合中的行动规定是取决于第一个回合所发生的情况。比如,“无论如何我都选合作”,“无论如何我都选择背叛”都分别可以是一个战略。但是“我开始选择合作;如果你在第一回合选择合作的话,我将继续在第二回合选择合作,但否则,我就选择背叛”也是另外的一个战略;这就是以牙还牙战略(TFT)。
假设种群中可能存在三种类型的战略,那么我们就有三种类型的局中人,就是那些总是坦白、那些总是抵赖和那些以牙还牙型的局中人。在图10.2中给出来了与每一种其他类型的对手配对时每种类型在两个回合加总后的结果,为了简化,以A表示总是坦白的战略;以N表示决不坦白的战略;以T表示以牙还牙战略。[4]


为了弄清楚这些数字是怎样出来的,我们来看看一对例子。当两个T型局中人相遇时,第一个回合中两个都不坦白,那么他们在第二个回合也不坦白;两者在每一个回合都被判三年刑,每一位两次刑期总共为6年。当一个T型局中人遇到一个A型局中人时,后者因在第一回合选择了坦白而占便宜被判1年,而前者被判25年,但是T型局中人在接着的第二回合中也坦白,每个局中人就被判10年(T型局中人的刑期总共为35年,A型局中人的刑期总共为11年)。
这些数字会告诉我们哪些关于不同战略适应性的信息呢?首先要注意的是,绝不坦白的天真性的合作战略(N)并不是很好。当对手或者是T型或者是N型的时候,它才与T型局中人所获的支付一样多,而当对手是A型的时,N型局中人所获的支付就比T型少了;它让它自己两次上当受骗(真丢脸)。因此,在任何混合的种群中,T型将比N型的更加适应,而且最终将替代N型。如果种群最初仅仅由N型和A型组成,那么由于突变而出现的T型局中人将成功侵入种群并取代N型。如果种群最初碰巧整个地完全由N型局中人组成,那么一种A型局中人的突变会成功,并将成功地侵入。从任何一种观点来看,N都不可能是一种ESS。
所以让我们把注意力放在其它两种战略即A型和T型上来。它们的相对适应性取决于种群的构成。如果种群几乎完全由A型组成,则A型的就比T型更加适应(因为A型最多与其它A型相遇,最多遭遇20年的刑期;而T型最为经常地遇到A型的,遭遇35年的刑期)。但是倘若整个种群几乎完全由T型的组成,那么T型的就比A型的更加适应(因为T型大多数时间都遇到T型,刑期为6年,而在这种情形里A型遇到T型的刑期为11年)。每一种种群当它们已经在种群中占支配地位的时候,就有较好的适应性。因此,T型不能成功侵入完全由A型组成的种群,反之亦然。A型和T型,这两种战略都是ESS。
现在考虑种群由两种类型混合构成的情形。种群将出现什么样的进化动力学呢?也就是说种群的组成将随时间如何变化?假设种群中T型和A型的比例分别为x和(1-x)[5]。那么单个的A型局中人在与这样一个种群中各种各样对手的博弈中,将有x的时间遇到T型,刑期为11年;有1-x的时间遇到A型,刑期为20年,因此,A型局中人的期望刑期为
11x+20(1-x)=20-9x
同理,T型局中人的期望刑期为
6x+35(1-x)=35-29x
那么,T型局中人比A型局中人更具适应性的条件就是前者的期望刑期更短,即有35-29x<20-9x
20x>15
x>0.75
换句话说,如果种群中超过75%的都已经是T型的了,那么T型就更具适应性,并且其比例会不断增大到100%;如果种群在开始时只有不到75%的T型,那么A型就更加适应,并且T型的比例会逐渐减少直到完全消失,或者说A型的比例会达到100%。这两个极端情形都是进化稳定战略(ESS)。
因此,我们已经找到了两个均衡。在这两个均衡中,种群中都只有一种类型,因此我们把每一个这种均衡都称为是单型的。这两个均衡都是进化稳定的,例如,如果最初一个种群由100%T型组成,那么即使有少量试验性的A型突变出现,其后在种群混合体中的T型比例仍大于75%;T仍是适应性更高的类型,突变的A将会衰亡。类似地,如果种群最初由100%的A型组成,那么很小数量的试验性T型突变将导致种群混合体中T型比例小于75%,所以A型有更高的适应性,并且突变的T将会衰亡。而且,正如我们在前面已经看到的那样,在一个或者是有很大的A型或者是有很大的T型的由A型和T型组成的种群中,试验性突变的N型决不可能获得成功。
如果在最初种群中刚好有75%的T型局中人(或25%的A型局中人),那么将会发生什么呢?这时两种类型有相同的适应性。种群比例是一种多态型而不是稳定的;种群只能在任何一种类型的突变出现之前维持这种微妙的平衡。这样一种突变是时不时地出现的。突变的到来将会有利于突变类型的适应性计算,并且这种优势将累积起来,直到达到100%那种类型的ESS。
我们可以用一个简单的图形来说明这种推理,这种图形很象我们在计算有意识的理性局中人的混合战略均衡中均衡比例时所使用的图形。唯一不同的就是,在进化博弈中,采用不同战略的比例并不是任何单个局中人的选择问题,而是整个种群的一个性质,见10.3。
图10.3显示了T型局中人的比例x,它是沿着水平轴从左到右从0到1 测量的。纵轴方向测量的是不适应性;由于不适应性由刑期测量,较高的数字表明了较高的不适应性。图中两条直线分别表示A型和T型的不适应性。T型的不适应性线从较高的地方出发(T型为35,A型为20)并在较低的地方结束(T型为6,A型为11)。两条直线在x=0.75处相交。在交点的右方,T型更加适应,因此T型的比例随时间增加,并且x增加到1。类似地,,在交点的左边,A型更加适应,其比例随着时间增加,并且x朝着0方向下降。这样的图形作为直观工具被证明是非常有用的,并且我们将十分广泛地使用它。


B多次重复博弈
如果囚徒困境博弈重复多次,那么情况又会是怎样呢?我们只着重讨论种群仅仅由A、T两种类型组成,且局中人随机配对进行n次(n≥2)博弈的情况。n次重复博弈的总支付表见图10.4。如果两个A型个体相遇,他们总是欺骗,然后在每一次都被判10年,所以每一个在n次就被判10n年;如果两个T型个体相遇,他们开始选择合作,而且没有人首先背叛,于是他们每一次都各自被判3年,总共为3n年;如果A型遇上T型,在第一次博弈时,T型合作,A型背叛,于是A型被判1年而T型被判25年;随后每次T型局中人都要对A型局中人先前的不合作行为进行报复,并且在剩下的n-1次博弈中,双方刑期各为10年,因此A型局中人的刑期共为1+10(n-1)=10n-9,而T型局中人的刑期共为25+10(n-1)=10n+15(这里只是比喻,尽管如果n太大时刑期会比整个生命都还要长)。


如果种群中T型的比例为x,那么一个代表性的A型局中人的期望刑期为
x(10n-9)+(1-x)10n
T型局中人的期望刑期为x(3n)+(1-x)(10n+15)
因此,当x(10n-9)+(1-x)10n>x(3n)+(1-x)(10n+15)时,即x>15/(7n+16),T型更加适应。
我们在平衡点x=15/(7n+16)处又得到两个稳定的单态型ESS和一个不稳定的多态型均衡。两个单态型ESS包括种群全部是T(或x=1,对于它从x>15/(7n+16)的任一点开始的过程都收敛),以及种群全部是A(或x=0,对于它从x<15/(7n+16)的任一点开始的过程都收敛)的情形。
注意,T型个体在平衡点处的比例取决于n;n越大它就越小,当n=10,它等于15/76或近似于0.20,所以,如果种群中最初T型占20%,在博弈重复10次的情形,它们的个数会不断的增加直到达到100%。回忆一下当只有两次重复博弈(n=2)时,T型个体最初的比例至少达到75%才能达到这个结果。也要记住由所有T型组成的种群会达成合作。因此,当博弈重复许多次的时候,合作出现于大范围的初始条件。从这个意义上说,重复越多,合作就越可能。我们所看到的结果是随着博弈次数的增加,局中人互相合作的次数也增加。

C 进化博弈模型与理性局中人博弈模型的比较
最后,让我们回到两阶段重复博弈,并且不是使用进化模型,考虑它是在两个有意识进行理性决策的局中人之间进行的。纳什均衡是什么呢?这里有两个纯战略,其中一个是两者都选A,另外一个是两者都选T。还有一个混合战略均衡,其中在75%的时间里选T,在25%的时间里选A。前面的两个恰好就是我们已发现的单型的ESS,而第三个就是不稳定的多态型进化均衡。换句话说,在博弈上进化与有意识进行理性决策的观点之间存在着密切的关系。这绝非偶然。一个ESS必定是一个由具有相同支付结构的有意识进行理性决策的局中人所进行博弈的纳什均衡。为了看出这一点,暂时假定是相反的。如果所有局中人都选择相同的战略,譬如说就是某一战略S,它不是一个纳什均衡,那么,某个其它的战略,不妨说就是战略T,当一个局中人用它来对付S时必然会带来一个更高的支付。在一个选择S的种群中,A型变异选择T战略将达到更高的适应性,从而会成功地侵入这个种群。因此,S战略不可能是ESS。换句话说,假如所有局中人选择S不是一个纳什均衡,则S就不可能是一个ESS。这就相当于说“如果S是一个ESS,那么它就必须是一个所有局中人都采用S的一个纳什均衡”。
因此,进化方法以一种迂回的方式为理性人方法提供了一种理由。即使当局中人并不是有意识地选择最大化的时候,但假如更为成功的战略被更频繁地使用,而不太成功的战略逐渐消失,而且整个过程最终收敛于一个稳定的战略,那么,结果就一定与有意识地选择最大化战略时得到的结果相同。
我们对于重复博弈的分析存在着一种局限。开始,我们只允许三种战略:A、T,以及N,假定并不存在其它的战略或者没有变异出现。在生物学上,出现的变异类型是由所考虑的基因决定的。在社会或经济或政治的博弈中,新的战略的源起大概是由历史、文化以及局中人的经验所支配的,人们吸收,处理信息的能力以及尝试各种各样战略的能力也必须扮演一种角色。然而,我们对可能存在于某一个特定博弈战略空间上的限制也有着重要的含义,因为这些战略(如果有的话)可能是进化稳定的。在两阶段重复的囚徒困境博弈例子里,如果我们允许这样一种战略,它在第一轮中合作而在第二轮中背叛,那么S型的变异就能够成功的侵入全部由T 型组成的种群,所以T就不会是一种ESS。我们将在本章末的练习3中进一步讨论这种可能性。

3 胆小鬼博弈

记得我们在1950年代的年轻人经常驾驶着汽车相向着开过来,看看谁为了避免相撞而首先转向。现在我们假设局中人在这种事情上是没有选择的:每个人生来就或者是懦弱的(总是转向逃掉)或者是具有大男子气概的(总是一直向前开)。种群由这两种类型的混合体组成。每周都随机性地挑选出一对局中人玩这种游戏。图10.5给出的就是对于任意两个这样的局中人,譬如是A和B的支付矩阵(其中的数字是复制我们早先在图4.11和图5.7中使用的数字)

这两种类型将会如何发展变化呢?答案依赖于最初种群中的比例。如果种群中几乎全是懦夫,那么一个勇往直前的变异将会取胜并且在许多时间都得到1分,而所有懦夫在遇到他们同样类型的人时最多得到0分。但是,如果种群几乎全部由勇往直前的人组成,则懦弱类型的变异得到-1分,它看起来是很糟糕的,但是却比所有人都是勇往直前的人的时候得到-2分要好。你可以从生物学的角度以及1950年代出现的性别歧视来审视这个问题:在一个全是懦夫的种群中,一个勇往直前的勇者的出现会使所有其余的人都显得是胆小鬼,并且会给所有的女孩子都留下深刻的印象。但是如果种群中全部都是勇者,他们在大多数的时间里都会躺在医院里,女孩们将不得不去找那些少数是健康的懦弱者了。
换句话说,那些在种群中是相对稀少的类型将会更加适应。因此它能成功地侵入由其它类型组成的种群。我们想看看种群在均衡中的两种类型;也就是说,我们将预期有一种混合体的或多态型的ESS。
为了找出在这样一种ESS中的懦夫与勇者的比例,让我们先来计算一下在一般的混合种群中不同类型的适应度。记x为勇者在种群中所占的比例及1-x为其中懦夫所占的比例。一个懦夫在1-x比例的时间内与另一个懦夫相遇并得到0支付,在x比例的时间里遇到一个勇者并得到支付-1。因此懦夫的适应度为0*(1-x)-1*x= -x。类似地,勇者的适应度 为1*(1-x)-2*x=1-3x,如果下面的条件成立,则勇者就更加适应。
1-3x>-x
2x<1
x<1/2
如果种群中勇者的数量少于一半,那么勇者就更加适应并且他们的比例会上升。另一方面,如果种群中勇者的比例大于一半,那么懦夫将会更加适应并且勇者的比例会下降。不管怎样,种群中勇者的比例都会趋向1/2,并且这个50%对50%的混合体将是稳定多态型的ESS。
图10.6中给出了这一结果的图象。每一条直线都显示了一种类型的适应度(在与种群中的成员随机性配对下的期望支付),此时勇者的比例为x。对于懦弱类型,这个函数关系显示了他们的适应度作为勇者比例的函数是-x ,正如我们在上面两个段落中所看到的那样,这是一条缓慢下降的直线,它在x=0时高度为0的地方出发,并且在x=1时趋于-1。勇者类型对应的函数为1-3x。这是一条迅速下降的直线,它在x=0高度为1的地方出发,然后在x=1时下降到-2。当x<1/2时,勇者的直线位于懦夫的直线的上方,而x>1/2时,勇者的直线就位于懦夫的直线的下面。这表明当x很小时,勇者类型就更加的适应,当x较大时,懦夫的适应性就更高。


现在我们可以把这个博弈的进化理论与早先在第四章和第五章中基于局中人都是有意识进行理性战略计算这一假定上的理论进行比较和对比。在那里我们发现了三种纳什均衡,其中两个是纯战略的,一个局中人勇往直前而另外的一个退缩,以及还有一个混合战略的,其中每一个局中人都以1/2的概率勇往直前,以1/2的概率退缩。
从某种意义上我们仍然有所有这三种类型的均衡。如果种群真由100%的勇者组成,则所有的局中人都是同样的适应(或同样的不适应)并且这种情形会持续下去。类似地,一个全部都由懦夫组成的种群也会继续存在下去。所以,我们仍有两个单纯类型的均衡。但是它们都是不稳定的。在一个全部由勇者组成的种群中,一个懦夫的变异将会蔑视他们并且会成功地侵入[6]。一旦一些懦夫占稳了脚跟,无论他们是多么少,我们的分析表明,他们的比例都会不可阻挡地上升到1/2。类似地,一个全部由懦夫组成的种群也易于受到勇者变异的成功侵入,并且这个过程再次向着多态型性的ESS演化。
最为有趣的是理性博弈中的混合战略均衡与进化博弈中的多态型ESS之间的联系。前者均衡战略中的概率与后者的种群比例完全相同:即50%的懦夫和50%的勇者。但是在理解上却有所不同:在理性框架中,每个局中人混合运用他自己的战略;而在进化框架中,每个个体使用的是一种纯战略,但是不同的个体使用的是不同的战略,所以我们在种群中所见到的是一种混合体[7]。
理性博弈中的纳什均衡与具有相同支付结构并按照进化规则进行的博弈的稳定结果之间的对应关系是一个非常一般的命题,并且在第6节中我们还将进一步看到它的一般性。的确,实际上,进化稳定性为我们在理性博弈中的多重纳什均衡中选择出一个均衡提供了一个额外的理由。
当我们从理性角度看待胆小鬼博弈的时候,混合战略均衡看起来似乎令人费解。它可能招致很大的错误。每一个局中人在一半的时间里驾驶着车勇往直前,所以在四分之一的时间里他们就会发生一次相撞。而纯战略均衡就避免了这种相撞。在那个时候你会感到混合战略是多么的令人不快了,甚至会对于我们为什么要花如此多的时间在这上面感到奇怪。现在你就看到其中的道理了。我们来看看原因吧。这个看起来很奇怪的均衡是作为一种自然动态过程的稳定结果而出现的,其中在应对他所遇到的种群时,每个局中人都试图改善他的支付。


alanle:

你这个是行为金融里面是动量投资策略还是反向操作策略有效的问题哈
有的实证表明,短期应是动量也就是追涨杀跌策略,长期看反转策略有效
这个跟市场是过度反应还是反应不足有关,不过这个话题还很值得探讨


uppsala:

underreaction and overreaction
the best paper for this issue I have read up to now is Hong and Stein (1999) , JF, 6, Nov


海边的树:

其实买涨杀跌正是行为金融学研究的问题。买涨杀跌,恰恰是人们非理性的表现。在金融市场上,跟经济学的假设恰恰相反,大部分投资者是非理性的,因为很多投资者缺乏必要的金融投资知识,他们的投资更多的是凭着心理的感觉以及投资机构的“误导”,这就导致了大量噪声交易的出现,股市泡沫的出现与破灭由此而产生。


 

文章评论
关注我们

快速入口
回到顶部
深圳网站建设