注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

麦迪森先生的数据处理风格

《世界经济千年史》
The World Economy: A Millennial Perspective
[英]安格斯•麦迪森(Angus Maddison)著
伍晓鹰 许宪春 等 译
ISBN 7-301-06693-7/F•0723
定价:58.00

  麦迪森先生的《世界经济千年史》是在庞大的数据支持之下完成的研究。和正文篇幅几乎差不多的数据解释、以及极其详细的表注显示了麦迪森先生在数据收集、处理以及产生新数据系列上付出了巨大的努力。麦迪森先生的数据处理风格给我们提供许多值得借鉴的地方。

  麦迪森先生的数据处理风格之一是对所使用数据的严格审查,以及为改善数据质量所付出的巨大努力。《世界经济千年史》的研究对象在国别上涵盖所有的国家,时间上跨越迄今为止的两千年。所需数据量之大,数据收集和处理难度之强可以想象。仔细地阅读正文中的表注和附录对数据处理的描述之后,会产生这样一种感觉,那就是他好像熟悉每个数据的特性,包括它们的原始出处、可能的偏差等等。对采用或不采用某个数据都有充分的理由。举例来说,他甚至注意到明治维新前后日本使用虚岁计算年龄的习惯对估计婴儿出生与死亡率所造成的影响(表1-4的注释,17页)。这样的例子还很多。

  在对现有数据进行严格审查的基础之上,为纠正现有数据付出最大限度的努力可能是麦迪森先生数据处理风格中最显著的地方。他不简单地接受现有数据,即使这些数据是官方估计结果,或者这种结果通常为人们所利用。众多例子中的一个是他在Chinese Economic Performance in the Long Run一书中对新中国国内生产总值的重新估计。大家知道,由于种种原因,中国国内生产总值官方估算上存在着工业增长速度过高估计,以及第三产业增加值绝对水平低估的问题。尽管如此,几乎所有的相关研究都接受了官方估计,忽视了数据偏差对经济分析可能造成的影响。和通常的做法不同,他并没有简单地接受官方估计,而是选择了重新估计这个时期的中国国内生产总值的做法,试图以此来纠正增长率高估以及增加值绝对水平低估的偏差。他的重新估计包括:1对第一产业增加值的独立估计,2接受伍晓鹰博士对工业的估计,3把基准年份(1987年)非物质生产部门增加值官方估计值上调三分之一之后,用该行业就业人员数的时间趋势外推了其他年份该行业不变价增加值。重新估算结果纠正官方统计对国内生产总值估计的偏差。他的估计值已经被用到我们在评述的《世界经济千年史》当中了。我本人并不是对麦迪森先生重新估计的所有工作均持肯定态度的。用就业人数的时间趋势外推1987年以外年份不变价增加值的做法是建立在服务业劳动生产率不变的假定的基础之上。实际上,和制造业同样,服务业劳动生产率是在不断上升的。因此,麦迪森先生的估计可能低估了非物质部门增加值增长率,因此有低估整个中国经济增长速度的嫌疑。尽管如此,我相信他的估计在很大程度上改善了官方估计的偏差。不仅如此,麦迪森先生没有简单地接受已经可以利用的官方估计值,而是选择了重新估计的艰苦工作,对此我敬佩不已。

  麦迪森先生数据处理之二可谓是数据处理过程的透明性。阅读过《世界经济千年史》以及麦迪森先生其他研究的人都会发现,麦迪森先生总是在明确数据来源,解释筛选数据的理由,以及说明他自己独立估计的产生过程等方面花费大量的篇幅。由于对数据处理过程的详细解释,根据他的解释,任何人都可以对他个人的独立估计值进行复制,从而对数据处理保持了完全的透明性。对于保持数据处理透明性的目的,麦迪森先生是这样说的:

  数量分析旨在澄清质量分析中那些模糊的地方,同质量分析相比,它更容易受到质疑,而且也更可能受到质疑。因此,它可以使学术探讨更尖锐,从而有助于刺激针锋相对的假说的建立,以推动研究的发展。只有使提供数量证据和选择代表性变量的过程透明化,才可能使持有不同看法的读者补充或拒绝部分数据,或者建立不同的假说(第4页)。

  一言话说,保持数据处理过程的透明性可以推动或者有助于研究发展。

  在可利用数据完全不存在的条件下,凭借大胆的假设填补数据中的缺失值可以说是麦迪森先生数据处理风格又一大特点。具体地说,对没有数据的国家,假定它们人均GDP的变动幅度与处于同一时期和同一区域的有数据国家相同。在麦迪森先生的书中,这种方法叫做替代指标估计(164页)。在完全没有数据的情况下,麦迪森先生之所以仍然坚持通过假定制作数据,唯一的解释可能是他想把他的数量分析贯彻到底。大家知道,在麦迪森先生讲述的故事中,不同时期各国经济增长速度以及各国的相对规模是不可缺少,因此,产生了估计每个国家以及不同时期GDP的必要性。而之所以要把数量分析贯彻到底,可能是为了让更多的人对他的研究产生质疑,从而使学术探讨更尖锐,更有助于研究的发展。

  如果看待通过替代指标估计产生的数字?这些数字(尽管是所用数据的一部分)会不会让麦迪森先生的故事失真呢?读过麦迪森先生《世界经济千年史》的人可能都会产生这样的疑问。在一些国家和一些时期永远不存在直接可利用数据的情况下,这样的疑问可能无法得到准确的回答。但是,以下相反的两个方面值得提及。一方面,替代指标估计无法保证得到这些国家真实人均GDP及其增长速度的。这一点是很显然的。另一方面,使替代指标估计正当化的理由也同时存在。理由之一,使用替代指标法的国家主要是经济规模较小的落后国家。并且该种方法的适用时期主要集中在1950年之前统计调查尚未完善阶段。从而替代指标法的影响可能被降低到最小程度。

  理由之二,作为没有办法的办法,麦迪森先生对替代指标法的使用也是十分谨慎的。在多数情况下,替代指标估计所使用的假定都是在讨论当时特定的经济状况做出的。所以我们总是有这样的感觉,在现有知识的条件下,麦迪森先生的假定可能是最可行的。

  理由之三,由该方法产生的数字永远是暂时的,一旦可利用数据出现的话,它们会马上被替代的。这也是《世界经济千年史》与1995年版相比,许多国家的数据来源实现了由替代指标法估计到直接估计转变的原因。

\《世界经济千年统计》
The  World Economy: Historical Statistics
安格斯•麦迪森(Angus Maddison)著
ISBN 978-7-301-14751-1
伍晓鹰 施发启 译
定价:45.00元

 

文章评论
关注我们

快速入口
回到顶部
深圳网站建设