注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

经济学家为统计学折腰

How economists get tripped up by statistics
经济学家为统计学折腰

By Felix Salmon,July 10, 2012

Johnson Deng【译


回归标准误差

回归标准误差为29(线性回归)

参考上面的散点图,我们来做个小测试。如图所示,我们要在图中再增加一个点(译者注:假定该点为P(x,y))。那么,请确定x取什么值时使得y大于0。因此,我们需要解决的问题是:对于点P(x,y),x取什么样的值时才能使点P位于x轴的上方(x>0)的概率为95%。

最近,巴塞罗那庞培法布拉大学的埃姆雷.索耶尔(Emre Soyer)和罗宾.贺加斯(Robin Hogarth)向一组经济学家发起了该问题,他们都是世界顶尖大学的经济学系教师。其中,有人给出了正确答案是x取值为47(x=47);也有人给出让人吃惊的错误答案:x可取任何小于10的值(x<10)。这些经济学家不但聪明,而且还受过高等教育,精通回归分析。从回答问题的结果来看,当把他们划归为一个小组时,他们做得很出色,错误率仅为3%。

不过,这些经济学家还追求精确,他们不喜欢粗略的答案,而要的是肯定的答案。对此,索耶尔和贺加斯做了如下评述:

参加此次活动的大多数经济学家,包括那些回答得最准确的经济学家,他们都对所提出问题的信息不充分而做了注释,发表了各自的看法。他们表示,没有估算系数是不可能得出肯定答案的,因此只能凭猜测而得出近似答案。

他们能做到这一步已经相当不错了。于是索耶尔和贺加斯又以同样的方式随机挑选了别的经济学家,并为他们提供了他们需要的所有系数与数据(具体参数见文中提到的学术论文)。

思考下面的计量经济学模型:

Yi=C+βXi+ei

其中,Y表示经济收益

X表示连续性选择变量

C为常数

β表示X对Y的作用

e表示随机扰动;协方差ei=0;协方差(ei,ej)=0;协方差(ei,Xi)=0

这里,我们的目的是要根据从1000个观值中随机抽取样本X和Y,从而估算出β 和C。其中,样本统计结果如下:

变量

样本均值

标准偏差

X

50.72

28.12

Y

51.11

40.78


这样,通过对样本模型进行协整回归拟合(OLS Fitting)可得出以下结果:


因变量:Y

X

1.001

(0.033)

常数

0.32^**

(1.92)

R^2

0.50

N

1000

(注:圆括号中的数据为标准误差;星号**表示置信度为95%;N表示观察值的数量)

 

结果表明,在统计学意义上常数C与0是有区别的,而且还有一个重要的统计意义是X对Y的正效应作用。β 的估算值为1.001。

假设该模型是对X与Y之间的实际关系的真实近似且为合适的线性估算。另外,在所有可选择模型中,该模型是求高阶R平方的模型之一。

 

以上的结果是一用于决策有用工具:它将经济收益Y同选择变量X联系起来,我们可以应用这一关系去预测收益或选择适当的X以获得需要的收益水平。更重要的是,该模型构建出了X与Y间的正确关系,其关键性在于增加X就等于增大成本,为此掌握了这样的实际关系有助于我们做出更加准确的选择。

很显然,这个公式主要是针对二元变量随机扰动,求均值以及标准差,并对其进行协整回归拟合。有了所有这些参数及信息,经济学家们在解答以上问题——X取何值时使得95%的Y值均大于0时就可能得出更加准确的答案。

不过还有一个问题:即在为经济学家们提供了图像和详细数据的条件下,给出惊人错误答案即X<10的人数却增加了。通过直观的目测计算,他们仅有3%的人会得出错误答案,可一旦为他们提供了数据,给出错误答案的人数却上升到了61%!特别是第三组经济学家,当为他们提供数据但没有图像时,他们答错题的概率为72%,即72%的人都答错题。

为此,作者得出了这样的结论,经济学家们在看学术论文时要求普遍过高,他们认为学术论文展示的东西会超乎实际(即它们想淡然的认为学术论文应该展示应有尽有的内容)学术论文。因此,经济学家们阅读的学术论文越多,他们就会被误导得越多:

他们必定会产生一种错误的看法,认为在阅读经济学杂志时从事过经济学研究的人更有说话的权威性,即话语权。总之,他们会认为经济产出是完全可以预测,甚至是超乎实际的。对于以上的陈述,我们假设计量经济学模型实实在在的是对实证现象的描述(即经验现象)。然而,事实是,这样的模型可能会存在很多问题,比如缺乏关键性变量、计量误差、多重共线性混杂,或是预测者对终值的估算问题等。为此,我们只能说模型假设是对经济数据的最佳近似(没有比这更好的方法)。另外,也有依据表明,统计学一个特点是常常犯重复性的错误。

 

有这样一件事让我深感无地自容:我看到这这样一篇论文,它是从统计学意义上来证明一个变量与另外一个变量间的重要相关关系的。于是我就做了一般的假设,假设这个实验是重复性的,我们将看到的也是同样的结果。但事实不是这样的,我想我们很容易看出一点,那就是对于我们完全不肯定的事经济学家们是怎样证实的,而且当我们还在持怀疑态度时经济学们却通常以错误的结论而草草收盘。

更糟糕的是,如果经济学家在自己本职职责范围内都做得不好,可想而知其他的社会科学家或甚至是医生也不例外,也有类似现象。为此,如果你在再看到类似论述有趣话题的流行科学论文或杂志时,自己心里不妨要做到心中有数。有关这方面的论文虽然不少,但能够提供有用结果的却不多,它们往往不乏只为了吸引读者的眼球(广告式的论文)。当然,还有这样的论文杂志,它们的标题与内容可以说是风马牛不相及。

文章评论
关注我们

快速入口
回到顶部
深圳网站建设