[原创] IV工具变量和寻找模型 JEP一篇论文的评价
观点 · 2008-04-26 00:00
返回Instrumental Variables And The Search For Identification: From Supply And Demand To Natural Experiments Angrist, Joshua D. and Krueger, Alan B Journal of Economic Perspectives V.15, Number 4 Fall 2001 ...
Instrumental Variables And The Search For Identification: From Supply And Demand To Natural Experiments
Angrist, Joshua D. and Krueger, Alan B
Journal of Economic Perspectives V.15, Number 4 Fall 2001 69-85
--------------------------------------------------------------------------------
作者:似乎有知识 Caffey 本文转自: 似乎有知识 | 论文评论员 http://econcaffey.spaces.live.com/
两位作者都是当今labor econ领域中的大牛
IV 的方法最早是从供求曲线的来,最早的学者大多采用时间序列数据进行identify,在市场均衡的影响下,OLS不能给出价格和数量的真实关系. P.G.Wright最早遇到这个问题,当他估计亚麻的供需的弹性时. 他当时建议用一个"curve shifters"来处理这个问题,也就是我们现在称之为IV的东西.
但是Wright当时在计量经济学上的贡献并没有引起足够的重视,知道1940年代IV被重新发现并加以拓展.
Wright当时找到了很多他称之为curve shifters的东西来估计弹性,最后他所用的方法是把所有估计出来的弹性数值加以平均得出最终的平均弹性.现在我们知道这种方法并不能得出最efficient的估计值. 最efficient的估计方法是Theil在1953年发展出来的2SLS.
此外,IV被广泛的应用于处理independent vatiable中的measurement error问题. Friedman在1957年采用的方法就和这个思想很类似.在消费函数中,如果用年收入而不是永久收入估计消费的话,我们会极大的降低由于永久收入带来的消费数量.为了克服这个问题,F采用了类似于2SLS的方法,第一步用城市级的年收入predict永久收入,然后再去估计消费函数.
此外还有一点应该注意到,很多教科书并没有去区分unbiasedness and consistency,这两个概念的区别是很明显的(hereinafter in English)Unbiasedness means the estimator has a sampling distribution centered on the parameter of interest in a sample of any size, while consistency only means that the estimator converges to the population parameter as the sample size grows.IV估计值是consistent的名单是并不是unbiased的,因此在用IV方法的时候最好是大样本.
再来看看在存在Omitted Variables情况下采用IV的情形.很多情况下由于缺少其他变量,我很难确定一些关系的因果联系,比如:政策和犯罪率,兵役和收入,保险和劳动力供给等等.我们的希望是在其他所有variable不变的情况下,来探求这些因果关系.
对于这个问题,其中一个解决方法是随机赋值,比如社会实验.随机挑选然后接受培训,再来看看培训对收入的影响,这样就控制住了个人的特性和社会关系等等.但是社会实验并不是在任何情况下都是可能的,这就为IV方法提供了可能. 从这个逻辑上说,IV的特点(和内生变量有关,但是和Y无关,包括Omitted variable或者model残差)相当于创造一个natural experiment,使得样本好像是随机挑选的一样.
IV的寻找说到底是一个经验积累的过程.Maddala在1977年的那片论文"到哪找到这个变量?",和大多数计量文献一样,没有提供答案.
在测量教育的return的时候,我们知道教育并不是完全外生的,其一:人力资源理论告诉我们很多人的教育决策实在衡量了成本和收入后作出的,因此一些贷款政策会影响教育年限,如果没有这方面的控制,会造成内生性问题,导致估计值变差.
教育年限的变化的第二个原因是因为制度的限制,可以阅读本文两位作者在1991年的考察义务教育法对教育年限的影响,最后在作出对收入的印象.在这篇文章中,义务教育法的实施也被看作成一种natural experiment,由于儿童的生日不同,(假设出生时间和人的能力是没有关系的,这个假设基本成立) 人为使得孩童在接受教育的时候有了不同的时间长短. 所以我们就用生日作为教育的IV去examine the return of education on income.
这是一篇非常优秀的论文.
类似的研究还有Angrist and Lavy (1999)去examine班级规模对学生成绩的影响,用的IV是关于州关于班级规模上线的rule。
将IV看作一种natural experiment的思路也受到一些学者的批评,主要集中于这样的方法没有解释所有理论关系,对于以上两位作者义务教育法论文的批评出自Rosenzweig and Wolpin, 2000。
对于IV的解释,确实存在困难,因为IV仅仅predict那些外省变量中和残差项不相关的部分,而不是全部。也就是说在劳动经济学中IV仅仅是估计了那些可以被IV predict的人群,而不是全部人群,比如1991年的那篇论文,用出生时间来predict受教育时间就不能包括那些上完高中选择继续上大学的那些人群。这方面的详细讨论可以参见Imbens and Angrist 1994年的论文。
在回到我在文章开头所说的“IV相当于一个natural experiment,使得样本好像是随机挑选的一样”,但是如果treatment group和control group的反应是不一样的话,就会出现估计偏差。还是91年的那片论文,虽然我们的IV并不能解释那些选择继续上大学的人的教育回报,但是文章的interest就是高中教育的回报,从这个意义上说,本身也是很重要的。
那么IV有哪些缺点呢?
最大的问题是你找了一个很烂的IV。如果这个IV和omitted variable或者model的error term有关系的话,也就是说你的IV也是个内生的话,这样造成的bias比不用还大。
还是用供需曲线的例子。巴西的咖啡豆很容易受天气的影响,所以天气应该是一个很好的IV,这是在供应曲线里面,但是如果天气同样影响咖啡豆的需求曲线,比如天气很热,大家都不愿意喝咖啡而选择冰镇碳酸饮料的话。天气就绝对不是一个好的IV。
如果是weak IV呢? 在weak IV的情况下,已经证明biasness是和degree of overidentification成正比的。这样说来,IV越少越能降低Bias。目前的方法中作者提到Limited Information Maximum Likelihood (LIML) estimator.有兴趣的还可以看看approximately unbiased split-sample and jackknife instrumental variables estimators。总之这都是些即牛逼又时髦的玩意。
请注意LIML和2SLS在just-identified models下,结果相同。在overidentified models下,结果差别很大。
目前我们已经有了几种处理这个问题的方法,最简单的就是直接把IV放进去,代替内生变量,也就是说没有first step,直接run second step。这个结果是unbiased的,即使IV是weak的。这样的方法是reduced form equation。
这些很冒险的方法,总是大牛最先用,大伙跟风。
作者提醒在2SLS模型的第一步最好就用简单的OLS而不是用什么非线性估计方法。
最后我的总结,是IV的思想其实是从实验发展出来的,因此被称为natural experiment。 其具体思路也就是说寻找一个外生变量,使得内生变量的所有观察值被一组random的变量代替(外生变量assume不受任何其他变量影响),从而估计出真正的因果效果。
原贴地址:http://bbs.efnchina.com/dispbbs.asp?boardid=21122&ID=395775&replyID=361832