警惕因果推断中的可能陷阱
一、引言
如果社会学科的最终归途是社会科学,那么其经验研究必须经历一场“可信性革命”[1],即在研究范式上,特别是政策效果评估研究上,向自然科学的实验方法靠拢。但出于伦理要求和研究设计的限制,我们很难严格地选取处理组与控制组进行对照实验,大多数情形下只能利用观测数据而非实验数据进行因果推断。为向“大样本随机双盲对照实验”的黄金判则逼近,社会学科(尤其是经济学)的研究者们基于潜在因果框架开发了一系列“准实验方法”用以进行因果推断,主要有匹配方法、双重差分法、合成控制法和断点回归设计[2]。
遵循着“国外理论→国外验证→国内引进→国内验证”的学术生产基本轨迹,准实验方法在国内日渐流行。且随着知识付费的接受程度越来越高,我们常常可以在一些微信公号的文章页发现抓人眼球的焦虑感制造机式标题,下拉后发现是xx方法的培训课程推广,准实验方法的教学是其中的重要内容,然而这些方法有着严苛的假设条件和检验程序,使用时需要识别可能的因果陷阱。
下面回到我的老本行,基于一个房地产领域的政策效果评估案例,提出其中可能存在的因果推断陷阱。
二、案例阐释
对房产税开征及潜在政策效果的讨论在大陆处于观点争鸣之势,随着2011年上海和重庆成为两个房产税开征试点城市,相关讨论有了实验落脚点。本文选取的案例聚焦于房产税对产业转移的影响[3],作者重点运用合成控制法对这一复杂效果进行了解析。
(一)Gaps & Issues
现有研究关注到了房价上升对产业转移的影响,具体而言:
一种观点认为:
房价上升促使了产业在区域间转移。Rabe and Taylor(2012)、Murphy et al.(2006)等认为房价上涨会抑制劳动力流入,引起企业实际负担的成本增加,对非房地产业产生挤出效应而引发产业转移。高波等(2012)研究发现,在地区间相对工资、交通成本等其他条件不变的情况下,城市相对房价上升,将促使东、中部地区城市低附加值的产业向外转移,高端制造业和第三产业得到相应发展。邵挺和范剑勇(2010)的研究认为,大型城市的房价过快上涨是长三角地区制造业产业转移的重要原因。
另一种观点认为:
房价上升对产业转移的影响存在“倒U 型”关系。房价的适度上涨会通过集聚效应促进第二产业和第三产业的发展,过高的房价会对第二产业造成挤出效应,抑制其就业和产出,但与第三产业的就业和产出呈正相关关系(席艳玲,2013)。陈晓和张文杰(2017)的研究也得出类似结论,认为房价对产业转移的影响存在“倒U 型”关系,只有当相对房价超过某一临界值,才会对第二产业的就业产生挤出效应,但对第三产业的就业和产出具有促进作用。
以上研究结论并不一致,且并未直接涉及房产税对产业转移作用的讨论,而房产税与企业生产成本及企业投资决策紧密相关。
理论上,房产税政策对产业转移的影响主要有两条路径:
房产税影响企业生产成本:
房产税通过降低企业生产成本,促进产业向本地转移。企业的生产成本包括劳动力成本、用地成本和信贷成本三个方便。在用人上,房价会影响劳动力流动,如驱赶低端劳动力,使中高技能劳动力成为房奴,以此改变企业的用人结构,影响企业创新;在用地方面,显然,过高的房价将推升城市的整体地价水平,企业的用地成本也将随之提升;在资金成本方面,由于房地产业过度繁荣降低了流向实体经济的信贷资金,其他产业的资金使用成本会有所上升。基于此,本地企业会寻求低成本空间,引发产业向外转移。而房产税可以增加住房拥有者的持有成本和保养成本,降低住房空置率和增加供给,抑制房价平抑地价,缓解企业的转移压力。
房产税影响企业投资取向:
房产税通过影响企业的投资取向,促使资本向生产部门转移。在房价非理性上涨的情形下,本地企业会倾向于将投资方向转移至房地产业,减少生产性投资,在地区层面表现为以制造业为代表的实体产业相对产值或相对就业减少。而房产税通过对房价的调节,可以减少房地产市场的泡沫,降低资源错配。企业不愿面临进入房地产业的高成本,会将更多资金投入实体产业。
综上,房产税对产业变动的影响表现为区域间产业转移和区域内产业结构调整两个层面。
本文需要解析的研究问题是:
- 房产税政策是否对产业转移产生影响
- 不同的政策设计及其不同的实施条件对产业转移的影响有何差异
(二)Data & methodology
原文的研究设计如下:
具体而言:文章的实证目标是用其他城市的加权平均来模拟房产税政策实施城市未征收房产税时的产业转移情况, 然后与征收房产税后真实的产业转移情况进行对比来估计房产税征收对产业转移的影响。作者选取了国家统计局确定的35个大中城市作为样本,其中上海、重庆为处理组,其余33个城市为控制组。
指标:文章的被解释变量是产业和就业的变动,借鉴前人做法,使用相对产值和相对就业率来衡量产业转移的变化情况,分别用城市工业和服务业(第三产业)的产值或从业人数除以所有样本城市的平均值得到。选取了尽可能多的控制变量,包括相对工资、人均GDP、财政支出占GDP 比重、人口密度、年末金融机构存款余额、医院卫生院床位数、国际互联网用户数。其中,相对工资代表企业的劳动力成本;人均GDP 用来代表城市的劳动生产率;财政支出占GDP 比重表示政府对市场的干预程度;人口密度代表城市产生的集聚效应;年末金融机构存款余额、医院卫生院床位数和国际互联网用户数分别代表城市的金融、医疗卫生情况和信息基础设施情况。
数据来源:历年《中国城市统计年鉴》和国家统计局网站。
(三)Results & Conclusions
- 在房价水平相对较低、处于工业化中期的重庆开征一定强度的房产税,对工业、服务业的相对产值和相对就业率均具有“促增作用”,这种“促增作用”在统计上具有显著性,在时间上具有持续性,总体表现为有效促进了产业转入;
- 在房价已经很高、处于工业化后期的上海开征强度较低的房产税,却降低了工业和服务业的相对产值,增加了服务业的相对就业率,没有改变已经形成的产业转出态势,但也没有达到“腾笼换鸟”的理想预期。
(四)Robustness checks
作者进行了稳健性检验、安慰剂检验和其他外生冲击干扰性检验,结果稳健,不具备安慰剂效应,排除其他外生冲击干扰。
具体文章见:
刘友金,曾小明.房产税对产业转移的影响:来自重庆和上海的经验证据[J].中国工业经济,2018(11):98-116.
三、可能的陷阱解析——政策的长期放置
(一)房产税对房价的影响确切吗
文章的核心理论为:房产税影响房价进而影响产业变动
从作用路径看,房产税对房价确切的平抑作用是全文的前提,然而外界对这一前提本身存在诸多质疑。
若房产税不能有效调节房价?
出于技术角度的需要,作者在文章中引用了两条房产税对房价具有抑制作用的文献,但对与此相悖的研究结论选择回避,如房产税对房价的抑制作用具有局限性且预期比房产税对房价影响更大(况伟大等,2012),开征房产税能在短期内降低房价,但是有可能拉高未来长期的房价(王敏等,2013)。
上述(包括作者引用的文献)关于房产税对房价影响的研究基本在2013年以前完成,处于政策的短期效应内,在2020年回看相关研究,则可能发现既有研究的一些问题。
对于重庆的样本,本文提出:
重庆房产税试点对当地房价的短期抑制作用是领导人身份特征作用的代理
即,真正在短期内抑制房价的不是房产税,而是地区行政长官,我们来看一幅图:
- 2010年起,黄奇帆先生开始任重庆市行政机关一把手
- 2011年起,重庆市开启房产税征收试点工作
- 2010年-2016年,重庆市房产均价上涨13.8%
- 2010年-2016年,房产税生效、黄奇帆先生在任
- 2017年-2020年初,重庆市房产均价上涨52.8%
- 2017年-2020年初,房产税生效、黄奇帆先生离任
理论解读:
- 领导人身份特征在管理学界已有诸多研究,如上市公司高管身份与政治关联、对财税的影响等
- 黄奇帆先生曾任全国人民代表大会财政经济委员会副主任委员,具有深厚的经济理论功底,其身份特征与其他城市的领导人相比具有特殊性
- 黄奇帆先生任上,地票制度得以进一步发展,同时政府采取了提高房企进驻重庆的门槛、限制房企数量等诸多措施调控地价和房价
- 黄奇帆先生离任后,相关政策的实际执行发生了变动
综上,在黄奇帆先生任期内,出于领导人的身份效应,重庆市实施了一揽子的控地价限房价政策(包括房产税征收试点),重庆市房产均价波动较小;黄奇帆先生离任仅三年,重庆市房价大幅反弹,此时原有的房产税对房价抑制作用的大小存在疑问。
将房产税单项政策等同于一揽子政策簇,高估了房产税对房价的抑制作用。
注:2015年我国股票市场经历了一轮过山车,低谷来临时,流动性暂时退出股市进驻方式,2015年-2016年,全国多数二线城市迎来房价经历了一轮暴涨。外部变动会加大房产税、领导人身份对房价影响的复杂性。
(二)对合成控制法过程的疑问
1.合成素材的数量
作者认为文章选用的合成控制法,依据多个与实验组结构相似的样本制造控制对象,可以减少主观误差。此处的“多个”为两个或三个,此时,政策时点前的合成易符合实验对象的数据走势,由于合成素材较少且变异性较大,政策试点之后易发生合成对象与实验对象走势出现分歧的现象,少样本的合成,天然有利于处理效应的解释;
2.对合成对象过程疑问
以文章的图1(a)为例,作者选取了以下变量用于合成虚拟重庆的相对工业总产值:
作者提到用来构造实验对象样本的权重由程序选定,相对客观,确实如此,但合成中的变量选定确是主观操作,如,可能人为删除一些变量,改变合成效果
在删除“工业相对就业率(2006) 工业相对就业率(2008) 工业相对就业率(2010)”三个变量后,发现合成效果变差了,表明可以通过改变用来合成变量调节合成效果。
事实上,如果加入xx变量的滞后项,会较大地提升合成效果。
3.对安慰剂检验效果的疑问
在合成对象的合成素材较少且变异性较大,合成过程中可以主观更改用来合成的变量组合的情况下,安慰剂检验的通过似乎是必然的。
四、总结
本文仅基于文本和程序过程,对该案例提出可能的疑问,疑问不代表否定。
对于这类疑问,将评估对象的政策期延长,或许会得出截然相反的结论。
准实验方法中的DID、RDD亦存在类似的因果推断陷阱,如再分配效应会高估政策效果,外溢效应会使得政策效果被低估[4]。相关截取如下:
References
[1] Angrist J D, Pischke J S. The credibility revolution in empirical economics: How better research design is taking the con out of econometrics[J]. Journal of economic perspectives, 2010, 24(2): 3-30.
[2] 赵西亮. 基本有用的计量经济学: 北京大学出版社, 2017.
[3] 刘友金,曾小明.房产税对产业转移的影响:来自重庆和上海的经验证据[J].中国工业经济,2018(11):98-116.
[4] 范子英.如何科学评估经济政策的效应?[J].财经智库,2018,3(03):42-64+142-143.