清华公共管理学院的“断点回归模型的识别和检验”

就在6月30日这天,清华大学公共管理学院里来了一群搞学术的年轻人,大家把322教室挤得满满当当。这事儿是学院牵头办的,政策所和国情研究院一块凑的局,专门请来加拿大多伦多大学经济系的宛圆渊副教授来唠嗑。这位老师放的是个大招——“断点回归模型的识别和检验”。现场负责招呼大家的是政策所所长戴亦欣,还有副院长朱俊明和张鹏龙两位大牛也在旁边把关。旁边坐着的刘生龙、赵静、王洪川老师,还有来自清华和社科大的硕博研究生、博士后们,加起来刚好22个人。 大家聚一块儿,主要是想听听断点回归到底咋回事儿。这方法看着挺美妙,其实挺费事儿,全靠两个假设撑着:一个是局部单调性,一个是局部连续性。这连续性还得分细点儿,“均值连续”(LC-M)跟“分布连续”(LC-D)可不一样。以前想验证这东西,要么全凭肉眼瞎猜,要么用McCrary(2008)那种样本分布检验。这招虽然用得不少,但总被人吐槽是“非必要非充分”的安慰剂。 宛圆渊这次拿出了个新东西叫“sharp testable implication”(STI),这招挺狠。他是先把被解释变量圈定一个范围,然后列出几个不等式条件。只要这些不等式全满足了,就相当于给断点回归套上了紧箍咒,能把这两个假设都验出来。从计量理论的角度看,STI是断点回归有效的必要条件,而McCrary检验也就是个候选的充分条件罢了。这俩不冲突,互相补充。 他还现场做了个实验。第一个案例是中学班级规模断点(Angrist & Lavy, 1999),他们把22人当成临界点,发现班里学生少了以后成绩变好了。宛老师先拿McCrary验了一下连续性,发现不够看。不过跑了一下STI检验后发现所有闭区间上的不等式都通了,说明原来的估计还是靠谱的。 第二个例子是补贴发放标准断点(Miller et al., 2013),是以“贫困线”为分水岭来看现金转移支付对婴儿健康的影响。这时候McCrary检验又报错了,说分布不连续。结果用STI一个个区间去试,发现单调性和连续性都过关了。 轮到张鹏龙点评的时候说,这方法最大的好处是它只看被解释变量本身的逻辑就行,不非得看样本分布怎么样。哪怕McCrary的那个检验没过,只要STI在部分区间通过了,研究者照样可以放心用断点回归;这就给了大家更多的模型设定空间和更可信的结论。朱俊明也补充说,从公共管理的角度看,断点回归内部效度是很高的工具。 到了问答环节,大家开始使劲儿问:这个方法到底能管多大的事儿?STI跟McCrary到底怎么分工?碰到好几种政策叠加在一起咋处理……宛圆渊挨个给解答了一遍。他还特别提醒大伙儿:“先验假设再漂亮,也不如后验检验来得实在。”现场听得大伙儿是掌声不断。 讲座快结束的时候,宛老师在海报上签了名还合影留念。这次分享不仅给了大伙儿检验断点回归的新工具,更把“假设必须被检验”的精神深深印进了每个人的心里。