清华公共管理学院的“断点回归模型的识别和检验”

就在6月30日这天，清华大学公共管理学院里来了一群搞学术的年轻人，大家把322教室挤得满满当当。这事儿是学院牵头办的，政策所和国情研究院一块凑的局，专门请来加拿大多伦多大学经济系的宛圆渊副教授来唠嗑。这位老师放的是个大招——“断点回归模型的识别和检验”。现场负责招呼大家的是政策所所长戴亦欣，还有副院长朱俊明和张鹏龙两位大牛也在旁边把关。旁边坐着的刘生龙、赵静、王洪川老师，还有来自清华和社科大的硕博研究生、博士后们，加起来刚好22个人。大家聚一块儿，主要是想听听断点回归到底咋回事儿。这方法看着挺美妙，其实挺费事儿，全靠两个假设撑着：一个是局部单调性，一个是局部连续性。这连续性还得分细点儿，“均值连续”（LC-M）跟“分布连续”（LC-D）可不一样。以前想验证这东西，要么全凭肉眼瞎猜，要么用McCrary（2008）那种样本分布检验。这招虽然用得不少，但总被人吐槽是“非必要非充分”的安慰剂。宛圆渊这次拿出了个新东西叫“sharp testable implication”（STI），这招挺狠。他是先把被解释变量圈定一个范围，然后列出几个不等式条件。只要这些不等式全满足了，就相当于给断点回归套上了紧箍咒，能把这两个假设都验出来。从计量理论的角度看，STI是断点回归有效的必要条件，而McCrary检验也就是个候选的充分条件罢了。这俩不冲突，互相补充。他还现场做了个实验。第一个案例是中学班级规模断点（Angrist & Lavy, 1999），他们把22人当成临界点，发现班里学生少了以后成绩变好了。宛老师先拿McCrary验了一下连续性，发现不够看。不过跑了一下STI检验后发现所有闭区间上的不等式都通了，说明原来的估计还是靠谱的。第二个例子是补贴发放标准断点（Miller et al., 2013），是以“贫困线”为分水岭来看现金转移支付对婴儿健康的影响。这时候McCrary检验又报错了，说分布不连续。结果用STI一个个区间去试，发现单调性和连续性都过关了。轮到张鹏龙点评的时候说，这方法最大的好处是它只看被解释变量本身的逻辑就行，不非得看样本分布怎么样。哪怕McCrary的那个检验没过，只要STI在部分区间通过了，研究者照样可以放心用断点回归；这就给了大家更多的模型设定空间和更可信的结论。朱俊明也补充说，从公共管理的角度看，断点回归内部效度是很高的工具。到了问答环节，大家开始使劲儿问：这个方法到底能管多大的事儿？STI跟McCrary到底怎么分工？碰到好几种政策叠加在一起咋处理……宛圆渊挨个给解答了一遍。他还特别提醒大伙儿：“先验假设再漂亮，也不如后验检验来得实在。”现场听得大伙儿是掌声不断。讲座快结束的时候，宛老师在海报上签了名还合影留念。这次分享不仅给了大伙儿检验断点回归的新工具，更把“假设必须被检验”的精神深深印进了每个人的心里。