粗化(广义)精确匹配

type
status
date
slug
summary
tags
category
category (1)
icon
password

定义

  • 粗化精确匹配(coarsened exact matching,CEM) 是Blackwell和Gary King等人在2010年左右提出的一种基于匹配思想的样本加权方法,并不是一种参数估计方法。简单说就是先进行匹配并赋予观测值权重,随后再对加权的样本进行最小二乘或极大似然等参数估计方法。

匹配的目的

  • 匹配的目的是通过删减观测值,使控制组和处理组在变量上具有更好的平衡性。
  • 匹配可以缓解样本自选择问题,也就是核心解释变量和某些解释变量存在相关关系。当然,我们需要认识到匹配的缺陷,它仅仅是缓解,而且仍可能存在反向因果、遗漏解释变量等内生性问题。

精确匹配(Exact matching)

  • 补充知识:协变量(covariate)是指那些与因变量有线性相关关系,但在研究中并不是主要关注的变量。控制变量(control variable)是指在实验中需要保持不变的变量,以消除它们对因变量的潜在影响。
  • 精确匹配的意思是用处理组的个体匹配在控制组中拥有相同特征的个体。(Blackwell et al., 2009)。(原文:matches a treated unit to all the control units with the same covariate values.)

例子

notion image
notion image
  • 表1是该样本精确匹配的结果,里面有个体1-6属于处理组(上了大学),个体7-12属于控制组(没上大学),因变量是工资,协变量是家庭条件,strata代表的是匹配层。
  • 匹配层(strata):具有相同特征的处理组和控制组个体会被分配到同一层级中,且一个层级中至少要有一个控制组个体和一个处理组个体,若仅有控制组个体或仅有处理组个体,则不存在该匹配层

粗化精确匹配

由于精确匹配无法解决连续变量的匹配问题,因此自然而然的,我们会想到,那我们将连续变量(当然也可以是有序多分类变量)转化为有序多分类变量(这个过程我们可以称之为粗化(coarsen)变量) 不就行了吗,粗化精确匹配正是基于这样的思想,这句话是粗化精确匹配的核心思想,牢记!!!粗化变量+精确匹配=粗化精确匹配
Prev
NAS使用心得
Next
PSM
Loading...