Author: Judea Pearl
UAI 2001 加州大学洛杉矶分校
论文链接:https://dl.acm.org/doi/pdf/10.5555/2074022.2074073
本文链接:https://www.cnblogs.com/zihaojun/p/15715903.html
目录
Judea Pearl是图灵奖得主,因果推断的奠基人之一。由于阅读的论文中涉及到反事实推断中Total Effect(TE), Natural Direct Effect(NDE), Total Indirect Effect(TIE)等概念,涉及到反事实推断方法的核心,因此前来拜读一下Pearl老爷子二十年前发表的这篇论文。本文被引用1300+。
这篇文章比较硬核,挺难读的,有需求的同学可以先收藏一波,高能预警~~
一个变量对另一个变量的直接效应(direct effect)可以通过控制其他变量(中介变量、其他因变量等)的值来确定,但是在非线性模型中,间接效应(indirect effect)是不能用这种方式得到的,在这种条件下,间接效应甚至还没有明确定义。
直接效应(direct effect):直接效应是指,如果保持其他所有变量都不变,只改变X的值(例如从\(X=x^*\)到\(X = x\),则Y的值发生多少变化。
当考察一个线性系统时,直接效应可以直接通过变量前面的系数得到,中介变量的具体取值没有影响。但是当考察非线性系统时,中介变量的取值也会影响到直接效应的观测结果,因此需要仔细考虑。
(这个概念我还是第一次听说,主要是关于干预控制变量时,中介变量的取值问题。之前没有理解到,非线性系统中,其他变量的取值对因果效应的影响。)
描述性效应(Descriptive effect)指的是,不对中介变量的值做干预,保持其在自然状态下的取值,此时实施干预带来的因果效应。又称为自然效应(natural effect)
规定性效应(Prescriptive effect)指的是,用预定义的值来替换中介变量的值,改变其在自然状态下的取值,此时实施干预带来的因果效应。又称为控制效应(controlled effect)
例如,在2.1中提到的阿司匹林和药品A的例子中
如果一个病人,只有在吃药品A的时候才会吃阿司匹林,而只有吃阿司匹林的时候,服用药品A才有治疗效果。在这种情况下:
在研究自然效应的时候,需要知道病人在自然状态下,服用阿司匹林的剂量,而研究控制效应的时候不需要知道这个信息。
这两个概念的区别在实际人群中观测平均因果效应的时候是很重要的。
在估计自然直接因果效应的时候,需要使病人维持服药前的阿司匹林服用量,这种限制并不是do算子可以描述的,而是在不干预阿司匹林用量的情况下,断开了服药和阿司匹林服用量之间的因果路径。
后文会介绍如何用一种标准的方法处理这种情况。
自然直接效应的概念可以被泛化到自然间接效应,但是规定直接效应无法这样泛化,因为规定效应已经把中介路径阻断了,无法衡量间接效应。
X代表控制变量,即需要研究X对其他变量的因果效应。
Y代表结果变量。
Z代表X和Y之间所有中介变量组成的集合,也可能包含Y除X之外的父节点。
反事实符号\(Y_x(u)\)表示在\(do(X=x),U = u\)的情况下,Y的取值。
【Definition 1】(Controlled unit-level direct-effect; qualitative 个体控制直接效应,存在性定义) 在因果模型M中,如果在U=u的情况下,存在一组模型中其他变量的取值Z=z和X的两个取值\(x,x^*\),使得
\[\begin{align}
Y_{x^*z}(u)\not =Y_{xz}(u)
\end{align}
\]
则称\(X=x\)这个事件(以\(X=x^*\)为参考点)对Y有控制直接效应。
【Definition 2】(Controlled unit-level direct-effect; quantitative 个体控制直接效应,定量)给定一个因果模型M和一个因果图G,在U=u和Z=z的条件设置下,\(X=x\)对Y的因果效应为:
\[\begin{align}
CDE_z(x,x^*;Y,u)=Y_{xz}(u)-Y_{x^*z}(u)
\end{align}
\]
其中Z代表在G中,除X外,Y的所有父节点。
【Definition 3】(Average contrilled direct effect,平均控制直接效应)给定一个概率因果模型\(
\[\begin{align}
CDE_z(x,x^*;Y) = E_u(Y_{xz}-Y_{x^*z})
\end{align}
\]
正如第二部分已经分析过的,自然效应和控制效应最大的区别,就是没有给Z人为赋值,而是使Z保持干预之前的值,相当于删去X到Z的因果路径,但是不对Z的值做干预,这是do算子无法表达的。
【Definition 4】(Unit-level natural direct effect; qualitative 个体自然直接效应;存在性定义)在U=u的条件下,如果
\[\begin{align}
Y_{x^*}(u)\not = Y_{x,Z_{x^*}(u)}(u)
\end{align}
\]
则称事件X=x对Y有自然直接效应。也就是说,\(X\)从\(x^*\)变成\(x\),同时保持\(Z\)还是\(X=x^*\)时的取值,如果此时Y的值发生了变化,则有自然直接效应。
【Definition 4.5】(unit-level natural direct effect; quantitative 个体自然直接效应;定量定义)在U=u的条件下,事件X=x对Y的自然直接效应大小为:
\[\begin{align}
NDE(x,x^*;Y,u)=Y_{x,Z_{x^*}(u)}(u) - Y_{x^*}(u)
\end{align}
\]
【Definition 5】(Average natural direct effect,平均自然直接效应)事件X=x对Y的平均自然直接效应为:
\[\begin{align}
NDE(x,x^*;Y) = E_u(Y_{x,Z_{x^*}}) - E_u(Y_{x^*})
\end{align}
\]
从观测数据中,无法直接估计自然直接效应,换句话说,自然直接效应无法被直接转化为统计量。
文中给出了识别自然直接效应所需的条件,还没看懂。。orzzzz
控制效应只有直接效应,没有间接效应。因此间接效应就只有自然间接效应。
【Definition 6】(Unit-level indirect effect; qualitative,个体间接效应,存在性定义)如果在U=u的条件下,
\[\begin{align}
Y_{x^*}(u) \not = Y_{x^*, Z_x(u)}(u)
\end{align}
\]
则认为一个事件X=x对Y有间接效应。间接效应大小为:
\[\begin{align}
NIE(x,x^*;Y,u) = Y_{x^*,Z_x(u)}(u) - Y_{x^*}(u)
\end{align}
\]
【Definition 7】(Average indirect effect,平均间接效应)事件X=x对Y的平均间接效应为:
\[\begin{align}
NIE(x,x^*;Y) = E_u(Y_{x^*},Z_x) - E_u(Y_{x^*})
\end{align}
\]
【Theorem 3】总的来讲,直接和间接效应遵循如下关系:
\[\begin{align}
&T E\left(x, x^{*} ; Y\right)=N I E\left(x, x^{*} ; Y\right)-N D E\left(x^{*}, x ; Y\right) \\
&T E\left(x, x^{*} ; Y\right)=N D E\left(x, x^{*} ; Y\right)-N I E\left(x^{*}, x ; Y\right) \\
&T E\left(x, x^{*} ; Y\right)=N D E\left(x, x^{*} ; Y\right)+N I E\left(x, x^{*} ; Y\right)
\end{align}
\]
容我过段时间来补上3.4和3.6两部分 TAT
(emmm这个标题没翻译出来)
例如我们要得到\(X\rightarrow Z\rightarrow W \rightarrow Y\)这条路径的因果效应,方法就是通过去除其他\(X\rightarrow Y\)的因果路径,如Figure 3(b)。
这篇文章提出了一种新的路径相关因果效应的定义,通过对路径进行操作,达到了do算子无法表达的效果,将直接效应和间接效应的定义范围扩展到了非线性模型。本文还给出了通过实验数据和非实验数据来识别直接和间接因果效应的条件。通过定义和计算直接和间接效应,可以回答传统方法无法回答的政策问题,为更好的决策提供理论工具支撑。
[1] von Kügelgen J, Gresele L, Schölkopf B. Simpson's paradox in Covid-19 case fatality rates: a mediation analysis of age-related causal effects[J]. IEEE Transactions on Artificial Intelligence, 2021, 2(1): 18-27.
[2] Wei T, Feng F, Chen J, et al. Model-agnostic counterfactual reasoning for eliminating popularity bias in recommender system[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021: 1791-1800.
[3] Wang W, Feng F, He X, et al. Clicks can be cheating: Counterfactual recommendation for mitigating clickbait issue[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021: 1288-1297.
手机扫一扫
移动阅读更方便
你可能感兴趣的文章