0. Abstract
이 논문은 non experimental data로 부터, action과 policy의 effect를 estimate한다.
이 논문은 다음을 제공한다.
- causal effect(CE) identifiability(I)의 sufficient criterion
- I일 때, 이에 대한 compuation procedure
General Identification Condition for Causal Effects
On the Testable Implications of Causal Models with Hidden Variables
이 둘을 읽고 보면 좋다.
1. Introduction
CEI는 $P_t(y)$가 nonexperimental data로 consistently estimate이 가능한 지에 대한 답이다.
만약, some confounder가 not measured일 때, identifability에 대한 질문이 발생한다.
I 여부는 $T$와 $Y$에 대한 confounder의 위치에 의존한다.
Sufficient criterion으로는 backdoor, frontdoor criterion 등이 있다.
더 일반적으로 위의 criterion들은 do-calculus의 반복에 불과하다.
추가로 펄책의 114-118에서 (backdoor, frontdoor)를 포함하는 sufficient graphical criteria을 보였다.
그 criteria은 longitudinal data에서 unmeasured confounder가 존재해도 time-varying treatment의 effect를 estimate하게 해줬다.
이 논문은 현존하는 criterion을 더 간단하고 더 일반화하는 criteria를 제공한다.
Section 3~5에서 unobserved variable이 root 노드이면서 오직 2개의 observed child를 가지는 semi-Markovian model 에서의 I를 다룬다.
Section 3
- CEI of $P_x(v)$ where a sigleton $X \in V$ and $V = V \setminus \{ X\}$
- $X$와 $Ch(X)$가 같은 c-component에 속하지 않음 $<==>$ $P_x(v)$ is identifiable
Section 4
- CEI of $P_x(s)$ where a sigleton $X \in V$ and $S \subseteq V \setminus \{ X\}$
- …
Section 5
- CEI of $P_t(s)$ where a subset $T \subseteq V$ and $S \subseteq V \setminus T$
Section 6
- SMM에 걸린 unobserved node의 조건을 없앤 일반적인 모델을 다룬다.
- 그 모델에서의 CE가 똑같은 I property를 갖는 SMM으로 projection한 뒤에 identify될 수 있음을 보인다.
2.Notation, Definitions, and Problem Formulation
(Skip)
3. Identification of $P_{x}(v)$
(Skip)
General Identification Condition for Causal Effects의 내용과 거의 겹친다.
Identifiability의 필요충분조건에 대한 증명이 더 엄밀해졌다.
4. Identification of $P_x(s)$
- $X \in V$ and $S \subseteq V \setminus \{ X\}$
당연히 $P_x(v)$가 I면 $P_x(s)$도 I다.
하지만, $P_x(v)$가 identifiable하지 않더라도 $P_x(s)$가 identifiable일 수 있다.
$P_x(y) = P(y \mid x)$로 identifiable하지만, $P_x(y, z)$는 identifiable하지 않다.
$G$에서 의미없는 node들을 쳐낸 뒤에 $P_x(v)$의 identification criterion으로 identify 할 수 있다.
4.1 A criterion for identifying $P_x(s)$
Let $An(C) = C \cup An(C)$
$S$의 ancestrer가 아닌 node들은 $P_x(s)$ identification에 필요하지 않다.
Lemma 2
$P_x(s)$ is identifiable in $G$ $<==>$ $P_x(s)$ is identifiable in $G_{An(S)}$
(Proof)
<==
$\sum_{V \setminus An(S)}P(v) = P(an(S))$
즉, $P_x(s)$가 $P(an(S))$로 구할 수 있음은 $P(v)$로도 구할 수 있음을 의미한다.
==>
Lemma 13에서, $G$에서 identifiable했으면, edge들을 좀 빼더라도 identifiable함을 보였다.
Lemma 13
Let $S,T \subseteq V$ be two disjoint sets of variables.
If $P_t(s)$ is not identifiable in $G$, then $P_t(s)$ is not identifiable in $G^+$ where $G^+ = G + \left\{\begin{array}{l} \text{a directed edge} \\ or\\\text{a bidirected edge} \end{array}\right.$
Equivalently,
If $P_t(s)$ is identifiable in $G$, then $P_t(s)$ is identifiable in $G^-$ where $G^- = G - \left\{\begin{array}{l} \text{a directed edge} \\ or\\\text{a bidirected edge} \end{array}\right.$
(증명 sketch)
- identifiable하지 않을 때 distribution은 같지만
- interventional distribition이 다른 2개의 SCM을 준비한다.
- 2개의 SCM에 대응하여 edge는 넣는 대신에 이를 반영하지 않는 방식으로 결국 같은 SCM을 만든다.
Theorem 4 (By Lemma 2)
$P_x(s)$ is identifiable if $^{\not \exists}$bidirected path connecting $X$ to $Ch(X)$ in $G_{An(S)}$
(Proof)
$G_{An(S)}$에 BP가 없다면, Theorem 3에 의해 $P_x(an(s))$를 구할 수 있다.
추가로 marginalization을 하면 $P_x(s)$를 구할 수 있다.
Theorem 4의 조건은 만족하지 못했지만, $P_x(s)$는 identifiable인 예시를 보자.
그리고 이를 통해서 Theorem4의 criterion을 향상시키는 방법에 대한 힌트를 얻어보자.
4.2 An example
$P(v)$를 c-factor로 factorize하는 것을 활용하는 걸 설명하겠다.
편의를 위해, $Q\left[C\right]$로 표기하겠다. 몇가지 property를 나열하자면,
- $Q\left[V \right] = P(v)$
- $Q\left[ \emptyset \right] = 1$
- $Q\left[ V \right] = \prod _i Q\left[ S_i \right]$ where $S_i$ are the c-component of $G$
$G_{An(Y)} = G$이고, $X$와 $Z$ 사이에 bidirected path가 있으므로 Theorem 4는 적용 불가능하다.
Let $V = \{ X, Z, Y, W_1, W_2\}$
Let $V’ = \{ Z, Y, W_1, W_2\} = V \setminus \{ X\}$
Then,
- $V$ is partitioned into $\{ W_2\}$, $\{ Y\}$, $S^X = \{ X, Z, W_1\}$
- $P(v) = P(w_2 \mid w_1) P(y \mid z) Q\left[S^X\right]$ where
Marginalize as
$W_1$과 $W_2$가 sum-out된 이유는
- $Q[V’]$이 $G_{V’}$의 joint distribution에 대응되고
- $G_{V’}$에서, $W_1$과 $W_2$는 $Y$의 ancestor가 아니였다.
$P_x(y)$는 $Q\left[ \{ Z\}\right]$를 계산하는 문제가 되었고, 이는 $Q[S^X]$로 계산될 수 있다.
$P_x(y)$ identification에 $Q$가 중요한 역할을 한다는 것을 확인했다.
짚고 넘어가야 할 부분
- $Q \left[ V’\right]$에서 $W_1$과 $W_2$는 $An(Y)_{G(V’)}$에 속하지 않았기에 sum-out 되었다.
- $Q\left[\{X, Z\}\right] $가 $Q\left[\{X\}\right]$와 $Q\left[\{Z\}\right]$의 product로 표현된 이유는 둘은 $G_{\{ X,Z\}}$에서 c-component이기 떄문이다.
이 아이디어에 착안해서 2개의 Lemma를 도입하겠다.
4.3 Lemmas
특정 조건에서 $Q\left[C\right]$에 summation을 하는 것은 몇몇 factor들을 지우는 행위이다.
이는 $Q\left[C\right]$로부터 $Q\left[W\right]$를 구할 수 있는 지 여부를 제공한다.
여기의 렘마의 증명은 On the Testable Implications of Causal Models with Hidden Variables와 거의 똑같기 때문에 생략함
Lemma 3
Let $W \subseteq C \subseteq V$ and $W’ = C \setminus W$
If $W$ is an ancestral set in $G_C$, then $\sum_{W’} Q\left[ C \right] = Q \left[ W \right]$
Lemma 4 (Generalized Q-decomposition)
Let $H \subseteq V$
Let $H_{1}, \ldots, H_{l}$ be the c-components in the subgraph $G_H$
[1] : Then, $Q[H]=\prod_{i} Q\left[H_{i}\right]$
Let $k$ be the number of variables in $H$
Let a topological order of the variables in $H$ be $V_{h_{1}}<\cdots< V_{h_k}$ in $G_H$
Let $H^{(i)}=\left\{V_{h_{1}}, \ldots, V_{h_{i}}\right\}$ and $H^{(0)} = \emptyset$
[2] : Then, $Q\left[H_{j}\right] =\prod_{\left\{i \mid V_{h_{i}} \in H_{j}\right\}} \frac{Q\left[H^{(i)}\right]}{Q\left[H^{(i-1)}\right]}$ where $Q\left[H^{(i)}\right] =\sum_{h \backslash h^{(i)}} Q[H] $
$Q\left[H^{(i)}\right] =\sum_{h \backslash h^{(i)}} Q[H] $이 Lemma 3의 inverse임을 인지하여야 함!
[3] : Then, $\frac{Q\left[H^{(i)}\right]}{Q\left[H^{(i-1)}\right]}$ is a function only of $P a^{+}\left(T_{i}\right)$ where $T_i$ is a c-component of $G_{H^{(i)}}$ that contains $V_{h_i}$
$T_i$를 점점 커지는 $G(H)$에서 최근에 추가된 노드가 속한 c-component를 생각하면 직감적
4.2 example에 Lemma를 적용하면
$S^X = \{ X, W_1, Z\}$에서 $H=\{X, Z \}$로 둘 경우, $\{ X\}, \{Z\}$로 분리된다.
그 경우, $H^{(1)} = \{ X\}$ , $H^{(2)} = \{ X, Z\}$
Lemma 4 [3]에 의하면, $Q\left [Z\right ]$는 $w_2$에 의존하지 않는다.
Functional constraints를 체계적으로 찾는 방법은 On the Testable Implications of Causal Models with Hidden Variables에 나와있다.
Lemma 1, 3, 4에 기반하여 $P_x(s)$를 체계적으로 계산해보자.
4.4 Computing $P_x(s)$
Let $V$ be partitioned into c-components $S^X, S_1, \ldots, S_k$ where $X \in S^X$.
Let $V’ = V \setminus \{X\}$. Then,
- $P(v) = Q\left[V \right] = Q[\left[ S^X \right ]] \prod _i Q \left[ S_i \right]$
- $P_x(v’) = Q\left [V’ \right ] = Q\left[ S^X \setminus \{ X\}\right] \prod _i Q \left[ S_i \right]$
We want to compute $P_x(s) = \sum_{v’ \setminus s} P_x(v’) = \sum_{v’ \setminus s} Q\left [V’ \right ]$
- Let $D = An(S)_{G_{V’}}$
- Since $D$ is ancestral set in $G_{V’}$,
- $\sum_{v^{\prime} \setminus d} Q\left[V^{\prime}\right] = Q\left[D \right]$
- Therefore,
- $P_x(s) = \sum_{v’ \setminus s} Q\left [V’ \right ] = \sum_{d \setminus s} \sum_{v^{\prime} \setminus d} Q\left[V^{\prime}\right] = \sum_{d \setminus s} Q\left[D \right]$
Let $D^X = D \cap S^X$ and $D_i = D\cap S_i$. Then,
- $\begin{aligned}Q\left[D \right] &=\sum_{v^{\prime} \setminus d} Q\left[V^{\prime}\right] \\& = \sum_{v^{\prime} \setminus d} Q\left[ S^X \setminus \{ X\}\right] \prod _i Q \left[ S_i \right] \\& = Q\left[D^{X}\right] \prod_{i} Q\left[D_{i}\right] \end{aligned}$
- $D_i$가 $G_{S_i}$에서 ancestral set이기에 $\sum_{v^{\prime} \setminus d}$를 가장 말단 노드부터 하다보면 위 처럼 factorize될 것임이 자명하다.
- $Q\left[D_{i}\right]=\sum_{s_{i} \setminus d_{i}} Q\left[S_{i}\right], \quad i=1, \ldots, k$
- $D_i$가 $G_{S_i}$에서 ancestral set이기에 Lemma 3 적용
지금까지의 derivation을 풀어쓰면
추가로 $G_{D^{X}}$에서 $D_{1}^{X}, \ldots, D_{l}^{X}$로 c-component partition이 나눠진다면,
$D_j^X \subset S^X$ 이기 때문에, $Q \left [ D_j^X\right]$가 $Q\left [ S^X\right]$로 계산될 수 있으면 이는 identifiable하다.
이제 $Q \left [ D_j^X\right]$를 $Q\left [ S^X\right]$로 계산해보도록 하자.
Let $F = An(D_j^X)_{G_{S^X}}$
$Q\left [F\right]$는 identifiable함
- 만약 $F = D_j^X$인 경우,
- Lemma 3에 의해, $Q\left[D_{j}^{X}\right]=\sum_{S^{X} \backslash D_{j}^{X}} Q\left[S^{X}\right]$
- 만약 $F=S^X$인 경우,
- 실패
- (이 실패가 non-identifiability를 의미하는 지는 의문)
- 만약 $D_j^X \subset F \subset S^X$인 경우,
- Lemma 3에 의해, $Q\left[F\right]=\sum_{S^{X} \backslash F} Q\left[S^{X}\right]$
- $F \subset S^X$ 이기 때문에, $Q \left [ D_j^X\right]$가 $Q\left [ F\right]$로 계산될 수 있으면 $Q\left[S^{X}\right]$로도 구해질 수 있다.
- $H :=$ c-component containing $D_j^X$ in $G_F$
- Lemma 4에 의해, $Q\left[H\right]$는 $Q\left[F\right]$로 구해질 수 있다.
- $Q \left [ D_j^X\right]$를 구하는 문제를 $Q\left [ S^X\right] \Rightarrow Q\left[F\right] \Rightarrow Q\left[H\right]$로 구하는 문제로 줄였다.
위의 결과는 $Q\left [ D_j^X\right]$가 $Q\left[ S^X\right]$로 구해질 수 있는 지를 결정하는 과정을 제공한다.
- $Q\left [ D_j^X\right]$를 구하거나
- 실패하거나
- 더 간단한 $H \subset S^X$로 문제를 줄이거나
$C \subset T \subset V$에 대해서, $Q\left[ C \right]$가 $Q\left[T\right]$로 구해질 수 있는 가에 대한 일반적인 함수
$P_x(s)$를 구하는 알고리즘
4.5 Useful graphical criteria
위에서 identifiability를 결정하고 그 경우에 이를 계산하는 알고리즘을 제공하였다.
빠르게 identifiability 결정에 사용할 수 있는 graphical criteria를 설명하겠다.
주된 아이디어는 중요하지 않은 노드들을 체계적으로 제거하는 것이다.
- $V \setminus An(S)$ 제거 (Lemma 2)
- $V \setminus S^X$ 제거 (Lemma 6)
Let $A \subseteq B \subseteq V$
Let $Q\left[A \right]_{G_B}=\sum_{u} \prod_{\left\{i \mid V_{i} \in A\right\}} P\left(v_{i} \mid p a_{i}^{\prime}, u^{i}\right) P(u)$ where $P A_{i}^{\prime}=P A_{i} \cap B$
Let $Q\left[A\right] = Q\left[ A\right]_{G_V}$
Lemma 5
Let $A \subseteq B \subseteq V$
- $Q\left[A\right]$ is computable from $Q\left[B\right]$
- iff
- $Q\left[A\right]_{G_B}$ is computable from $Q\left[B\right]_{G_B}$
==> 증명은 Lemma 13의 적용, <== 증명은 귀류법
Lemma 6 (reduce identification problem)
Let $D^X = A n(S)_{G_{V \backslash\{X\}}} \cap S^X$
Then, $P_x(s)$ is identifiable if $P_x(D^X)$ is identifiable in $G_{S^X}$
(Proof)
4.4에서 $P_x(s) = \sum_{d \setminus s} Q\left[D^{X}\right] \prod_{i} \sum_{s_{i} \setminus d_{i}} Q\left[S_{i}\right]$ 임을 보였다.
그래서 $Q\left[D^X\right]$가 identifiable이면 $P_x(s)$도 identifiable임을 보였다.
Lemma 5에 의해, $Q\left[D^X\right]_{S^X}$가 identifiable이면, $Q\left[D^X\right]$도 identifiable이다.
Let $E^X = S^X \setminus \{D^X \cup X \}$. Then,
즉, $P_x(D^X)$가 $G_{S^X}$에서 identifiable이면, $P_x(s)$는 identifiable이다.
4.6 An Example
$P_x(y)$를 고려해보자.
Lemma 2와 Lemma 6의 반복으로 identifiable하다는 것까지는 확인할 수 있다.
이제 이를 구해보도록 하자.
Phase 1
- $G$ has one c-component $S^X$
- Compute ; $Q\left [ S^X \right] = P(v)$
- Let $D = A n( \{ Y\})_{G_{V \backslash\{X\}}} = \{ Y\}$ and $D^X = D \cap S^X = \{ Y\}$
- Let the c-compont of $G_{D^X}$ be $D_1^X = \{ Y \}$
Phase 2
Identify$ \left (\{Y \}, V, P(v) \right)$
Let $A_1 = An(\{ Y\}) = \{ X, Y, W_{1:4}\}$
$G_{A_1}$ has two c-components $T_{1}=\left\{X, Y, W_{1}, W_{2}, W_{3}\right\}$ and $\left\{W_{4}\right\}$
topological order in : $W_{3}<W_{4}<W_{1}<W_{2}<X<Y$
Identify(Identify$ \left (\{Y \}, T_1, Q\left[T_1 \right] \right)$
Let $A_2 = An(\{ Y\})_{G_{T_1}} = \{ X, Y, W_1, W_2 \}$
$G_{A_2}$ has two c-components $T_{2}=\left\{X, Y, W_{1}\right\}$ and $\left\{W_{2}\right\}$
topological order in $G_{A_2}$ : $W_{1}<W_{2}<X<Y$
Identify(Identify$ \left (\{Y \}, T_2, Q\left[T_2 \right] \right)$
Let $A_3 = An(\{ Y\})_{G_{T_2}} = \{X, Y \}$
$G_{A_3}$ has two c-components $\{ X\}$ and $\{ Y\}$
topological order in $G_{A_3}$ : $X < Y$
Phase 3
4.7 Galles&Pearl’s graphical criterion vs. do-calculus
Galles and Pearl, 1995은 그들의 G-criteria가 do-calculus로 증명될 수 있는 identifiability를 모두 포함한다고 주장했으나, 그렇지 않았다.
skip
5. Identification of $P_t(s)$
이제까지 intervention은 single variable $X$에만 적용됐다.
이번 섹션에서, 임의의 $T \subset V$에 대해서 intervention을 하겠다.
$P_t(s)$ identification도 identifying $Q\left[C\right]$ from $Q\left[C’\right]$ 으로 줄어듦을 보이겠다.
5.1 Computing $P_t(s)$
Let $T’=V \setminus T$
We want to compute $P_{t}(s)=\sum_{T^{\prime} \setminus S} P_{t}\left(t^{\prime}\right)=\sum_{T^{\prime} \setminus S} Q\left[T^{\prime}\right]$
Let $D = An(S)_{G_{T’}}$
Then,
Hence if all $Q\left[D_i\right]$ are identifiable, $P_t(s)$ is identifiable.
Let $V$ be partitioned into c-components $S_1, \cdots, S_k$
Then, any $D_i$ is a subset of certain $S_j$
$D_i$안의 변수들은 서로 $G$상의 BP로 연결됐다. 결국 $D_i$는 특정 c-component에 속한다.
$D_i \subseteq S_j$라면, $Q\left[D_i\right]$의 identifiability는 identify($D_i, S_j, Q\left[ S_j\right]$)로 결정될 수 있다.
5.2 Useful graphical criteria
다음으로, 그래프만으로 빠르게 identifiability를 결정한 graphical criteria를 보이겠다.
Let $T’ = V \setminus T$
우선 $P_t(t’)$에서 보이겠다.
Theorem 5
If ${}^{\not\exists}$BE btw $T \sim T’$, then $P_t(t’)$ is identifiable.
Let a topological order over $V$ be $V_{1}<\ldots<V_{n}$
Let $V^{(i)} = \{V_1, \cdots, V_i \}$ for $i=1, \cdots, n$ and $V^{(0)} = \emptyset$
Then by Lemma 1,
Let $V$ be partitioned into $S_1, \cdots, S_k$
Let $T_i = T \cap S_i$ and $T_i’ = T’ \cap S_i$ for $i=1, \cdots, k$
Since $P_{t}\left(t^{\prime}\right) =Q\left[T ^\prime \right] =\prod_{i} Q\left[T_{i}^{\prime}\right]$
- $P_t(t’)$ is identifiable iff each $Q\left[ T_i’ \right]$ is computable from $Q\left [ S_i\right]$
Since $P_{t_{j}}\left(v \backslash t_{j}\right)=Q\left[T_{j}^{\prime}\right] \prod_{i \neq j} Q\left[S_{i}\right]$
- $P_{t_j}(v \setminus t_j)$ is identifiable iff each $Q\left[ T_j’\right]$ is computable from $Q\left [ S_j\right]$
Lemma 7
Let $V$ be partitioned into c-components $S_1, \cdots , S_k$
Let $T_i = T \cap S_i$ for $i=1 , \cdots , k$
Then, $P_{t}(t’)$ is identifiable iff $P_{t_i} (v \setminus t_i)$ is identifiable for every $i=1, \cdots, k$
In the subgraph $G_{S_i}$,
- $P(s_i) = Q\left[S_i\right]_{G_{S_i}}$
- $P_{t_i} (s_i \setminus t_i) = Q \left[ T_i’\right]_{G_{S_i}}$
Lemma 8
- By Lemma 5,
- $ Q\left[ T_i ‘ \right]$ is computable from $Q\left[ S_i\right]$ iff $P_{t_i}(s_i \setminus t_i)$ is identifiable in $G_{S_i}$
$Q \left[ T_i ‘ \right]$ is computable from $Q\left[ S_i\right]$ 의 가장 간단한 조건은 $T_i’$이 ancestral set일 때다.
Theorem 6
Let $S_i$ be a c-component of $G$
Let $T_i \subseteq S_i$
If the children of variables in $T_i$ are either
in $T_i$ or
outside of $S_i$
then identifiable and can be computed from $Q\left[ S_i\right]$
이제 graphical criteria for identifiability of $P_t(s)$ 를 알아보자.
Lemma 9
Let $D = An(S)_{G_{V\setminus T}}$
Let $V$ be partitioned into c-components $S_1, \cdots, S_k$.
Let $T_i = T \cap S_i$ and $D_i = D \cap S_i$ for $i=1, \cdots, k$
Then, $P_t(s)$ is identifiable if $P_{t_i}(d_i)$ is identifiable in $G_{S_i}$ for every $i=1, \cdots, k$
(Proof)
Since $P_{t}(s) = \sum_{D \setminus S} \prod_{i} Q\left[D_{i}\right]$, $P_t(s)$ is identifiable if each $Q\left[ D_i\right]$ is identifiable.
By Lemma 5, $Q\left[ D_i\right]$ is computable from $Q\left[ S_i\right]$ iff $Q\left[D_i\right]_{G_{S_i}}$ is computable from $Q[S_i]_{G_{S_i}}$
Let $T_i’ = S_i \setminus T_i$
Since $P_{t_{i}}\left(d_{i}\right)=\sum_{T_{i}^{\prime} \backslash D_{i}} P_{t_{i}}\left(t_{i}^{\prime}\right)=\sum_{T_{i}^{\prime} \backslash D_{i}} Q\left[T_{i}^{\prime}\right]_{G_{S_{i}}}=Q\left[D_{i}\right]_{G_{S_{i}}}$, it’s all done.
Lemma 10
Let $T_1 = T \cap An(S)$
$P_t(s)$ is identifiable iff $P_{t_1}(s)$ is identifiable in $G_{An(S)}$
Lemma 9와 10은 $P_t(s)$ identification을 subgraph에서의 문제로 줄여준다.
줄여진 문제는 Theorem 4와 6으로 적용가능해진다.
5.3 Examples
Let $T= \{ X_1, X_2\}$ and $S = \{Y\}$
Phase-1
c-components $S_1 := \{ X_1, Z, Y\}, S_2:= \{ X_2\}$
$Q\left[ S_1\right] = P\left(y \mid x_{1}, x_{2}, z\right) P(x_{1}) P( z \mid x_1)$
$Q\left[ S_2\right] = P\left(x_2 \mid x_{1}, z\right)$
$D:= An(\{ Y \})_{G_{V \setminus \{ X_1, X_2\}}} = \{ Y\}$
$D_1 := D \cap S_1 =\{ Y\}$, $D_2 := D \cap S_2 = \emptyset$
graphical criteria
- Lemma 9 : $P_{x_1, x_2}(y)$ is identifiable if $P_{x_1}(y)$ is identifiable in $G_{S_1}$
- Theorem 4 : $P_{x_1}(y)$ is identifiable in $G_{S_1}$
Phase-2
- $Identify(D_1, S_1, Q \left[ S_1\right])$
- Let $A = An(D_1)_{G_{S_1}} = \{ X_1, Y\}$
- Since $D_1 \subset A \subset S$,
- $G_A$ has two c-components $T^\prime :=\{Y \}$, $\{ X_1\}$
- $\begin{aligned} Q\left[ A\right] &= \sum_{S_1 \setminus A}Q\left[ S_1\right] \\&= Q \left[ \{X_1, Y \}\right] \quad \because \text{Lemma 3}\\&= Q\left[\left\{X_{1}\right\}\right] Q[\{Y\}] \quad \because \text{Lemma 4}\end{aligned}$
- $\begin{aligned} Q\left[ X_1\right] &= P(x_1)\end{aligned}$
- $\begin{aligned} Q\left[ Y_1 \right] &= Q\left[ A\right] / Q\left[\{ X_1\} \right] \\&= \sum_{z} Q[S] / Q\left[\left\{X_{1}\right\}\right] \\ &= \sum_{z} P\left(y \mid x_{1}, x_{2}, z\right) P\left(z \mid x_{1}\right)\end{aligned}$
Phase-3
- $\begin{aligned}P_{t}(s)&=\sum_{D \backslash S} \prod_{i} Q\left[D_{i}\right] \\ &= Q\left[ D_1\right] \\ &= Q\left[ \{ Y\}\right] \\ &= \sum_{z} P\left(y \mid x_{1}, x_{2}, z\right) P\left(z \mid x_{1}\right)\end{aligned}$
Let $T = \{ X_1, X_2\}$ and $S = \{ Y\}$
Phase-1
c-components $S_1 := \{ X_2, W, Y\}, S_2:= \{ X_1\}$
$Q\left[ S_1\right] = P\left(y \mid x_{2}, w\right) P(x_{2} \mid x_1) P( w \mid x_2)$
$Q\left[ S_2\right] = P\left(x_1 \right)$
$D:= An(\{ Y \})_{G_{V \setminus \{ X_1, X_2\}}} = \{ Y\}$
$D_1 := D \cap S_1 =\{ Y\}$, $D_2 := D \cap S_2 = \emptyset$
graphical criteria
- Lemma 9 : $P_{x_1, x_2}(y)$ is identifiable if $P_{x_2}(y)$ is identifiable in $G_{S_1}$
- Theorem 4 : $P_{x_2}(y)$ is identifiable in $G_{S_1}$
…
Let $T = \{ X_1, X_2\}$ and $S = \{ Y\}$
Phase-1
- c-components $S_1 := \{ X_1 \} , S_2:= \{Y \}, S_3 := \{ X_2, Z_1, Z_1^\prime \}$
- …
graphical criteria
- Lemma 7 : $P_{x_{1} x_{2}}(y)$ is identifiable if $P_{x_{1}}(v)$ and $P_{x_{2}}(v)$ are identifiable
- Theorem 3 : $P_{x_{1}}(v)$ and $P_{x_{2}}(v)$ are identifiable
Compute $P_t(t^\prime)$
Let $T = \{ X_1, X_2\}$ and $S = \{ Y\}$
Phase-1
- c-components $S_1 := \{ X_1, X_2, Y \} , S_2:= \{Z_1 \}, S_3 := \{ Z_2 \}$
- $T_1 := S_1 \cap T = \{ X_1, X_2 \}$
graphical criteria + compute $P_{t_i}( v \setminus t_i)$
- Theorem 6 : $P_{T_1}(v \setminus t_i)$ is identifiable
- $P_{t_{1}}\left(v \setminus t_{1}\right)=\frac{P(v)}{Q\left[S_{1}\right]} \sum_{T_{1}} Q\left[S_{1}\right] =P\left(z_{1} \mid x_{1}\right) P\left(z_{2} \mid x_{1}, x_{2}\right) \sum_{x_{1}^{\prime}, x_{2}^{\prime}} P\left(y \mid x_{1}^{\prime}, x_{2}^{\prime}, z_{1}, z_{2}\right) P\left(x_{2}^{\prime} \mid x_{1}^{\prime}, z_{1}\right) P\left(x_{1}^{\prime}\right) .$
- $P_{x_{1} x_{2}}(y)=\sum_{z_{1}, z_{2}} P\left(z_{1} \mid x_{1}\right) P\left(z_{2} \mid x_{1}, x_{2}\right) \sum_{x_{1}^{\prime}, x_{2}^{\prime}} P\left(y \mid x_{1}^{\prime}, x_{2}^{\prime}, z_{1}, z_{2}\right) P\left(x_{2}^{\prime} \mid x_{1}^{\prime}, z_{1}\right) P\left(x_{1}^{\prime}\right)$