統計データから因果の構造を明らかにする?

社会の見方、測り方―計量社会学への招待

社会の見方、測り方―計量社会学への招待

中野康人「2-7 3つの変数間の因果構造を調べる:ブレイラックの因果推論」

ブレイラックBlalockの因果推論。サイモンから始まり、ブレイラックが発展させた。これは、重回帰分析・パス解析において、以下の仮定が置かれていることから出発する。

  • いずれの誤差項も、モデル内のすべての変数と無相関であり、他の変数の誤差項とも無相関である
  • ある変数が独立変数であるならば、モデル内の他のどの変数とも無相関である

この仮定を逆手にとって、こうした仮定がよりよく満たされているモデルこそが、実世界の因果関係の構造・方向性を反映しているのだ、と考えるのが、サイモン=ブレイラックの因果推定法である。

この因果推定法の基本は、以下の3つを区別すること。r(x,y)=xとyの相関係数、と表記する。r(x,y)とr(y,z)は十分に大きいとして、

  1. r(x,z)=r(x,y)*r(y,z) → yは媒介変数:xがyを規定し、yがzを規定している / yは交絡変数:yがxを規定し、他方でyがzを規定している
  2. r(x,z)=0 → yは結合変数:xとzが、yを規定している(xとzが無相関→xとzは独立変数)
  3. その他

この性質を利用して、yとzの因果の方向性を調べるために、x→yの因果関係が明らかで、xと他の全変数が無関係なことも明らかなxを導入するという手法がある。その結果が上記1だったらy→z、上記2だったらz→yとなる。このxを操作変数と呼ぶらしい。

もちろん、ブレイラックの因果推論も、結局はx→yという固い因果関係を前提にして、それに結びつける形で統計データを使っているわけで、どこかで統計データの外部との接点が必要なのは変わらない。

ただ、因果関係の方向性は、定量データの外部でのみ決まるというものでもなくて、定量データの中にも方向性を示唆する要素が含まれている、ということは、計量分析の現状を知る上で重要な気がする。

この議論は、操作変数の導入によって対立モデルの同値モデル(数理上は識別できないモデルたち=適合度が同じ値になる)化を回避する、という方向へとつながっていくようだ。

先日レビューしたLizardoの「文化的嗜好とパーソナルネットワークの形態」論文での因果推定法は、この推定法をもう少し前進させた感じなのかな。あるいは、大ざっぱにした感じなのか。