なぜ統計学が最強の学問なのか?

なぜ統計学が最強の学問であるのか?西内さんの本[注1] から盛大に引用します。その理由は、「人間の制御しうる何物についても、その因果関係[注2] を分析できるから」であり、この統計学の汎用性は、どのようなことの因果関係も科学的に検証可能なランダム化比較試験(=実験)によって支えられています。ランダム=無作為とは、「意図的に手を加えることなく、偶然にまかせること」(広辞苑)であり、十分にランダム化してしまえば、検定したい1因子以外の因子(背景因子)は群間で同じとなります。適切にランダム化された比較試験によって「ある結果」がえられたときは、そのえられた結果の原因は「その1因子」以外ありえないということです(その他の因子は全て同じだから)。現実問題として(倫理的な問題などから)実行不可能であることも少なくありませんが、ランダム化比較試験は強力で、したがって統計学は最強の学問と言ってよいのです。

 

しかしながら倫理的問題以外にも問題はあります。例えば、多数例の解析や長期間の追跡調査では欠損値は避けがたいとも言えます。臨床研究(特にランダム化比較試験)における欠損値の取り扱いについて解説した記事—欠損値解析計画から欠損したものは何? [Ref. 1]—があります。Intention-to-treatの原則により、一旦ランダム化された全ての対象は—プロトコールが遵守されたか否かにかかわらず—解析から除外してはいけません。つまり欠損値となった症例も解析に加えなくてはいけないし、除外すると検出力が低下し、(より重篤な問題として)結果にバイアスを生じることとなります。なぜ欠損値が出るのでしょうか?攻撃は最大の防御—欠損値を処理する最も良い方法は欠損値を出さないことでしょう。次のようなことも考えておかなくてはなりません。(1)どれくらいの頻度で欠損値が出たら、結果に影響を及ぼすのでしょうか?一般的に研究者は5%と20%の間を想定しています。(2)欠損値を処理(補完=imputation)するための統計手法としては、single imputationよりもmultiple imputationの方が好まれでいて、ロジスティック回帰が用いられたりします。ここで大事なのは欠損値が生じる機序であって、完全にランダムに生じるのか、比較的ランダムに生じるのか、それともランダムに生じるのではないのかです。ランダムでなく生じた欠損値にもmultiple imputationは適応可能ですが、その欠損値が生じる機序について十分に認識しておくことが重要です。(3)さらに、全ての状況がルーチンで処理できるわけではないので、様々な仮説を設定してsensitivity analysisをやってみるべきでしょうとこの記事は教えてくれています。

 

それではランダム化比較試験ができないときは、どうしたらいいのでしょうか。ランダム化を困難にする3つの壁—現実」の壁、「倫理」の壁、「感情」の壁—があります[注1] 。科学は観察と実験からなるのですから、実験ができないときは観察するしかありません。そのための手法が、重回帰分析やロジスティック回帰分析などの多変量解析ということになります。複数の原因と想定される因子の中である因子(説明変数)が独立して(いるから独立変数なのです)、従属変数(結果)と相関することを多変量解析は示してくれます。因果関係[注2] について「決定的」なことは言えないとしても、十分に共変量について考慮した多変量解析から得られた結論はエビデンスとしてして「十分に強力」とみなして良いのではないでしょうか。

 

ただ因果関係を追い求めるあまりに、大事なことを忘れていないでしょうか?強力なランダム化比較試験によって(もしくはランダム化比較試験のメタアナリシスによって)「絶対間違いない」結論が得られたとしても、医学的に意味不明なものが将来的に世紀の新発見となることは少ないでしょう(無いとは言えませんが----)。何を忘れているのでしょうか?それは多くの因子間にある(単純であってほしいけど)複雑な関係性結果に至るまでの機序ではないでしょうか。ゆっくり寝た後の休日の朝早く、多変量間の関係性を想像して、図に書いてみると「なんだそうだったんだ」とか「なんで気づかなかったのだろう」ということがあるかもしれません。こんなやり方は非効率で贅沢でしょうか?

 

注1:統計学が最強の学問である (西内啓、ダイヤモンド社

注2:因果関係とは、ある原因によってどのように結果が変わるか—ということ。すなわちある原因(説明変数、独立変数)によりある結果(アウトカム[成果指標]、従属変数)がもたらされることを因果関係という。

Ref. 1: Yeatts SD, Martin RH. What is missing from my missing data plan? Stroke2015;46:e130-132.