生物(医学)統計学がむずかしい理由

西内啓さんによると、統計学が最強の学問である理由は、「人間の制御しうる何物についても、その因果関係を分析できるから」です。この統計学の汎用性は、どのような因果関係も科学的に検証可能なランダム化比較試験によって支えられています。ランダム(無作為)とは、「意図的に手を加えることなく、偶然にまかせること」(広辞苑)であり、十分にランダム化してしまえば、「検定したい1因子」以外の因子はすべて群間で同じとなります。適切にランダム化された比較試験によって「ある結果」がえられたときは、「ある結果」の原因は「検定したい1因子」以外ありえないということになります(その他の因子は全て同じハズだから)。

 

因果関係の解析においてランダム化比較試験は強力で、それに支えられた統計学は最強の学問であることはまちがいありません。しかしながら現実問題として(倫理的な問題などから)ランダム化比較試験は実行不可能であることも少なくありません。ランダム化比較試験ができないときは、重回帰分析やロジスティック回帰などの多変量解析を用いて観察研究を行ないます。原因と想定される因子が他の因子の影響を考慮しても、結果と相関することを多変量解析は示してくれます。因果関係の「決定的」な判定はできませんが、共変量について十分に考慮した多変量解析から得られた結論は一定のエビデンスとみなしてよいと考えられています。

 

なぜ生物(医学)統計学難しいのか?生物や医学現象にどうしようもなく内在する複雑な関係性をもたらしている機序は、ルーチンの統計処理では対応できません。例えば、高血圧は血圧値を独立変数として重回帰分析でOKと思っていても、高血圧という変数は血圧値だけで決まるものではなく、食塩摂取量、不健康な食事、肥満、メタボ、慢性腎臓病などが関与して高血圧という診断になっているので、(血圧値だけではなく)高血圧というカテゴリー変数としてあつかうべきだと臨床家は考えます。

 

また、遺伝子をノックアウトして表現形が変われば、変化した表現形の原因は特定の遺伝子であると基礎生物学者は考えます。しかし、一つの遺伝子をノックアウトしたことで、複数の効果が発生し、その効果の方向性が異なるとき、「その結果」の原因は「一つの遺伝子」であっても「一つの機序」ではありません。生物現象は人間が(頭で考えるほどには)制御できるものではありません。

 

どうしたらいいのでしょうか?