## 仮定とは何か 生物統計の解説では、「〇〇の仮定を置く」「△△を仮定する」という表現が頻繁に登場します。ここでいう「仮定」とは、その条件が正しいかどうかを問うものではありません。むしろ、「実際の世界ではそんなシンプルな話は成り立たないかもしれないが、いったんそういうことが成り立つというシンプルで見通しの良い世界で現象をとらえてみよう」という考え方です。 ## なぜ仮定が必要なのか 現実の生物学的・医学的データは、非常に複雑な要因が絡み合っています。すべての要因を考慮したモデルを作ろうとすると、数学的に扱えなくなったり、データ数が不足したりします。 そこで、統計モデルでは「仮定」を置くことで、現実を単純化した世界を作り出します。この単純化された世界では、数学的な取り扱いが可能になり、データから意味のある情報を引き出せるようになります。 ## 仮定と現実のズレ 重要なのは、仮定と現実の世界がどのくらい違っているかです。ズレが大きい場合、推定された係数にバイアスが生じたり、p値や信頼区間が妥当でなくなったりする可能性があります。 ## 仮定の確認 多くの統計手法には、仮定が満たされているかを確認する方法が用意されています。 ・残差プロット:線形回帰で残差の分布や等分散性を確認 ・Q-Qプロット:データの正規性を確認 ・Log-log plot:Cox回帰で比例ハザード性を確認 仮定が満たされない場合は、より柔軟なモデルへの変更、データの変換、ロバストな手法の使用などを検討します。