多重検定補正とは何か
この記事で学ぶこと
- 多重検定で偶然の有意が増えやすい理由を説明できる
- adjusted p-valueやFDRの役割を理解する
- RNA-seqやオミクスFigureで補正済みp値を見る理由を説明できる
多重検定補正は、多数の検定を同時に行うと偶然小さいp値が出やすくなる問題を調整する考え方です。
RNA-seqやGWASのように多数の遺伝子やバリアントを調べる解析では、候補の中に偶然の有意が混ざりやすくなります。補正済みp値やFDRを見ると、候補をより慎重に選べます。
なぜ多重検定補正の視点が重要か
Section titled “なぜ多重検定補正の視点が重要か”RNA-seqやGWASのような解析では、1つの比較ではなく、何千から何百万もの候補を同時に見ます。この状況では、偶然に小さいp値が混ざる前提で結果を読む必要があります。
1つだけ検定する場合と、1万個の遺伝子を同時に検定する場合では、偶然に小さなp値が出る機会が大きく違います。補正済みp値やFDRを見ることで、候補をより慎重に選びます。
どんな多重検定補正があるか
Section titled “どんな多重検定補正があるか”生命科学では、FDR(false discovery rate)を制御する方法がよく使われます。Benjamini-Hochberg法による補正済みp値やq値として表示されることがあります。
より厳しい補正としてBonferroni補正が使われることもあります。どの方法が適切かは、検定数、解析目的、探索的研究か検証的研究かによって変わります。
多重検定補正はどう確認するか
Section titled “多重検定補正はどう確認するか”ResultsやFigure legendでは、「adjusted p-value」「padj」「FDR」「q-value」などの表記を探します。Volcano plotや遺伝子リストでは、補正前のp値なのか補正後の値なのかを確認します。
Methodsでは、どの検定を何回行い、どの補正方法を使ったかを確認します。解析ソフトやパッケージの出力列名にも注意します。
補正の有無は何につながるか
Section titled “補正の有無は何につながるか”補正をしないまま多数の候補を選ぶと、偶然の有意を重要な結果として読みすぎる可能性があります。一方で、補正を厳しくすると、真の変化を見逃す可能性もあります。
そのため、多重検定補正は候補を機械的に正しい・間違いに分けるためだけのものではありません。効果量、データ品質、再現性、生物学的な文脈と合わせて読みます。
論文や実験ではどう出てくるか
Section titled “論文や実験ではどう出てくるか”多重検定補正は、RNA-seq、GWAS、プロテオミクス、GSEA、単一細胞解析などでよく出てきます。Volcano plot、ヒートマップ、遺伝子リスト、Supplementary tableに補正済みp値が示されることがあります。
読むときは、候補の選択基準がp値なのかFDRなのか、fold changeなどの効果量も条件に入っているかを確認します。Volcano plotの読み方では、差の大きさと補正済みp値を同時に読む練習ができます。
どんな点でつまずきやすいか
Section titled “どんな点でつまずきやすいか”似た用語との区別
Section titled “似た用語との区別”- p値と補正済みp値: 補正済みp値は、多数の検定を行った前提を反映した値です。
- FDRと偽陽性率: FDRは選んだ候補の中にどれくらい誤った発見が含まれ得るかを考える指標です。
- 多重検定補正と正規化: 補正は統計的判定の調整で、正規化はデータの測定条件やスケールをそろえる処理です。
解釈の落とし穴
Section titled “解釈の落とし穴”- 補正前p値だけで大量の候補を重要と判断しないようにします。
- FDRを満たした候補でも、生物学的に意味があるかは別に確認します。
- 補正方法やしきい値がMethodsに書かれていない場合は、結果の読み方を慎重にします。
| 日本語 | 英語 | 略語 | 説明 |
|---|---|---|---|
| 多重検定補正 | multiple testing correction | - | 多数の検定で偶然の有意が増えすぎないように調整する考え方。 |
| p値 | p-value | p | 帰無仮説のもとで観察結果の珍しさを考える指標。 |
| FDR | false discovery rate | FDR | 選んだ候補の中に誤った発見がどの程度含まれ得るかを考える指標。 |
| 効果量 | effect size | - | 差や関係の大きさを表す指標。 |
読み終えた内容を、1問ずつ選択式で確認します。
未回答