統計・研究デザイン
統計・研究デザインでは、Figure や Results に出てくる差、ばらつき、サンプル数、統計的な確からしさを読むための考え方を学びます。
このページの役割
Section titled “このページの役割”このページは、統計と研究デザインを概念として学び直すカテゴリトップです。Figureを読んでいる途中で確認点だけを短く見たい場合は、Figure早見表 を使います。
| いまの状態 | 使う入口 |
|---|---|
| p値、効果量、反復、交絡などを順に学び直したい | このページの記事一覧 |
| Methodsや実験手法とつなげて確認したい | 実験・統計を確認する |
| Figure上の統計表示だけ素早く確認したい | Figure早見表 |
| Figureの種類から読み方を探したい | 論文Figureの読み方 |
| Figure読解を順番に練習したい | Figureを読めるようになる |
| Discussionで主張の強さを見積もりたい | 論文読解演習 と 批判的に読む |
| 統計・研究デザイン用語だけ短く確認したい | 用語集の統計・研究デザインの用語 |
Figureで迷ったら
Section titled “Figureで迷ったら”エラーバーを読む
SD、SEM、信頼区間の違いを確認し、棒グラフや点推定の不確かさを読みます。
有意差p値だけで判断しない
p値、効果量、多重検定を分けて、Figure中の差の読みすぎを避けます。
実験設計n数と反復を確認する
点やバーが何を単位にしているのか、反復とサンプル数から確認します。
この分野で学ぶこと
Section titled “この分野で学ぶこと”- 変数、分布、平均、中央値の基本を説明できる
- 反復、n数、対照群、ランダム化、盲検化の見方を区別できる
- ばらつき、エラーバー、信頼区間を、推定の不確かさとして読める
- p値、効果量、多重検定の役割を区別できる
- Figureの軸、代表値、分布、推定の不確かさを分けて読める
- 相関と因果、有意性と重要性、バイアスを区別してDiscussionを読める
おすすめの読み順
Section titled “おすすめの読み順”初めて読む場合は、まずデータが何を表しているかを押さえ、次に比較の設計を確認し、その後でエラーバーやp値へ進むと読みやすくなります。
- 変数とは何か → 分布とは何か → 平均と中央値
- 生物学的反復と技術的反復 → n数とは何か → 対照群とは何か → ランダム化とは何か → 盲検化とは何か
- エラーバーとは何か → 標準偏差と標準誤差とは何か → 信頼区間とは何か
- p値とは何か → 効果量とは何か → 多重検定補正とは何か → 統計的有意性と生物学的重要性
- 相関と因果の違い → 交絡とは何か → バイアスとは何か → 再現性とは何か → 研究の限界の読み方
目的別に戻る
Section titled “目的別に戻る”| Figureで困ること | 確認する記事 | 関連するFigure記事 |
|---|---|---|
| 軸や単位、何を比較しているかが分からない | 変数とは何か、分布とは何か | 軸ラベルと単位、棒グラフ |
| 平均や中央値の違いを確認したい | 平均と中央値、分布とは何か | 箱ひげ図、Violin plot |
| エラーバーの意味が分からない | エラーバー、標準偏差と標準誤差、信頼区間 | 棒グラフ、qPCR plot |
| 有意差マークをどう読めばよいか迷う | p値、効果量、有意性と重要性 | Volcano plot、Figureと主張 |
| 多数の遺伝子を同時に見ている | 多重検定補正 | Volcano plot、GSEA plot |
| 点の関係が因果に見えてよいか迷う | 相関と因果、交絡 | 散布図、相関図 |
| 結論が強すぎるように見える | バイアス、盲検化、再現性、研究の限界 | Figureと主張、Resultsの流れ |
用語の意味だけを短く確認したい場合は、上の用語集への入口に戻ります。実際の見え方を練習したい場合は、対応するFigure記事へ進みます。
統計からFigureへ進む
Section titled “統計からFigureへ進む”統計の考え方は、単独で覚えるよりもFigureの読み方と結びつけると使いやすくなります。概念を確認したら、対応するFigure記事で実際の見え方を確認します。
| 統計・研究デザインの記事 | Figureで確認する場所 | 読むときの問い |
|---|---|---|
| 変数、軸ラベルと単位 | 棒グラフ、散布図 | 何を横軸・縦軸にして、何を比較しているか |
| 分布、平均と中央値 | 箱ひげ図、Violin plot | 代表値だけでなく、データの広がりや外れ値が見えているか |
| エラーバー、標準偏差と標準誤差、信頼区間 | 棒グラフ、Forest plot | ばらつきと推定値の不確かさがどのように表示されているか |
| p値、効果量 | Volcano plot、Figureと主張 | 有意差の有無と効果の大きさを分けて読めているか |
| 多重検定補正 | Volcano plot、GSEA plot | 多数の遺伝子や経路を同時に見ている前提を確認できているか |
| 相関と因果、交絡 | 散布図、相関図 | 点の関係を因果として読みすぎていないか |
| バイアス、再現性、研究の限界 | Figureと主張、Resultsセクションの流れ | Figureから言える範囲と、追加確認が必要な範囲を分けられるか |
データの種類と分布を読む
比較・反復の設計を読む
- 生物学的反復と技術的反復
未学習
統計・研究デザイン
論文Figureのn数を読むために、生物学的反復と技術的反復の違いを説明します。
- n数とは何か
未学習
統計・研究デザイン
n数を、Figureや統計解析で数えられている単位として説明し、細胞数・サンプル数・独立反復の違いを整理します。
- 対照群とは何か
未学習
統計・研究デザイン
研究デザインとしての対照群を、比較の基準、交絡、Figure読解の観点から説明します。
- ランダム化とは何か
未学習
統計・研究デザイン
ランダム化を、サンプルや処理の割り付けに偏りが入りにくくする研究デザインの考え方として説明します。
- 盲検化とは何か
未学習
統計・研究デザイン
盲検化を、測定者・評価者・解析者が条件を知らないようにしてバイアスを減らす研究デザインとして説明します。
ばらつきと不確かさを読む
- エラーバーとは何か
未学習
統計・研究デザイン
Figureのエラーバーがばらつきや推定の不確かさを示す表示であることを説明します。
- 標準偏差と標準誤差とは何か
未学習
統計・研究デザイン
標準偏差(SD)と標準誤差(SEM)を、データのばらつきと平均推定の不確かさとして区別します。
- 信頼区間とは何か
未学習
統計・研究デザイン
信頼区間を、推定値の不確かさを範囲として示す考え方として説明します。
差の大きさと確からしさを読む
- p値とは何か
未学習
統計・研究デザイン
p値を、帰無仮説のもとで観察された差がどれくらい珍しいかを考えるための指標として説明します。
- 効果量とは何か
未学習
統計・研究デザイン
効果量を、差や関係の大きさを表す指標として説明し、p値との違いを整理します。
- 多重検定補正とは何か
未学習
統計・研究デザイン
多数の検定を行うと偶然の有意が増えやすくなるため、補正が必要になることを説明します。
- 統計的有意性と生物学的重要性
未学習
統計・研究デザイン
統計的有意性と生物学的重要性を、p値で示される差の珍しさと、生物学的に意味のある大きさや文脈の違いとして説明します。
関係・偏り・限界を読む
- 相関と因果の違い
未学習
統計・研究デザイン
相関と因果の違いを、2つの変数が一緒に変化することと、一方がもう一方を引き起こすことの違いとして説明します。
- 交絡とは何か
未学習
統計・研究デザイン
交絡を、調べたい関係が第三の要因によって見かけ上変わって見えることとして説明します。
- バイアスとは何か
未学習
統計・研究デザイン
バイアスを、研究デザイン、サンプル選択、測定、解析、報告の過程で結果が一方向にずれる可能性として説明します。
- 再現性とは何か
未学習
統計・研究デザイン
再現性を、同じ問いに対して同じような結果が得られるかを確認する考え方として説明します。
- 研究の限界の読み方
未学習
統計・研究デザイン
研究の限界を、結論をどこまで一般化できるかを判断するための情報として説明します。
概念を一通り確認したら、実験・統計を確認する でMethodsや実験手法と合わせて復習できます。実際の図に進む場合は 論文Figureの読み方 を使い、順番に練習したい場合は Figureを読めるようになる を使います。
Discussionの主張を読む前には、相関と因果の違い、交絡とは何か、統計的有意性と生物学的重要性、研究の限界の読み方 を確認しておくと、結果から言える範囲を見積もりやすくなります。