コンテンツにスキップ
biolearnexact131h0bxos1xr9kx9obxnpwxo6ux9mvx9mex9lwx9o3

統計・研究デザイン

統計・研究デザインでは、Figure や Results に出てくる差、ばらつき、サンプル数、統計的な確からしさを読むための考え方を学びます。

このページは、統計と研究デザインを概念として学び直すカテゴリトップです。Figureを読んでいる途中で確認点だけを短く見たい場合は、Figure早見表 を使います。

いまの状態使う入口
p値、効果量、反復、交絡などを順に学び直したいこのページの記事一覧
Methodsや実験手法とつなげて確認したい実験・統計を確認する
Figure上の統計表示だけ素早く確認したいFigure早見表
Figureの種類から読み方を探したい論文Figureの読み方
Figure読解を順番に練習したいFigureを読めるようになる
Discussionで主張の強さを見積もりたい論文読解演習批判的に読む
統計・研究デザイン用語だけ短く確認したい用語集の統計・研究デザインの用語
  • 変数、分布、平均、中央値の基本を説明できる
  • 反復、n数、対照群、ランダム化、盲検化の見方を区別できる
  • ばらつき、エラーバー、信頼区間を、推定の不確かさとして読める
  • p値、効果量、多重検定の役割を区別できる
  • Figureの軸、代表値、分布、推定の不確かさを分けて読める
  • 相関と因果、有意性と重要性、バイアスを区別してDiscussionを読める

初めて読む場合は、まずデータが何を表しているかを押さえ、次に比較の設計を確認し、その後でエラーバーやp値へ進むと読みやすくなります。

  1. 変数とは何か分布とは何か平均と中央値
  2. 生物学的反復と技術的反復n数とは何か対照群とは何かランダム化とは何か盲検化とは何か
  3. エラーバーとは何か標準偏差と標準誤差とは何か信頼区間とは何か
  4. p値とは何か効果量とは何か多重検定補正とは何か統計的有意性と生物学的重要性
  5. 相関と因果の違い交絡とは何かバイアスとは何か再現性とは何か研究の限界の読み方
Figureで困ること確認する記事関連するFigure記事
軸や単位、何を比較しているかが分からない変数とは何か分布とは何か軸ラベルと単位棒グラフ
平均や中央値の違いを確認したい平均と中央値分布とは何か箱ひげ図Violin plot
エラーバーの意味が分からないエラーバー標準偏差と標準誤差信頼区間棒グラフqPCR plot
有意差マークをどう読めばよいか迷うp値効果量有意性と重要性Volcano plotFigureと主張
多数の遺伝子を同時に見ている多重検定補正Volcano plotGSEA plot
点の関係が因果に見えてよいか迷う相関と因果交絡散布図相関図
結論が強すぎるように見えるバイアス盲検化再現性研究の限界Figureと主張Resultsの流れ

用語の意味だけを短く確認したい場合は、上の用語集への入口に戻ります。実際の見え方を練習したい場合は、対応するFigure記事へ進みます。

統計の考え方は、単独で覚えるよりもFigureの読み方と結びつけると使いやすくなります。概念を確認したら、対応するFigure記事で実際の見え方を確認します。

統計・研究デザインの記事Figureで確認する場所読むときの問い
変数軸ラベルと単位棒グラフ散布図何を横軸・縦軸にして、何を比較しているか
分布平均と中央値箱ひげ図Violin plot代表値だけでなく、データの広がりや外れ値が見えているか
エラーバー標準偏差と標準誤差信頼区間棒グラフForest plotばらつきと推定値の不確かさがどのように表示されているか
p値効果量Volcano plotFigureと主張有意差の有無と効果の大きさを分けて読めているか
多重検定補正Volcano plotGSEA plot多数の遺伝子や経路を同時に見ている前提を確認できているか
相関と因果交絡散布図相関図点の関係を因果として読みすぎていないか
バイアス再現性研究の限界Figureと主張Resultsセクションの流れFigureから言える範囲と、追加確認が必要な範囲を分けられるか

データの種類と分布を読む

  1. 変数とは何か 未学習 統計・研究デザイン

    変数を、研究で観察・測定・比較する値やカテゴリとして説明し、Figure読解の入口につなげます。

  2. 分布とは何か 未学習 統計・研究デザイン

    分布を、データがどの値にどれくらい集まっているかを示す見方として説明します。

  3. 平均と中央値 未学習 統計・研究デザイン

    平均と中央値を、データの代表値として説明し、分布や外れ値との関係を整理します。

比較・反復の設計を読む

  1. 生物学的反復と技術的反復 未学習 統計・研究デザイン

    論文Figureのn数を読むために、生物学的反復と技術的反復の違いを説明します。

  2. n数とは何か 未学習 統計・研究デザイン

    n数を、Figureや統計解析で数えられている単位として説明し、細胞数・サンプル数・独立反復の違いを整理します。

  3. 対照群とは何か 未学習 統計・研究デザイン

    研究デザインとしての対照群を、比較の基準、交絡、Figure読解の観点から説明します。

  4. ランダム化とは何か 未学習 統計・研究デザイン

    ランダム化を、サンプルや処理の割り付けに偏りが入りにくくする研究デザインの考え方として説明します。

  5. 盲検化とは何か 未学習 統計・研究デザイン

    盲検化を、測定者・評価者・解析者が条件を知らないようにしてバイアスを減らす研究デザインとして説明します。

ばらつきと不確かさを読む

  1. エラーバーとは何か 未学習 統計・研究デザイン

    Figureのエラーバーがばらつきや推定の不確かさを示す表示であることを説明します。

  2. 標準偏差と標準誤差とは何か 未学習 統計・研究デザイン

    標準偏差(SD)と標準誤差(SEM)を、データのばらつきと平均推定の不確かさとして区別します。

  3. 信頼区間とは何か 未学習 統計・研究デザイン

    信頼区間を、推定値の不確かさを範囲として示す考え方として説明します。

差の大きさと確からしさを読む

  1. p値とは何か 未学習 統計・研究デザイン

    p値を、帰無仮説のもとで観察された差がどれくらい珍しいかを考えるための指標として説明します。

  2. 効果量とは何か 未学習 統計・研究デザイン

    効果量を、差や関係の大きさを表す指標として説明し、p値との違いを整理します。

  3. 多重検定補正とは何か 未学習 統計・研究デザイン

    多数の検定を行うと偶然の有意が増えやすくなるため、補正が必要になることを説明します。

  4. 統計的有意性と生物学的重要性 未学習 統計・研究デザイン

    統計的有意性と生物学的重要性を、p値で示される差の珍しさと、生物学的に意味のある大きさや文脈の違いとして説明します。

関係・偏り・限界を読む

  1. 相関と因果の違い 未学習 統計・研究デザイン

    相関と因果の違いを、2つの変数が一緒に変化することと、一方がもう一方を引き起こすことの違いとして説明します。

  2. 交絡とは何か 未学習 統計・研究デザイン

    交絡を、調べたい関係が第三の要因によって見かけ上変わって見えることとして説明します。

  3. バイアスとは何か 未学習 統計・研究デザイン

    バイアスを、研究デザイン、サンプル選択、測定、解析、報告の過程で結果が一方向にずれる可能性として説明します。

  4. 再現性とは何か 未学習 統計・研究デザイン

    再現性を、同じ問いに対して同じような結果が得られるかを確認する考え方として説明します。

  5. 研究の限界の読み方 未学習 統計・研究デザイン

    研究の限界を、結論をどこまで一般化できるかを判断するための情報として説明します。

概念を一通り確認したら、実験・統計を確認する でMethodsや実験手法と合わせて復習できます。実際の図に進む場合は 論文Figureの読み方 を使い、順番に練習したい場合は Figureを読めるようになる を使います。

Discussionの主張を読む前には、相関と因果の違い交絡とは何か統計的有意性と生物学的重要性研究の限界の読み方 を確認しておくと、結果から言える範囲を見積もりやすくなります。