コンテンツにスキップ
biolearnexact13vns6lxrfaxk1zxre5xr8jxlxwxp8yxwx19xwx36x32x2px19x37x2tx35xrfaxk1z

論文読解演習 - RNA-seq論文

この記事で学ぶこと

  • RNA-seq論文の主要Figureを読む順番を説明できる
  • Volcano plot、ヒートマップ、PCAをResultsと対応づけられる
  • Methodsで確認すべき解析条件を挙げられる

この演習では、BioLearn用の架空ケースを使い、RNA-seq論文で発現差のFigureをMethodsへ戻して読む練習をします。

RNA-seq論文でPCA、Volcano plot、ヒートマップ、pathway enrichmentを順に確認する概念図
RNA-seq論文は全体像から候補遺伝子、経路へ読む PCAでサンプルのまとまり、Volcano plotで候補、ヒートマップでパターン、enrichmentで経路を確認します。

ある研究では、細胞を条件Aと条件Bで培養し、RNA-seqで遺伝子発現の違いを調べたとします。論文の主張は「条件Bではストレス応答に関わる遺伝子群が変化する」です。

この主張を読むときは、まずFigure全体を見て、PCAVolcano plotヒートマップ、Pathway enrichment plotがどの順番で出てくるかを確認します。

  1. Abstractで、比較条件と主な結論を拾います。
  2. PCAで、サンプルが条件ごとにまとまるか、外れ値がないかを見ます。
  3. Volcano plotで、変化の大きい遺伝子と統計表示を確認します。
  4. ヒートマップで、候補遺伝子群のパターンが条件と対応するかを見ます。
  5. pathway enrichmentで、どの経路名が出ているか、FDRや遺伝子数を確認します。
  6. Methodsで、反復数、正規化、フィルタ、差次的発現解析、多重検定補正を確認します。
項目確認すること
サンプル条件ごとの独立サンプル数
品質管理低品質サンプルや低発現遺伝子の扱い
正規化発現量をどう比較可能にしたか
差次的発現使用した手法、閾値、比較の向き
多重検定補正FDRや調整済みp値を使っているか
経路解析使用した遺伝子セットやデータベース

RNA-seq論文では、遺伝子発現の差がきれいに見えても、その差が何を意味するかは実験設計と解析条件に依存します。

  • サンプル数が少ない場合、群の違いと個体差を切り分けにくくなります。
  • 同じ条件のサンプルが同じ測定日や同じ施設に偏っている場合、バッチ効果が結果に混ざる可能性があります。
  • Volcano plotでは、p値だけでなく効果量と多重検定補正後の基準を確認します。
  • ヒートマップでは、選ばれた遺伝子リストやクラスタリング条件によって見え方が変わります。
  • Pathway enrichmentでは、入力遺伝子リスト、背景集合、データベースの違いで結果が変わります。
  • 発現差だけでは、直接の機能変化や医療上の効果を示したことにはなりません。

読み終える前に、Discussionの主張を「このサンプル、この条件、この解析では何が言えるか」に戻します。強い結論ほど、対照、独立した検証、再現性の確認が必要です。

まず、論文の結論を読む前に、差が出やすい設計になっているかを確認します。

  • 条件ごとの独立サンプル数は十分か。
  • 測定日、培養ロット、ライブラリ調製バッチが条件と重なっていないか。
  • 正規化、低発現遺伝子のフィルタ、多重検定補正の方法が書かれているか。
  • 経路解析やGO解析で使った遺伝子リストと背景集合が説明されているか。

これらが不明な場合、発現差は観察できても、条件差としてどこまで一般化できるかは限定的に読む必要があります。

次に、主張の根拠がどの図にあるかを分けます。

  • PCAやクラスタリングで、条件ごとの全体傾向と外れ値を確認する。
  • Volcano plotで、横軸の効果量と縦軸の補正済みp値を分けて読む。
  • ヒートマップで、表示された遺伝子がどの基準で選ばれたかを見る。
  • Enrichment plotやGO結果では、FDR、遺伝子数、用語の広さを確認する。

Figureは「差があるらしい」ではなく、「どの量に、どの程度の差があるのか」を読む場所です。

RNA-seqの結果から言いやすいのは、「条件Bで特定の遺伝子群の発現パターンが変わった」という範囲です。

一方で、追加実験なしに「条件Bがその経路を直接活性化した」「その変化が表現型の原因である」とまでは言えません。Discussionでは、著者がFigureより強い言い方をしていないかを確認します。

  • 最も中心的な結論を支えるFigureはどれか。
  • そのFigureの軸、色、サンプル数、多重検定補正は確認できるか。
  • Discussionの経路名や発現差の表現を、どのサンプルと解析条件に限定して言い換えられるか。
  • Volcano plotで色がついた遺伝子だけを見れば十分だと思う。
  • PCAで群が分かれているだけで、原因が証明されたと考える。
  • 経路名だけで、機能が直接証明されたと読む。
  • Methodsの正規化や多重検定補正を確認せずに結論を受け取る。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

5 最高記録なし 復習なし

確認問題

確認問題

1/5