コンテンツにスキップ
biolearnexact1wdqlrcx2vx37x2tx2pxwx34x30x33x38

GSEA plotの読み方

この記事で学ぶこと

  • GSEA plotが遺伝子セットの偏りを見る図であることを説明できる
  • ランキング、エンリッチメントスコア、FDRを確認できる
  • 個別遺伝子ではなく経路単位で読む考え方を理解する

GSEA plotは、あらかじめ定義した遺伝子セットが、ランキングの上位や下位に偏っているかを見るFigureです。1つの遺伝子ではなく、関連する遺伝子群がまとまって動くかを調べるときに使われます。

読むときは、遺伝子セット全体の偏りに注目します。どちら側に寄っているか、ピークがどこにあるか、統計指標がどの程度かを合わせて確認します。

GSEA plotでランキングに沿ったエンリッチメントスコアの曲線と遺伝子セットの偏りを読む概念図
GSEA plotは遺伝子セットの偏りを見る ランキングの向き、遺伝子セット名、NES、FDR、leading edgeを確認して経路単位で読みます。

このFigureでは、ランキングのどちら側に遺伝子セットが集まるか、エンリッチメントスコアがどこで最大になるか、leading edgeとFDRがどう示されているかを確認します。

  • ランキング: 遺伝子が統計量や発現変化の大きさで並べられています。
  • エンリッチメント曲線: 遺伝子セットがどちら側に偏るかを示します。
  • ヒット位置: 遺伝子セットに含まれる遺伝子がランキング上のどこにあるか。
  • leading edge: 偏りに強く寄与する遺伝子群です。
  • FDR: 多数の遺伝子セットを調べたときの統計的な注意点です。
  1. どの比較で遺伝子を順位づけたか確認します。
  2. 対象の遺伝子セット名と生物学的意味を確認します。
  3. 曲線が上位側・下位側のどちらに偏るか見ます。
  4. NES、FDR、p値などの統計表示を確認します。
  5. leading edgeや関連する個別遺伝子を、過度に断定せず確認します。

GSEA plotは差次的発現解析Pathway enrichmentとつながります。統計表示では多重検定補正を確認します。

  • 遺伝子セット名だけを見て、経路全体が確定的に活性化したと読む。
  • FDRや比較条件を確認しない。
  • leading edgeの遺伝子を、すべて同じ意味で重要だと読む。
  • GSEAの結果を、個別遺伝子の発現量そのものと混同する。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4