コンテンツにスキップ
biolearnexact1j7nc8ux39x31x2px34xwx1bxwx38x19x37x32x2t

UMAP / t-SNEの読み方

この記事で学ぶこと

  • UMAPやt-SNEで点とクラスタが何を表すか説明できる
  • 距離やクラスタを読みすぎない注意点を理解する
  • single-cell Figureで細胞タイプ注釈を確認できる

UMAPやt-SNEは、多数の特徴を持つ細胞やサンプルを2次元に配置し、クラスタや連続性を見るFigureです。単一細胞解析などで、細胞集団の全体像を示すためによく使われます。

読むときは、「似た細胞を近くに置く可視化」として扱います。軸の数値やクラスタ間の距離を、物理的な距離のように読みすぎないことが大切です。

UMAPやt-SNEで細胞が複数のクラスタとして配置され、色で細胞タイプを示す概念図
UMAP / t-SNEは細胞やサンプルのまとまりを見る 点の単位、色の意味、クラスタ注釈、サンプル由来を確認し、形を読みすぎないようにします。

このFigureでは、1つの点が細胞なのかサンプルなのか、色が細胞タイプや条件のどれに対応するかを確認します。クラスタのまとまり、連続的な変化、外れた点を見ますが、軸の数値やクラスタ間距離を読みすぎないようにします。

  • 点: 多くの場合、1つの細胞やサンプルを表します。
  • 色: 細胞タイプ、クラスタ、条件、遺伝子発現量などを示します。
  • クラスタ: 似た特徴を持つ点のまとまりです。
  • 凡例: 色とラベルの対応を確認します。
  • 解析条件: 前処理、特徴量、パラメータ、バッチ補正の影響を受けます。
  1. 点が何を表すかを確認します。
  2. 色がクラスタ、細胞タイプ、条件、発現量のどれかを確認します。
  3. どのクラスタがどの注釈に対応するかを見ます。
  4. 条件ごとの偏りや混ざり方を確認します。
  5. 距離や分離の意味を、解析条件とマーカー遺伝子に戻して判断します。

単一細胞解析では、single-cell RNA-seqとは何か細胞タイプ注釈が土台になります。可視化の性質はUMAPとは何か次元削減とは何かで確認します。

  • UMAP上で近いことを、必ず生物学的に近いと断定する。
  • クラスタの数や境界を、解析条件に依存しない固定事実として読む。
  • 色の違いだけで、細胞タイプや状態を確定する。
  • 軸の向きや距離を、物理的な座標のように読む。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4