コンテンツにスキップ

クラスタリングとは | BioLearn

クラスタリング

clustering

クラスタリングは、似た特徴を持つデータ点を探索的にまとめる解析です。

single-cell RNA-seqでは、発現パターンが似た細胞をクラスタとしてまとめることがあります。クラスタは、細胞型や細胞状態を考える入口になります。

ただし、クラスタ名は自動的に正解として出るものではありません。マーカー遺伝子、サンプル情報、既知の生物学的知識を合わせて解釈します。

クラスタリングは、UMAPやヒートマップの色分けとしてよく登場します。Figureを読むときは、クラスタ数、分け方、注釈の根拠を確認することで、見た目だけの解釈を避けやすくなります。

  • UMAP: クラスタを表示するためによく使われる可視化。
  • 細胞タイプ注釈: クラスタに細胞型名を付ける解釈の工程。
  • 次元削減: 高次元データを見やすく配置する解析。

マーカー遺伝子とは何か で、クラスタに意味づけをする根拠を学びましょう。