コンテンツにスキップ

次元削減とは | BioLearn

次元削減

dimensionality reduction

次元削減は、多数の特徴を少数の軸にまとめ、全体像を見やすくする解析です。

発現解析では、1つの細胞やサンプルに対して多数の遺伝子の値があります。そのままでは全体像を見にくいため、PCA、UMAP、t-SNEなどで少数の軸に配置します。

次元削減は、複雑なデータを見やすくする道具です。一方で、配置された距離や形をそのまま生物学的距離として断定するものではありません。

次元削減を理解すると、PCA plotやUMAPの読み方が安定します。特にsingle-cell解析では、クラスタ、バッチ効果、連続的な細胞状態を確認する入口になります。

  • PCA: ばらつきの大きい方向を軸としてまとめる代表的な次元削減。
  • UMAP: 近いデータ点の関係を保ちながら配置する可視化手法。
  • クラスタリング: 似た点をグループに分ける解析。

UMAPとは何か で、single-cell Figureでよく見る2次元配置の読み方を確認しましょう。