コンテンツにスキップ

t-SNEとは | BioLearn

t-SNE

t-distributed stochastic neighbor embedding

t-SNE

t-SNEは、高次元データを2次元などに配置して、近い点のまとまりを見やすくする可視化手法です。

single-cell解析などで、細胞やサンプルのまとまりを表示するために使われます。UMAPと同じく、軸の向きやクラスタ間の距離を物理的な距離のように読みすぎないことが大切です。

多数の特徴を持つデータの全体像をつかむ入口になります。ただし、前処理やパラメータによって見え方が変わります。

  • UMAP: 高次元データを低次元に配置する可視化手法です。
  • 次元削減: 多数の特徴を少数の軸や座標にまとめる考え方です。

UMAP / t-SNEの読み方 で、点、クラスタ、距離の読みすぎに注意する練習をしましょう。