コンテンツにスキップ

カウント行列とは | BioLearn

カウント行列

count matrix

カウント行列は、遺伝子とサンプルまたは細胞ごとのリード数を並べた表です。

RNA-seqsingle-cell RNA-seqでは、配列データを遺伝子に対応づけ、遺伝子ごとのカウントとして集計します。行に遺伝子、列にサンプルや細胞を置いた表がカウント行列です。

カウントはそのまま「真の発現量」ではありません。ライブラリサイズ、測定効率、細胞の品質などの影響を受けるため、解析では品質確認や正規化を行ってから比較します。

カウント行列は、多くの発現解析の出発点です。どの単位が行で、どの単位が列かを理解すると、ヒートマップ、差次的発現解析、single-cell解析のFigureを読みやすくなります。

  • 発現量: カウントを処理して推定される量。カウントそのものとは区別します。
  • シーケンスデータ: カウント行列を作る前の配列データ。
  • 正規化: カウントの技術的な違いを調整する処理。

single-cell QCとは何か で、カウント行列を解析する前に確認する品質の考え方へ進みましょう。