single-cell QCとは何か
この記事で学ぶこと
Section titled “この記事で学ぶこと”この記事で学ぶこと
- single-cell QCで確認する代表的な指標を説明できる
- 低品質細胞やdoubletが解析に影響する理由を理解する
- QCの閾値をMethodsで確認する重要性を説明できる
single-cell QCは、single-cell RNA-seqデータから低品質な細胞や解析を歪める可能性のある細胞を見つけ、扱いを決める工程です。
1細胞ごとの測定では、細胞ごとにRNA量や検出効率が大きく異なります。QCは、どの細胞を解析に残すかを決める前提になるため、後のクラスタリングや細胞タイプ注釈にも影響します。
なぜsingle-cell QCの視点が重要か
Section titled “なぜsingle-cell QCの視点が重要か”single-cell RNA-seqでは、壊れかけた細胞、RNA量が少なすぎる細胞、複数細胞が1つとして読まれたdoubletなどが混ざることがあります。これらをそのまま解析すると、人工的なクラスタや誤った細胞タイプ注釈につながることがあります。
一方で、QCで除外しすぎると、珍しい細胞や特定の状態の細胞を失うこともあります。そのため、QCは機械的な掃除ではなく、データの分布と生物学的文脈を見ながら判断する工程です。
どんなQC指標があるか
Section titled “どんなQC指標があるか”single-cell QCでは、細胞ごとの検出遺伝子数、UMI数、ミトコンドリア遺伝子の割合などを確認します。極端に遺伝子数が少ない細胞は低品質、極端にUMI数が多い細胞はダブレットの可能性があります。
ほかに、リボソーム遺伝子の割合、細胞周期スコア、サンプルごとの細胞数、doublet推定スコアなどを見ることがあります。QCのしきい値は、組織、細胞タイプ、実験系によって変わります。
single-cell QCはどう確認するか
Section titled “single-cell QCはどう確認するか”QC指標をバイオリンプロット、散布図、ヒストグラムなどで確認し、極端な細胞を見つけます。除外基準を決めるときは、全体の分布だけでなく、サンプルや条件ごとの偏りも確認します。
論文では、どの指標を使ったか、どの閾値で細胞を除外したか、除外後にサンプルや条件のバランスが崩れていないかを確認します。
single-cell QCの違いは何につながるか
Section titled “single-cell QCの違いは何につながるか”QC基準が変わると、残る細胞数、クラスタの数、細胞タイプ割合、差次的発現解析の結果が変わることがあります。特に条件間で細胞品質が違う場合、QC後のバランスを確認することが重要です。
doubletを見落とすと、2つの細胞タイプのマーカーが同時に見える人工的なクラスタが出ることがあります。逆に、珍しい細胞を低品質として除いてしまうこともあるため、基準の根拠を見ます。
論文や実験ではどう出てくるか
Section titled “論文や実験ではどう出てくるか”論文では、MethodsにQC基準が書かれ、SupplementaryにQC指標の分布が示されることがあります。Resultsでは、解析に残した細胞数として報告されることが多いです。
読むときは、除外基準、除外後の細胞数、ミトコンドリア割合、ダブレット除去、サンプルごとの差を確認します。
どんな点でつまずきやすいか
Section titled “どんな点でつまずきやすいか”似た用語との区別
Section titled “似た用語との区別”- 低品質細胞と珍しい細胞: 珍しい細胞タイプを低品質として除いてしまう可能性があります。
- QCと正規化: QCは不適切な細胞や特徴を確認する工程で、正規化は比較しやすくする工程です。
- しきい値と普遍的な正解: しきい値はデータの分布と実験背景に応じて決めます。
解釈の落とし穴
Section titled “解釈の落とし穴”- QCで除外した細胞は、すべて生物学的に意味がないと考えない。
- 閾値はどのデータでも同じでよいと思わない。
- doubletを確認せずに、珍しいクラスタを新しい細胞型だと読まない。
- QC後に条件間の細胞数バランスが変わった可能性を見落とさない。
| 日本語 | 英語 | 略語 | 説明 |
|---|---|---|---|
| single-cell QC | single-cell quality control | single-cell QC | single-cell RNA-seqで低品質細胞やdoubletなどを確認する工程。 |
| 品質管理 | quality control | QC | 解析結果に影響するデータ品質を確認する工程。 |
| しきい値 | threshold | - | データを残すか除くかなどを判断するために設定する境界値。 |
| カウント行列 | count matrix | - | 遺伝子ごとのカウントを細胞やサンプルごとに並べた表。 |
読み終えた内容を、1問ずつ選択式で確認します。
未回答