コンテンツにスキップ
biolearnexact5pxqyrx32x2vx37

NGSとは何か

この記事で学ぶこと

  • NGSが大量の配列断片を並列に読む技術であることを説明できる
  • リード、ライブラリ、マッピングの関係を理解する
  • NGSがRNA-seqや変異解析の土台になる理由を説明できる

NGSは、多数のDNA断片を同時に読み、生命科学データ解析の出発点になる技術です。

多数のDNA断片をシーケンサーで読み、リードとして解析する流れを示す概念図
NGSは大量の配列断片を並列に読む NGSで得られたリードは、マッピングやカウントなどの解析を経てFigureに変換されます。

NGSは next-generation sequencing の略で、従来よりも大量の配列を並列に読む技術を指します。試料からDNAやcDNA断片を調製し、シーケンサーで短い配列断片として読み取ります。

NGSで得られるリードは、参照ゲノムや転写産物にマッピングされます。その後、変異を探したり、遺伝子発現量を推定したり、クロマチン状態を調べたりします。

重要なのは、NGSは一つの実験名というより、多くの解析手法を支える測定技術だという点です。RNA-seq、ChIP-seq、ATAC-seq、全ゲノムシーケンシングなどは、目的と前処理、解析方法が異なります。

論文Figureでは、NGS由来の結果がヒートマップVolcano plot、ゲノムブラウザ、UMAPなどとして示されます。NGSの大まかな流れを知っていると、Figureが何のデータから作られているのかを追いやすくなります。

NGSの視点は、配列を読む工程と、その後の解析を分けるために役立ちます。同じ「NGSデータ」でも、RNA-seq、変異解析、クロマチン解析、single-cell解析では、読み取っている分子もFigureの意味も異なります。

NGSは、RNA-seq、全ゲノムシーケンシング、エクソーム解析、ChIP-seq、ATAC-seq、single-cell RNA-seqなどで使われます。大量の短いリードを読み、それをゲノムや転写産物に対応づけて解析します。

たとえばRNA-seqでは、各遺伝子に由来するリード数を数え、発現量の比較に使います。

NGSでは、ライブラリ調製、シーケンシング、品質管理、マッピング、定量や検出という流れでデータが作られます。Methodsでは、サンプル、リード長、シーケンス深度、ライブラリ調製、解析パイプラインを確認します。

Figureを見るときは、リード数、サンプル数、細胞数、遺伝子数などの単位を混同しないことが重要です。大量のリードがあることと、独立サンプルが多いことは同じではありません。

NGS結果の変化は何につながるか

Section titled “NGS結果の変化は何につながるか”

RNA-seqでは発現量の違い、ゲノム解析では変異やコピー数、ChIP-seqやATAC-seqではゲノム上のシグナルの違いとして現れます。NGSは、多くの分子や領域を同時に調べられるため、候補探索に向いています。

一方で、多数の項目を同時に調べるため、正規化、バッチ効果、品質管理、多重検定補正が解釈に関わります。Figureのきれいさだけでなく、解析条件をMethodsで確認します。

論文や実験ではどう出てくるか

Section titled “論文や実験ではどう出てくるか”

Methodsでは、プラットフォーム、リード長、シーケンス深度、ライブラリ調製、解析パイプラインが書かれます。Resultsでは、リード数、マッピング率、発現量、変異、ピークなどの形で出てきます。

Figureでは、ヒートマップ、Volcano plot、ゲノムブラウザ、UMAPなど、解析後の可視化として示されることが多いです。

NGSのFigureでは、測定技術よりも「どの解析結果として見せているか」を先に確認します。

  • RNA-seqでは、PCA、Volcano plot、ヒートマップ、Pathway enrichment plotがよく出ます。
  • single-cell RNA-seqでは、UMAP / t-SNE、クラスタ、マーカー遺伝子、細胞割合を見ます。
  • ゲノム解析では、ゲノムブラウザ図、Lollipop plot、CNV plotなどに変換されます。
  • どのFigureでも、サンプル、ライブラリ調製、マッピング、正規化、品質管理がMethods側の確認点になります。

まずはシーケンスデータでデータの流れを押さえ、Figure別に読み方を分けます。

  • NGSとRNA-seq: NGSは配列を読む技術の総称で、RNA-seqはその応用の一つです。
  • シーケンシングと解析: シーケンシングは配列を読む工程で、発現量推定や変異検出はその後の解析です。
  • リード数と生物学的意味: リードが多いことは手がかりですが、正規化や実験設計なしに結論は出せません。
  • NGSは特定の1種類の解析だけを指す言葉ではありません。
  • NGSのFigureを読むには、測定目的と解析手順を合わせて確認する必要があります。
  • リード数が多いことだけで、結果の解釈が自動的に正しくなるわけではありません。
日本語 英語 略語 説明
NGS next-generation sequencing NGS 大量の配列断片を並列に読む技術。
ライブラリ調製 library preparation - 試料をシーケンシング可能な形に整える工程。
リード read - シーケンサーから得られる配列断片。
マッピング mapping - リードを参照配列に対応づける解析。
多重検定補正 multiple testing correction - 多数の遺伝子や変異を同時に調べる解析で、偶然の有意を増やしすぎないための考え方。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4