NGSとは何か
この記事で学ぶこと
- NGSが大量の配列断片を並列に読む技術であることを説明できる
- リード、ライブラリ、マッピングの関係を理解する
- NGSがRNA-seqや変異解析の土台になる理由を説明できる
NGSは、多数のDNA断片を同時に読み、生命科学データ解析の出発点になる技術です。
NGSは next-generation sequencing の略で、従来よりも大量の配列を並列に読む技術を指します。試料からDNAやcDNA断片を調製し、シーケンサーで短い配列断片として読み取ります。
NGSで得られるリードは、参照ゲノムや転写産物にマッピングされます。その後、変異を探したり、遺伝子発現量を推定したり、クロマチン状態を調べたりします。
重要なのは、NGSは一つの実験名というより、多くの解析手法を支える測定技術だという点です。RNA-seq、ChIP-seq、ATAC-seq、全ゲノムシーケンシングなどは、目的と前処理、解析方法が異なります。
なぜNGSの視点が重要か
Section titled “なぜNGSの視点が重要か”論文Figureでは、NGS由来の結果がヒートマップ、Volcano plot、ゲノムブラウザ、UMAPなどとして示されます。NGSの大まかな流れを知っていると、Figureが何のデータから作られているのかを追いやすくなります。
NGSの視点は、配列を読む工程と、その後の解析を分けるために役立ちます。同じ「NGSデータ」でも、RNA-seq、変異解析、クロマチン解析、single-cell解析では、読み取っている分子もFigureの意味も異なります。
どんなNGSがあるか
Section titled “どんなNGSがあるか”NGSは、RNA-seq、全ゲノムシーケンシング、エクソーム解析、ChIP-seq、ATAC-seq、single-cell RNA-seqなどで使われます。大量の短いリードを読み、それをゲノムや転写産物に対応づけて解析します。
たとえばRNA-seqでは、各遺伝子に由来するリード数を数え、発現量の比較に使います。
NGSはどう調べるか
Section titled “NGSはどう調べるか”NGSでは、ライブラリ調製、シーケンシング、品質管理、マッピング、定量や検出という流れでデータが作られます。Methodsでは、サンプル、リード長、シーケンス深度、ライブラリ調製、解析パイプラインを確認します。
Figureを見るときは、リード数、サンプル数、細胞数、遺伝子数などの単位を混同しないことが重要です。大量のリードがあることと、独立サンプルが多いことは同じではありません。
NGS結果の変化は何につながるか
Section titled “NGS結果の変化は何につながるか”RNA-seqでは発現量の違い、ゲノム解析では変異やコピー数、ChIP-seqやATAC-seqではゲノム上のシグナルの違いとして現れます。NGSは、多くの分子や領域を同時に調べられるため、候補探索に向いています。
一方で、多数の項目を同時に調べるため、正規化、バッチ効果、品質管理、多重検定補正が解釈に関わります。Figureのきれいさだけでなく、解析条件をMethodsで確認します。
論文や実験ではどう出てくるか
Section titled “論文や実験ではどう出てくるか”Methodsでは、プラットフォーム、リード長、シーケンス深度、ライブラリ調製、解析パイプラインが書かれます。Resultsでは、リード数、マッピング率、発現量、変異、ピークなどの形で出てきます。
Figureでは、ヒートマップ、Volcano plot、ゲノムブラウザ、UMAPなど、解析後の可視化として示されることが多いです。
NGSのFigureでは、測定技術よりも「どの解析結果として見せているか」を先に確認します。
- RNA-seqでは、PCA、Volcano plot、ヒートマップ、Pathway enrichment plotがよく出ます。
- single-cell RNA-seqでは、UMAP / t-SNE、クラスタ、マーカー遺伝子、細胞割合を見ます。
- ゲノム解析では、ゲノムブラウザ図、Lollipop plot、CNV plotなどに変換されます。
- どのFigureでも、サンプル、ライブラリ調製、マッピング、正規化、品質管理がMethods側の確認点になります。
まずはシーケンスデータでデータの流れを押さえ、Figure別に読み方を分けます。
どんな点でつまずきやすいか
Section titled “どんな点でつまずきやすいか”似た用語との区別
Section titled “似た用語との区別”- NGSとRNA-seq: NGSは配列を読む技術の総称で、RNA-seqはその応用の一つです。
- シーケンシングと解析: シーケンシングは配列を読む工程で、発現量推定や変異検出はその後の解析です。
- リード数と生物学的意味: リードが多いことは手がかりですが、正規化や実験設計なしに結論は出せません。
解釈の落とし穴
Section titled “解釈の落とし穴”- NGSは特定の1種類の解析だけを指す言葉ではありません。
- NGSのFigureを読むには、測定目的と解析手順を合わせて確認する必要があります。
- リード数が多いことだけで、結果の解釈が自動的に正しくなるわけではありません。
| 日本語 | 英語 | 略語 | 説明 |
|---|---|---|---|
| NGS | next-generation sequencing | NGS | 大量の配列断片を並列に読む技術。 |
| ライブラリ調製 | library preparation | - | 試料をシーケンシング可能な形に整える工程。 |
| リード | read | - | シーケンサーから得られる配列断片。 |
| マッピング | mapping | - | リードを参照配列に対応づける解析。 |
| 多重検定補正 | multiple testing correction | - | 多数の遺伝子や変異を同時に調べる解析で、偶然の有意を増やしすぎないための考え方。 |
読み終えた内容を、1問ずつ選択式で確認します。
未回答