オミクス解析を読む
このパスでは、ゲノムや発現データを使った論文を読むために、ゲノミクス、バイオインフォマティクス、オミクスFigureをつなげて学びます。
配列ファイルや解析手順を暗記するのではなく、「何を測ったデータか」「どの処理を経てFigureになったか」「結果からどこまで言えるか」を確認できる状態を目指します。
このパスで身につけること
Section titled “このパスで身につけること”- ゲノム上の位置、遺伝子注釈、変異をデータとして読む
- FASTQ、マッピング、SAM/BAM、VCFを解析の流れの中で位置づける
- RNA-seq、カウント行列、正規化、差次的発現解析の関係を説明する
- single-cell解析で、QC、バッチ効果、次元削減、クラスタ、細胞タイプ注釈を確認する
- Volcano plot、ヒートマップ、PCA、UMAP、GSEA、ゲノムブラウザ図を解析条件に戻して読む
| 順番 | まとまり | まず読む記事 |
|---|---|---|
| 1 | ゲノム上の地図を作る | リファレンスゲノム → ゲノムアノテーション → ゲノム座標 → ゲノムブラウザ |
| 2 | 変異を分類して読む | 遺伝的変異 → 変異 → SNP/SNV → indel → コピー数変化 → 構造変異 |
| 3 | 変異の文脈を見る | 体細胞変異と生殖細胞系列変異 → 変異アノテーション → GWAS → 多遺伝子リスクスコア |
| 4 | 配列データの流れを押さえる | バイオインフォマティクス → シーケンスデータ → メタデータ → FASTQ → マッピング |
| 5 | 解析ファイルを位置づける | SAM/BAM → VCF |
| 6 | RNA-seqを読む | RNA-seq → カウント行列 → 正規化 → 差次的発現解析 |
| 7 | 経路・遺伝子セットを見る | Pathway enrichment → GSEA |
| 8 | single-cell解析を読む | single-cell RNA-seq → single-cell QC → バッチ効果 → 次元削減 |
| 9 | クラスタと細胞タイプを見る | クラスタリング → UMAP → マーカー遺伝子 → 細胞タイプ注釈 |
| 10 | がん・疾患ゲノムを読む | 希少疾患ゲノミクス → がんゲノミクス → 腫瘍正常比較 |
| 11 | エピゲノムと多層データ | エピゲノム → メチローム → ChIP-seq → ATAC-seq → 三次元ゲノム |
| 12 | オミクスの広がり | トランスクリプトミクス → プロテオミクス → メタボロミクス → マルチオミクス |
| 13 | Figureで読む | ゲノムブラウザ図 → Volcano plot → ヒートマップ → PCA plot → UMAP / t-SNE |
| 14 | 論文で練習する | RNA-seq論文の読み方 → single-cell論文の読み方 → がんゲノミクス論文の読み方 |
目的別に戻る
Section titled “目的別に戻る”| つまずいていること | 戻る場所 | 次に進む場所 |
|---|---|---|
| ゲノム上の位置やトラックが読みにくい | ゲノム座標、ゲノムブラウザ | ゲノムブラウザ図 |
| 変異の種類が混ざる | SNP/SNV、indel、コピー数変化 | Lollipop plot、CNV plot |
| FASTQ、BAM、VCFの関係が分からない | シーケンスデータ、FASTQ、SAM/BAM、VCF | 解析ワークフロー、解析ノートブック |
| RNA-seqのFigureを読みたい | RNA-seq、差次的発現解析 | Volcano plot、ヒートマップ |
| single-cellのUMAPを読みたい | single-cell RNA-seq、バッチ効果、細胞タイプ注釈 | UMAP / t-SNE、Violin plot |
| 統計表示や多重検定が不安 | 多重検定補正、効果量 | 実験・統計を確認する、GSEA plot |
| 論文の主張と解析条件を結びつけたい | Figureと主張、Resultsの読み方 | 論文を読めるようになる、批判的に読む |
どこまで読めば次へ進めるか
Section titled “どこまで読めば次へ進めるか”次の問いに答えられるようになったら、オミクス系のFigureや論文ウォークスルーへ進めます。
- そのFigureが、配列、発現量、変異、細胞タイプのどれを示しているか説明できる
- 解析前のデータ、解析後の表、可視化されたFigureを分けて考えられる
- Volcano plot、ヒートマップ、UMAPの見た目を、解析条件や統計表示に戻して確認できる
- オミクス解析の結果から言える範囲と、追加実験で確かめる必要がある範囲を分けられる
- リファレンスゲノムとは何か
未学習
ゲノミクス
配列解析やゲノム表示で基準として使うリファレンスゲノムの役割と注意点を説明します。
- ゲノムアノテーションとは何か
未学習
ゲノミクス
ゲノム上の配列に遺伝子や調節領域などの意味づけを加えるゲノムアノテーションを説明します。
- ゲノム座標とは何か
未学習
ゲノミクス
染色体名と位置でゲノム上の場所を表すゲノム座標の読み方を説明します。
- 遺伝的変異とは何か
未学習
ゲノミクス
ゲノム配列の違いと、その解釈で注意すべき点を説明します。
- バリアントとは何か
未学習
ゲノミクス
ゲノム解析で出てくるvariant(バリアント)の意味、種類、解釈上の注意を説明します。
- SNPとSNVの違い
未学習
ゲノミクス
SNPとSNVを、集団内の多型と参照配列との1塩基差という視点から整理します。
- indelとは何か
未学習
ゲノミクス
短い挿入や欠失として見つかるindelの基本、調べ方、解釈上の注意を説明します。
- コピー数変異とは何か
未学習
ゲノミクス
ゲノム領域のコピー数が増減するコピー数変異(CNV)の基本と読み方を説明します。
- 構造多型とは何か
未学習
ゲノミクス
欠失、重複、逆位、転座などの構造多型(SV)の基本と解釈上の注意を説明します。
- 体細胞変異と生殖細胞系列変異
未学習
ゲノミクス
変異がどの細胞系列にあるかという視点から、体細胞変異と生殖細胞系列変異を区別して説明します。
- バリアントアノテーションとは何か
未学習
ゲノミクス
検出されたバリアントに遺伝子、位置、予測影響などの情報を付けるバリアントアノテーションを説明します。
- ゲノムブラウザとは何か
未学習
ゲノミクス
ゲノム上の位置に沿って、遺伝子、変異、シーケンスリード、アノテーションを重ねて見るゲノムブラウザの基本を説明します。
- バイオインフォマティクスとは何か
未学習
バイオインフォマティクス
バイオインフォマティクスを、生命科学データを計算で整理・解析・解釈する分野として説明します。
- シーケンスデータとは何か
未学習
バイオインフォマティクス
DNAやRNAの配列を読んで得られるデータの基本を説明します。
- メタデータとは何か
未学習
バイオインフォマティクス
バイオインフォマティクスでサンプル情報や実験条件を読み解くためのメタデータを説明します。
- FASTQとは何か
未学習
バイオインフォマティクス
FASTQファイルに含まれるリード配列と品質スコアの基本を説明します。
- マッピングとは何か
未学習
バイオインフォマティクス
シーケンスリードをリファレンス配列上の位置へ対応づけるマッピングを説明します。
- SAM/BAMとは何か
未学習
バイオインフォマティクス
マッピング後のリード情報を保存するSAM/BAM形式の基本を説明します。
- VCFとは何か
未学習
バイオインフォマティクス
バリアント候補を記録するVCF形式の基本と読み方の注意点を説明します。
- RNA-seqとは何か
未学習
バイオインフォマティクス
RNA-seqを遺伝子発現を調べるシーケンス手法として説明します。
- カウント行列とは何か
未学習
バイオインフォマティクス
RNA-seqやsingle-cell RNA-seqで使うカウント行列を、細胞またはサンプルと遺伝子の表として説明します。
- 正規化とは何か
未学習
バイオインフォマティクス
RNA-seqやsingle-cell解析で、サンプル間の測定量を比較しやすく整える正規化を説明します。
- 差次的発現解析とは何か
未学習
バイオインフォマティクス
条件間で遺伝子発現が変わるかを調べる解析の基本を説明します。
- Pathway enrichmentとは何か
未学習
バイオインフォマティクス
変化した遺伝子リストから、経路や機能カテゴリの偏りを読むpathway enrichment解析を説明します。
- GSEAとは何か
未学習
バイオインフォマティクス
遺伝子全体のランキングから遺伝子セットの偏りを見るGSEAを説明します。
- single-cell RNA-seqとは何か
未学習
バイオインフォマティクス
single-cell RNA-seqを、1細胞ごとの遺伝子発現を読み、細胞集団の違いを調べる解析として説明します。
- single-cell QCとは何か
未学習
バイオインフォマティクス
single-cell RNA-seqの品質管理を、低品質細胞、検出遺伝子数、ミトコンドリア比率、doublet確認の観点から説明します。
- バッチ効果とは何か
未学習
バイオインフォマティクス
バッチ効果を、実験日、試薬、測定機器などの違いによって生じる技術的な差として説明し、single-cell解析での注意点につなげます。
- 次元削減とは何か
未学習
バイオインフォマティクス
次元削減を、多数の遺伝子や特徴量を少ない軸に圧縮して全体像を見やすくする方法として説明します。
- クラスタリングとは何か
未学習
バイオインフォマティクス
single-cell解析などで使われるクラスタリングを、似たデータ点をまとめる探索的な解析として説明します。
- マーカー遺伝子とは何か
未学習
バイオインフォマティクス
マーカー遺伝子を、特定の細胞型や状態を見分ける手がかりになる遺伝子として説明します。
- 細胞タイプ注釈とは何か
未学習
バイオインフォマティクス
single-cell解析でクラスタに細胞型名を付ける細胞タイプ注釈を、マーカー遺伝子と根拠確認の観点から説明します。
- UMAPとは何か
未学習
バイオインフォマティクス
UMAPを、高次元データを2次元などに配置してsingle-cell解析の全体像を見る可視化手法として説明します。
- 解析ワークフローとは何か
未学習
バイオインフォマティクス
生データから図や表に至る解析手順として、解析ワークフローの役割と確認点を説明します。
- 解析ノートブックとは何か
未学習
バイオインフォマティクス
コード、説明、図表をまとめて記録する解析ノートブックの役割と読み方を説明します。
- 論文データの再解析とは何か
未学習
バイオインフォマティクス
公開データや論文付属データを使い、解析条件を確認しながら結果を再検討する再解析を説明します。
- トランスクリプトミクスとは何か
未学習
ゲノミクス
RNAの種類や量を網羅的に調べるトランスクリプトミクスの基本を説明します。
- プロテオミクスとは何か
未学習
ゲノミクス
タンパク質の種類、量、修飾を網羅的に調べるプロテオミクスの基本を説明します。
- メタボロミクスとは何か
未学習
ゲノミクス
代謝物の種類や量を網羅的に調べるメタボロミクスの基本を説明します。
- マルチオミクスとは何か
未学習
ゲノミクス
複数のオミクス層を組み合わせて細胞や組織の状態を読むマルチオミクスの基本を説明します。
- GWASとは何か
未学習
ゲノミクス
ゲノム全体の多型と形質の統計的な関連を調べるGWASの基本を説明します。
- ポリジェニックリスクスコアとは何か
未学習
ゲノミクス
多数のバリアントの効果推定を足し合わせるポリジェニックリスクスコアの基本と限界を説明します。
- 希少疾患ゲノミクスとは何か
未学習
ゲノミクス
希少疾患研究でゲノム情報を用いて原因候補や機構を調べる考え方を説明します。
- がんゲノミクスとは何か
未学習
ゲノミクス
がん研究でゲノム変化やそのパターンを調べるがんゲノミクスの基本を説明します。
- Tumor-normal比較とは何か
未学習
ゲノミクス
腫瘍由来サンプルと対照サンプルを比べて体細胞変異候補を調べるTumor-normal比較を説明します。
- エピゲノムとは何か
未学習
ゲノミクス
ゲノム全体にわたるDNAメチル化、ヒストン修飾、クロマチン状態を読むエピゲノムの基本を説明します。
- メチロームとは何か
未学習
ゲノミクス
ゲノム全体にわたるDNAメチル化パターンとしてのメチロームを説明します。
- ChIP-seqとは何か
未学習
ゲノミクス
特定のタンパク質やヒストン修飾が多く検出されるゲノム領域を調べるChIP-seqを説明します。
- ATAC-seqとは何か
未学習
ゲノミクス
開いたクロマチン領域をゲノム全体で調べるATAC-seqの基本を説明します。
- 3Dゲノムとは何か
未学習
ゲノミクス
核内でゲノムがどのように折りたたまれ近接するかを読む3Dゲノムの基本を説明します。
- ゲノムブラウザ図の読み方
未学習
論文Figureの読み方
論文Figureに出てくるゲノムブラウザ図で、座標、トラック、遺伝子モデル、変異、リードの見方を説明します。
- Volcano plotの読み方
未学習
論文Figureの読み方
RNA-seqなどの差次的発現解析で使われるVolcano plotの軸、点、しきい値、解釈の注意点を説明します。
- ヒートマップの読み方
未学習
論文Figureの読み方
遺伝子発現解析などで使われるヒートマップの色、行、列、クラスタリング、スケールの読み方を説明します。
- PCA plotの読み方
未学習
論文Figureの読み方
PCA plotでサンプル間の全体的な違い、クラスタ、外れ値を読む基本を説明します。
- UMAP / t-SNEの読み方
未学習
論文Figureの読み方
UMAPやt-SNEで点、クラスタ、距離、細胞タイプ注釈を読む基本を説明します。
- GSEA plotの読み方
未学習
論文Figureの読み方
GSEA plotでランキング、エンリッチメントスコア、leading edgeを読む基本を説明します。
- Pathway enrichment plotの読み方
未学習
論文Figureの読み方
経路や遺伝子セットのenrichment結果を示すFigureで、経路名、スコア、FDR、遺伝子数を読む基本を説明します。
- CNV plotの読み方
未学習
論文Figureの読み方
コピー数変異を示すCNV plotで、ゲノム位置、増幅、欠失、セグメント、サンプル比較を読む方法を説明します。
- Lollipop plotの読み方
未学習
論文Figureの読み方
タンパク質やゲノム上の位置に沿って変異を示すLollipop plotで、位置、頻度、ドメイン、解釈の注意点を読む方法を説明します。
- 論文読解演習 - RNA-seq論文
未学習
論文読解演習
架空のRNA-seq論文を題材に、Abstract、Figure、Methods、Resultsを行き来して読む練習をします。
- 論文読解演習 - single-cell解析論文
未学習
論文読解演習
架空のsingle-cell解析論文を題材に、UMAP、クラスタ、マーカー遺伝子、差次的発現、Methodsを行き来して読む練習をします。
- 論文読解演習 - がんゲノム論文
未学習
論文読解演習
架空のがんゲノム論文を題材に、Tumor-normal比較、変異、コピー数変異、Methods確認をつなげて読む練習をします。
オミクス解析の流れが見えてきたら、Figureを読めるようになる で図の読み方を横断的に練習します。論文全体の構造へ進む場合は、論文を読めるようになる を使います。統計や実験設計の確認点で止まった場合は、実験・統計を確認する に戻ります。