コンテンツにスキップ
biolearnexact1grpz2lx9m2x9njx9m7x9mhxr8jxkgg

オミクス解析を読む

このパスでは、ゲノムや発現データを使った論文を読むために、ゲノミクス、バイオインフォマティクス、オミクスFigureをつなげて学びます。

配列ファイルや解析手順を暗記するのではなく、「何を測ったデータか」「どの処理を経てFigureになったか」「結果からどこまで言えるか」を確認できる状態を目指します。

  • ゲノム上の位置、遺伝子注釈、変異をデータとして読む
  • FASTQ、マッピング、SAM/BAM、VCFを解析の流れの中で位置づける
  • RNA-seq、カウント行列、正規化、差次的発現解析の関係を説明する
  • single-cell解析で、QC、バッチ効果、次元削減、クラスタ、細胞タイプ注釈を確認する
  • Volcano plot、ヒートマップ、PCA、UMAP、GSEA、ゲノムブラウザ図を解析条件に戻して読む
順番まとまりまず読む記事
1ゲノム上の地図を作るリファレンスゲノムゲノムアノテーションゲノム座標ゲノムブラウザ
2変異を分類して読む遺伝的変異変異SNP/SNVindelコピー数変化構造変異
3変異の文脈を見る体細胞変異と生殖細胞系列変異変異アノテーションGWAS多遺伝子リスクスコア
4配列データの流れを押さえるバイオインフォマティクスシーケンスデータメタデータFASTQマッピング
5解析ファイルを位置づけるSAM/BAMVCF
6RNA-seqを読むRNA-seqカウント行列正規化差次的発現解析
7経路・遺伝子セットを見るPathway enrichmentGSEA
8single-cell解析を読むsingle-cell RNA-seqsingle-cell QCバッチ効果次元削減
9クラスタと細胞タイプを見るクラスタリングUMAPマーカー遺伝子細胞タイプ注釈
10がん・疾患ゲノムを読む希少疾患ゲノミクスがんゲノミクス腫瘍正常比較
11エピゲノムと多層データエピゲノムメチロームChIP-seqATAC-seq三次元ゲノム
12オミクスの広がりトランスクリプトミクスプロテオミクスメタボロミクスマルチオミクス
13Figureで読むゲノムブラウザ図Volcano plotヒートマップPCA plotUMAP / t-SNE
14論文で練習するRNA-seq論文の読み方single-cell論文の読み方がんゲノミクス論文の読み方
つまずいていること戻る場所次に進む場所
ゲノム上の位置やトラックが読みにくいゲノム座標ゲノムブラウザゲノムブラウザ図
変異の種類が混ざるSNP/SNVindelコピー数変化Lollipop plotCNV plot
FASTQ、BAM、VCFの関係が分からないシーケンスデータFASTQSAM/BAMVCF解析ワークフロー解析ノートブック
RNA-seqのFigureを読みたいRNA-seq差次的発現解析Volcano plotヒートマップ
single-cellのUMAPを読みたいsingle-cell RNA-seqバッチ効果細胞タイプ注釈UMAP / t-SNEViolin plot
統計表示や多重検定が不安多重検定補正効果量実験・統計を確認するGSEA plot
論文の主張と解析条件を結びつけたいFigureと主張Resultsの読み方論文を読めるようになる批判的に読む

次の問いに答えられるようになったら、オミクス系のFigureや論文ウォークスルーへ進めます。

  • そのFigureが、配列、発現量、変異、細胞タイプのどれを示しているか説明できる
  • 解析前のデータ、解析後の表、可視化されたFigureを分けて考えられる
  • Volcano plot、ヒートマップ、UMAPの見た目を、解析条件や統計表示に戻して確認できる
  • オミクス解析の結果から言える範囲と、追加実験で確かめる必要がある範囲を分けられる
  1. リファレンスゲノムとは何か 未学習 ゲノミクス

    配列解析やゲノム表示で基準として使うリファレンスゲノムの役割と注意点を説明します。

  2. ゲノムアノテーションとは何か 未学習 ゲノミクス

    ゲノム上の配列に遺伝子や調節領域などの意味づけを加えるゲノムアノテーションを説明します。

  3. ゲノム座標とは何か 未学習 ゲノミクス

    染色体名と位置でゲノム上の場所を表すゲノム座標の読み方を説明します。

  4. 遺伝的変異とは何か 未学習 ゲノミクス

    ゲノム配列の違いと、その解釈で注意すべき点を説明します。

  5. バリアントとは何か 未学習 ゲノミクス

    ゲノム解析で出てくるvariant(バリアント)の意味、種類、解釈上の注意を説明します。

  6. SNPとSNVの違い 未学習 ゲノミクス

    SNPとSNVを、集団内の多型と参照配列との1塩基差という視点から整理します。

  7. indelとは何か 未学習 ゲノミクス

    短い挿入や欠失として見つかるindelの基本、調べ方、解釈上の注意を説明します。

  8. コピー数変異とは何か 未学習 ゲノミクス

    ゲノム領域のコピー数が増減するコピー数変異(CNV)の基本と読み方を説明します。

  9. 構造多型とは何か 未学習 ゲノミクス

    欠失、重複、逆位、転座などの構造多型(SV)の基本と解釈上の注意を説明します。

  10. 体細胞変異と生殖細胞系列変異 未学習 ゲノミクス

    変異がどの細胞系列にあるかという視点から、体細胞変異と生殖細胞系列変異を区別して説明します。

  11. バリアントアノテーションとは何か 未学習 ゲノミクス

    検出されたバリアントに遺伝子、位置、予測影響などの情報を付けるバリアントアノテーションを説明します。

  12. ゲノムブラウザとは何か 未学習 ゲノミクス

    ゲノム上の位置に沿って、遺伝子、変異、シーケンスリード、アノテーションを重ねて見るゲノムブラウザの基本を説明します。

  13. バイオインフォマティクスとは何か 未学習 バイオインフォマティクス

    バイオインフォマティクスを、生命科学データを計算で整理・解析・解釈する分野として説明します。

  14. シーケンスデータとは何か 未学習 バイオインフォマティクス

    DNAやRNAの配列を読んで得られるデータの基本を説明します。

  15. メタデータとは何か 未学習 バイオインフォマティクス

    バイオインフォマティクスでサンプル情報や実験条件を読み解くためのメタデータを説明します。

  16. FASTQとは何か 未学習 バイオインフォマティクス

    FASTQファイルに含まれるリード配列と品質スコアの基本を説明します。

  17. マッピングとは何か 未学習 バイオインフォマティクス

    シーケンスリードをリファレンス配列上の位置へ対応づけるマッピングを説明します。

  18. SAM/BAMとは何か 未学習 バイオインフォマティクス

    マッピング後のリード情報を保存するSAM/BAM形式の基本を説明します。

  19. VCFとは何か 未学習 バイオインフォマティクス

    バリアント候補を記録するVCF形式の基本と読み方の注意点を説明します。

  20. RNA-seqとは何か 未学習 バイオインフォマティクス

    RNA-seqを遺伝子発現を調べるシーケンス手法として説明します。

  21. カウント行列とは何か 未学習 バイオインフォマティクス

    RNA-seqやsingle-cell RNA-seqで使うカウント行列を、細胞またはサンプルと遺伝子の表として説明します。

  22. 正規化とは何か 未学習 バイオインフォマティクス

    RNA-seqやsingle-cell解析で、サンプル間の測定量を比較しやすく整える正規化を説明します。

  23. 差次的発現解析とは何か 未学習 バイオインフォマティクス

    条件間で遺伝子発現が変わるかを調べる解析の基本を説明します。

  24. Pathway enrichmentとは何か 未学習 バイオインフォマティクス

    変化した遺伝子リストから、経路や機能カテゴリの偏りを読むpathway enrichment解析を説明します。

  25. GSEAとは何か 未学習 バイオインフォマティクス

    遺伝子全体のランキングから遺伝子セットの偏りを見るGSEAを説明します。

  26. single-cell RNA-seqとは何か 未学習 バイオインフォマティクス

    single-cell RNA-seqを、1細胞ごとの遺伝子発現を読み、細胞集団の違いを調べる解析として説明します。

  27. single-cell QCとは何か 未学習 バイオインフォマティクス

    single-cell RNA-seqの品質管理を、低品質細胞、検出遺伝子数、ミトコンドリア比率、doublet確認の観点から説明します。

  28. バッチ効果とは何か 未学習 バイオインフォマティクス

    バッチ効果を、実験日、試薬、測定機器などの違いによって生じる技術的な差として説明し、single-cell解析での注意点につなげます。

  29. 次元削減とは何か 未学習 バイオインフォマティクス

    次元削減を、多数の遺伝子や特徴量を少ない軸に圧縮して全体像を見やすくする方法として説明します。

  30. クラスタリングとは何か 未学習 バイオインフォマティクス

    single-cell解析などで使われるクラスタリングを、似たデータ点をまとめる探索的な解析として説明します。

  31. マーカー遺伝子とは何か 未学習 バイオインフォマティクス

    マーカー遺伝子を、特定の細胞型や状態を見分ける手がかりになる遺伝子として説明します。

  32. 細胞タイプ注釈とは何か 未学習 バイオインフォマティクス

    single-cell解析でクラスタに細胞型名を付ける細胞タイプ注釈を、マーカー遺伝子と根拠確認の観点から説明します。

  33. UMAPとは何か 未学習 バイオインフォマティクス

    UMAPを、高次元データを2次元などに配置してsingle-cell解析の全体像を見る可視化手法として説明します。

  34. 解析ワークフローとは何か 未学習 バイオインフォマティクス

    生データから図や表に至る解析手順として、解析ワークフローの役割と確認点を説明します。

  35. 解析ノートブックとは何か 未学習 バイオインフォマティクス

    コード、説明、図表をまとめて記録する解析ノートブックの役割と読み方を説明します。

  36. 論文データの再解析とは何か 未学習 バイオインフォマティクス

    公開データや論文付属データを使い、解析条件を確認しながら結果を再検討する再解析を説明します。

  37. トランスクリプトミクスとは何か 未学習 ゲノミクス

    RNAの種類や量を網羅的に調べるトランスクリプトミクスの基本を説明します。

  38. プロテオミクスとは何か 未学習 ゲノミクス

    タンパク質の種類、量、修飾を網羅的に調べるプロテオミクスの基本を説明します。

  39. メタボロミクスとは何か 未学習 ゲノミクス

    代謝物の種類や量を網羅的に調べるメタボロミクスの基本を説明します。

  40. マルチオミクスとは何か 未学習 ゲノミクス

    複数のオミクス層を組み合わせて細胞や組織の状態を読むマルチオミクスの基本を説明します。

  41. GWASとは何か 未学習 ゲノミクス

    ゲノム全体の多型と形質の統計的な関連を調べるGWASの基本を説明します。

  42. ポリジェニックリスクスコアとは何か 未学習 ゲノミクス

    多数のバリアントの効果推定を足し合わせるポリジェニックリスクスコアの基本と限界を説明します。

  43. 希少疾患ゲノミクスとは何か 未学習 ゲノミクス

    希少疾患研究でゲノム情報を用いて原因候補や機構を調べる考え方を説明します。

  44. がんゲノミクスとは何か 未学習 ゲノミクス

    がん研究でゲノム変化やそのパターンを調べるがんゲノミクスの基本を説明します。

  45. Tumor-normal比較とは何か 未学習 ゲノミクス

    腫瘍由来サンプルと対照サンプルを比べて体細胞変異候補を調べるTumor-normal比較を説明します。

  46. エピゲノムとは何か 未学習 ゲノミクス

    ゲノム全体にわたるDNAメチル化、ヒストン修飾、クロマチン状態を読むエピゲノムの基本を説明します。

  47. メチロームとは何か 未学習 ゲノミクス

    ゲノム全体にわたるDNAメチル化パターンとしてのメチロームを説明します。

  48. ChIP-seqとは何か 未学習 ゲノミクス

    特定のタンパク質やヒストン修飾が多く検出されるゲノム領域を調べるChIP-seqを説明します。

  49. ATAC-seqとは何か 未学習 ゲノミクス

    開いたクロマチン領域をゲノム全体で調べるATAC-seqの基本を説明します。

  50. 3Dゲノムとは何か 未学習 ゲノミクス

    核内でゲノムがどのように折りたたまれ近接するかを読む3Dゲノムの基本を説明します。

  51. ゲノムブラウザ図の読み方 未学習 論文Figureの読み方

    論文Figureに出てくるゲノムブラウザ図で、座標、トラック、遺伝子モデル、変異、リードの見方を説明します。

  52. Volcano plotの読み方 未学習 論文Figureの読み方

    RNA-seqなどの差次的発現解析で使われるVolcano plotの軸、点、しきい値、解釈の注意点を説明します。

  53. ヒートマップの読み方 未学習 論文Figureの読み方

    遺伝子発現解析などで使われるヒートマップの色、行、列、クラスタリング、スケールの読み方を説明します。

  54. PCA plotの読み方 未学習 論文Figureの読み方

    PCA plotでサンプル間の全体的な違い、クラスタ、外れ値を読む基本を説明します。

  55. UMAP / t-SNEの読み方 未学習 論文Figureの読み方

    UMAPやt-SNEで点、クラスタ、距離、細胞タイプ注釈を読む基本を説明します。

  56. GSEA plotの読み方 未学習 論文Figureの読み方

    GSEA plotでランキング、エンリッチメントスコア、leading edgeを読む基本を説明します。

  57. Pathway enrichment plotの読み方 未学習 論文Figureの読み方

    経路や遺伝子セットのenrichment結果を示すFigureで、経路名、スコア、FDR、遺伝子数を読む基本を説明します。

  58. CNV plotの読み方 未学習 論文Figureの読み方

    コピー数変異を示すCNV plotで、ゲノム位置、増幅、欠失、セグメント、サンプル比較を読む方法を説明します。

  59. Lollipop plotの読み方 未学習 論文Figureの読み方

    タンパク質やゲノム上の位置に沿って変異を示すLollipop plotで、位置、頻度、ドメイン、解釈の注意点を読む方法を説明します。

  60. 論文読解演習 - RNA-seq論文 未学習 論文読解演習

    架空のRNA-seq論文を題材に、Abstract、Figure、Methods、Resultsを行き来して読む練習をします。

  61. 論文読解演習 - single-cell解析論文 未学習 論文読解演習

    架空のsingle-cell解析論文を題材に、UMAP、クラスタ、マーカー遺伝子、差次的発現、Methodsを行き来して読む練習をします。

  62. 論文読解演習 - がんゲノム論文 未学習 論文読解演習

    架空のがんゲノム論文を題材に、Tumor-normal比較、変異、コピー数変異、Methods確認をつなげて読む練習をします。

オミクス解析の流れが見えてきたら、Figureを読めるようになる で図の読み方を横断的に練習します。論文全体の構造へ進む場合は、論文を読めるようになる を使います。統計や実験設計の確認点で止まった場合は、実験・統計を確認する に戻ります。