コンテンツにスキップ
biolearnexactcg3cbzx9nux9n9x9ltx9nwx9o3x9mhx9max9n2x9nk

リファレンスゲノムとは何か

この記事で学ぶこと

  • リファレンスゲノムが解析や表示の基準配列であることを説明できる
  • リファレンスと実際の個体のゲノムを区別できる
  • バージョンや座標系を確認する重要性を理解する

リファレンスゲノムは、配列解析やゲノム表示で基準として使う代表的なゲノム配列です。

実験で得た配列を基準配列に対応づけることで、どの染色体のどの位置に由来するか、既知の遺伝子や注釈とどう重なるかを考えやすくなります。ただし、リファレンスは「その種の完全な一個体」ではなく、解析のための座標系として使う標準的な配列です。

短い配列断片がリファレンスゲノム上の位置に並び、座標と注釈を基準に比較される様子を示す教材イラスト
リファレンスゲノムは配列解析の基準になる シーケンスデータを基準配列に対応づけることで、位置、注釈、配列差を同じ座標系で扱えます。

なぜリファレンスゲノムの視点が重要か

Section titled “なぜリファレンスゲノムの視点が重要か”

ゲノム解析では、読まれた短い配列をどこに置くかが出発点になります。基準がなければ、リードの位置、遺伝子との重なり、バリアントの場所を共通の言葉で表しにくくなります。

同じデータでも、使うリファレンスゲノムやアセンブリのバージョンが違うと、座標や注釈との対応が変わることがあります。論文やデータベースを読むときは、解析結果だけでなく、どの基準配列を使ったかを確認します。

どんなリファレンスゲノムがあるか

Section titled “どんなリファレンスゲノムがあるか”

リファレンスゲノムには、生物種ごとの標準的な配列があります。ヒト、マウス、シロイヌナズナ、酵母、細菌など、それぞれの研究コミュニティでよく使われるバージョンがあります。

同じ生物種でも、過去の版と新しい版、染色体レベルまで組み立てられたもの、未配置の足場配列を含むものなどがあります。研究では、参照したバージョン名やデータベースを明記することが重要です。

リファレンスゲノムはどう使うか

Section titled “リファレンスゲノムはどう使うか”

シーケンシングで得たリードは、リファレンスゲノムにアラインメントされます。その結果をもとに、ゲノム座標カバレッジ、バリアント候補、遺伝子や調節領域との重なりを調べます。

ゲノムブラウザでは、リファレンス上の座標に沿って、遺伝子モデル、リード、バリアント、アノテーションをトラックとして表示します。表示されているすべての情報は、同じ基準配列に沿って並んでいるかを確認します。

リファレンスゲノムの違いは何につながるか

Section titled “リファレンスゲノムの違いは何につながるか”

リファレンスのバージョンが違うと、同じ領域でも座標表記が変わることがあります。ある位置を別の論文やデータベースと比べるときは、座標だけでなく、リファレンス名とバージョンをセットで扱います。

また、リファレンスは多様な個体差をすべて表すものではありません。サンプルに特有の配列や構造の違いは、リファレンスへの対応づけだけでは見えにくい場合があります。

論文や実験ではどう出てくるか

Section titled “論文や実験ではどう出てくるか”

リファレンスゲノムは、Methodsで「どのゲノムアセンブリにマッピングしたか」「どのアノテーション版を使ったか」として出てきます。ResultsFigureでは、染色体名と座標、ゲノムブラウザ図、バリアント表の基準として現れます。

補足資料では、参照配列のバージョン、アラインメント条件、座標変換の有無が書かれることがあります。複数の研究を比べるときは、同じリファレンスを使っているかを確認します。

  • リファレンスゲノムとゲノム: ゲノムは遺伝情報の全体で、リファレンスゲノムは解析の基準として使う代表的な配列です。
  • リファレンスゲノムとゲノムアノテーション: リファレンスは配列の基準で、アノテーションはその上に付けられた遺伝子や領域の情報です。
  • 座標と塩基配列: 座標は場所の表記であり、その場所にある塩基そのものとは別に確認します。
  • リファレンスと同じ配列が「正常」、違う配列が「異常」と単純に考えない。
  • 座標だけを書き写して、リファレンスのバージョンを省略しない。
  • マッピングしにくい反復配列や構造の複雑な領域では、結果が不確実になりやすいことを意識する。
日本語 英語 略語 説明
リファレンスゲノム reference genome - 配列解析やゲノム表示で基準として使う代表的なゲノム配列。
ゲノム genome - ある生物が持つ遺伝情報の全体。
ゲノム座標 genomic coordinate - 染色体名と位置でゲノム上の場所を表す表記。
ゲノムアノテーション genome annotation - ゲノム上の遺伝子や調節領域などに意味づけを加えた情報。
ゲノムブラウザ genome browser - ゲノム上の座標に沿って複数の情報を重ねて表示する画面。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4