コンテンツにスキップ
biolearnexactw8gadbx9max9n2x9nkxip3xkyh

ゲノム座標とは何か

この記事で学ぶこと

  • ゲノム座標がゲノム上の位置を表す表記であることを説明できる
  • 染色体名、開始位置、終了位置、リファレンスをセットで確認できる
  • 座標表記の違いが比較や解釈に影響することを理解する

ゲノム座標は、染色体名と位置を使って、ゲノム上の場所を表す表記です。

座標はリファレンスゲノム上に置かれるため、同じ位置を正しく共有するには、染色体名、開始位置、終了位置、使ったリファレンスの版を合わせて読む必要があります。ゲノムブラウザやバリアント表では、この座標が情報を並べる共通の基準になります。

染色体上の拡大領域に開始位置と終了位置が示され、遺伝子やバリアントが同じ座標軸上に並ぶ様子を示す教材イラスト
ゲノム座標はゲノム上の場所を共有する表記 染色体名、位置、リファレンスの版をそろえることで、遺伝子やバリアントの場所を比較できます。

なぜゲノム座標の視点が重要か

Section titled “なぜゲノム座標の視点が重要か”

ゲノム上の情報は、遺伝子名だけでは十分に指定できないことがあります。同じ遺伝子にも複数の転写産物があり、近くに別の遺伝子や調節領域がある場合もあるため、位置を座標で示すと誤解が減ります。

座標を使うと、バリアント、リードピーク、アノテーションを同じ場所に重ねて考えられます。論文やデータベースで結果を比べるときの共通語にもなります。

基本的には、染色体名、開始位置、終了位置で領域を表します。1塩基だけを示す場合もあれば、遺伝子全体やピーク領域のように範囲で示す場合もあります。

表記法には、開始位置を0から数える形式と1から数える形式があります。BED、GTF、VCFなど、ファイル形式によって扱いが違うため、ツールやデータの仕様を確認します。

ゲノムブラウザでは、表示している領域の染色体名と座標が画面上に示されます。遺伝子名で検索して領域を開き、そこから正確な座標を確認することもできます。

解析ファイルでは、座標は表の列として出てきます。たとえば、バリアント表では染色体、位置、参照塩基、代替塩基が並び、ピークファイルでは染色体、開始、終了が並びます。

ゲノム座標の違いは何につながるか

Section titled “ゲノム座標の違いは何につながるか”

リファレンスゲノムの版が違うと、同じ生物学的領域でも座標がずれることがあります。別の研究やデータベースと比較するときは、必要に応じて座標変換を行います。

また、同じ座標に見えても、0始まりと1始まりの違い、範囲の終点を含むかどうかの違いで、1塩基分ずれることがあります。細かい位置が重要な解析では、この違いが大きな意味を持ちます。

論文や実験ではどう出てくるか

Section titled “論文や実験ではどう出てくるか”

ゲノム座標は、バリアント表、ゲノムブラウザ図、ピーク領域、プライマー設計、アノテーション表などで出てきます。Methodsでは、使ったリファレンスゲノム、座標系、ファイル形式が説明されることがあります。

Figureでは、横軸が染色体上の位置として表示されることがあります。図を読むときは、表示範囲、リファレンス、トラックのスケールを合わせて確認します。

  • ゲノム座標と遺伝子名: 座標は場所の表記で、遺伝子名は機能単位の名前です。
  • 座標とアノテーション: 座標は位置、アノテーションはその位置に重ねた意味づけです。
  • 開始位置と終了位置: 範囲を示すときは、どちらが含まれる形式かを確認します。
  • リファレンスの版を確認せずに座標だけを比較しない。
  • ファイル形式ごとの0始まり、1始まりの違いを見落とさない。
  • 近くにあることだけで、機能的な関係があると断定しない。
日本語 英語 略語 説明
ゲノム座標 genomic coordinate - 染色体名と位置でゲノム上の場所を表す表記。
リファレンスゲノム reference genome - 配列解析やゲノム表示で基準として使う代表的なゲノム配列。
染色体 chromosome - DNAとタンパク質からなる、遺伝情報を収納する構造。
ゲノムブラウザ genome browser - ゲノム上の座標に沿って複数の情報を重ねて表示する画面。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4