コンテンツにスキップ
biolearnexact1i6910cx9n4x9nux9lux9o3x9mw

バリアントとは何か

この記事で学ぶこと

  • バリアントが参照配列や基準と比べて見つかる配列上の違いであることを説明できる
  • 置換、挿入、欠失などの代表的な種類を区別できる
  • 検出と解釈を分けて考える重要性を理解する

バリアント(variant)は、参照配列や集団内の基準と比べて見つかる配列上の違いです。

ゲノム解析では、サンプル由来の配列をリファレンスゲノムと比べて、1塩基の置換、挿入、欠失、より大きな構造の違いを候補として扱います。バリアントを見つけることと、その生物学的な意味を決めることは分けて考えます。

リファレンス配列とサンプル配列を比べ、置換、挿入、欠失の候補が記録される様子を示す教材イラスト
バリアントは基準配列との違いとして記録される 検出された配列差は、位置、種類、品質、周辺の注釈と合わせて慎重に読みます。

なぜバリアントの視点が重要か

Section titled “なぜバリアントの視点が重要か”

シーケンスデータから配列の違いを読むとき、まず必要なのは「どこに、どんな違いがある候補か」を整理することです。バリアントという言葉は、その候補を解析単位として扱うために使われます。

ただし、バリアントは見つかった違いを表す語であり、影響の大きさや原因性を自動的に意味するわけではありません。品質、頻度、位置、アノテーション、実験的な証拠を合わせて解釈します。

1塩基だけが異なるものには、SNVSNPがあります。SNVは参照配列と比べた1塩基の違い、SNPは集団内で見られる1塩基の多型として説明されることが多い語です。

数塩基の挿入や欠失は、indelと呼ばれることがあります。より大きな重複、欠失、逆位、転座などは構造変異として扱われることがあります。

バリアントは、シーケンシングで得たリードをリファレンスに対応づけ、サンプルと基準配列の違いを検出して調べます。この処理はバリアントコールと呼ばれ、候補ごとに位置、参照塩基、代替塩基、品質指標などが出力されます。

解析後は、低品質な候補を除くフィルタリング、アノテーションとの重ね合わせ、集団頻度や既存データベースとの比較を行います。どの条件で検出したかによって、得られる候補は変わります。

バリアントの変化は何につながるか

Section titled “バリアントの変化は何につながるか”

バリアントがタンパク質をコードする領域、スプライシングに関わる領域、調節領域などにある場合、細胞や個体の性質に影響する可能性があります。一方で、見つかったバリアントの多くは影響が小さい、またはその時点では意味が分からない場合もあります。

研究では、バリアントと形質の関連、進化や集団の違い、遺伝子機能の手がかりを調べます。個別の健康判断ではなく、論文やデータを読むための基礎概念として、証拠の強さを分けて考えます。

論文や実験ではどう出てくるか

Section titled “論文や実験ではどう出てくるか”

バリアントは、全ゲノムシーケンシングエクソーム解析、RNA-seq由来の配列差、GWASなどで出てきます。Methodsでは、使ったバリアントコールツール、リファレンス、フィルタ条件、アノテーション方法が説明されます。

ResultsFigureでは、バリアントの数、種類、ゲノム上の分布、遺伝子との重なり、集団間の頻度差、機能予測などとして示されます。表では、染色体、座標、参照塩基、代替塩基、品質、注釈が並ぶことがあります。

  • バリアントと遺伝的変異: 近い意味で使われますが、バリアントは解析で検出された配列差の候補を指す場面でよく使われます。
  • バリアントとmutation: mutationはDNA配列に生じた変化を指す語で、文脈によって過程や新規性を強調することがあります。
  • SNPとSNV: SNPは集団内の多型を強調し、SNVは参照配列と比べた1塩基の違いを広く指します。
  • バリアントがあることだけで、機能や形質への影響を断定しない。
  • 低品質なリード、マッピングの難しい領域、フィルタ条件によって候補が変わることを意識する。
  • 既存データベースに載っていることと、そのバリアントの意味が確定していることを混同しない。
日本語 英語 略語 説明
バリアント variant - 参照配列や集団内の基準と比べて見つかる配列上の違い。
遺伝的変異 genetic variant variant ゲノム配列に見られる違い。
SNV single nucleotide variant SNV 参照配列と比べて1塩基が異なるバリアント。
SNP single nucleotide polymorphism SNP 集団の中で見られる1塩基の配列多型。
リファレンスゲノム reference genome - 配列解析やゲノム表示で基準として使う代表的なゲノム配列。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4