コンテンツにスキップ
biolearnexact1hnyyxsx37x32x34x9k8x37x32x3ax9kexsidx9j8

SNPとSNVの違い

この記事で学ぶこと

  • SNPとSNVがどちらも1塩基の違いに関わる語であることを説明できる
  • SNPは集団内の多型、SNVは参照配列との差を強調する語として区別できる
  • 論文や解析結果で文脈を確認して読む必要性を理解する

SNPとSNVは、どちらも1塩基の違いに関わる用語ですが、強調する文脈が違います。

SNPは集団内で見られる1塩基の多型を指す語として使われ、SNVはリファレンスゲノムと比べた1塩基の違いを広く指す語として使われます。実際の論文やツールでは使い分けが揺れることもあるため、頻度、集団、参照配列のどれを基準にしているかを確認します。

複数の個体の同じゲノム位置を比べ、参照配列との差としてのSNVと集団内で見られる多型としてのSNPを対比する教材イラスト
SNPとSNVは1塩基差を見る文脈が違う SNVは参照配列との差、SNPは集団内の多型という視点で使われることが多い語です。

なぜSNPとSNVを区別する視点が重要か

Section titled “なぜSNPとSNVを区別する視点が重要か”

1塩基の違いは、ゲノム解析で非常によく出てくる情報です。しかし、同じ1塩基差でも、単に参照配列と違う候補なのか、集団内で一定の頻度で見られる多型なのかで、読み方が変わります。

区別して読むと、バリアントコールの結果、集団頻度の表、GWASの結果、データベースの記載を混同しにくくなります。特に、検出された候補をすぐに一般的な多型として扱わないことが大切です。

SNVは、あるサンプルで参照配列と比べて1塩基が異なるときに使われます。頻度が高いか低いか、集団でどれくらい見られるかを必ず含む語ではありません。

SNPは、集団内で見られる1塩基の多型を指す語です。頻度の基準は文脈やデータベースによって異なるため、論文ではどの定義でSNPと呼んでいるかを確認します。

SNVは、シーケンスデータをリファレンスに対応づけ、1塩基の違いを検出することで候補として得られます。結果には、ゲノム座標、参照塩基、代替塩基、品質指標などが含まれます。

SNPは、複数個体や集団データの中で、同じ位置にどの塩基がどれくらいの頻度で見られるかを調べて扱います。既存データベースの頻度情報や集団ごとのアリル頻度が参照されることがあります。

SNPやSNVの変化は何につながるか

Section titled “SNPやSNVの変化は何につながるか”

1塩基差がタンパク質のアミノ酸、スプライシング、調節領域などに関わる場合、分子や細胞の性質に影響する可能性があります。一方で、多くの1塩基差は影響が小さい、または意味が不明な場合があります。

SNPは集団遺伝学やGWASで、形質との統計的な関連を調べる手がかりになります。ただし、関連があることと、そのSNPが直接の原因であることは同じではありません。

論文や実験ではどう出てくるか

Section titled “論文や実験ではどう出てくるか”

SNVは、バリアントコール、がんゲノム研究、個体ごとのシーケンス解析などで、参照配列との差として出てくることがあります。SNPは、GWAS、集団解析、アレイ解析、頻度データベースでよく出てきます。

Methodsでは、バリアント検出の条件、集団頻度のしきい値、使ったデータベースが説明されることがあります。ResultsFigureでは、Manhattan plot、バリアント表、アリル頻度の比較として示されます。

  • SNPとSNV: SNPは集団内の多型、SNVは参照配列との差を強調する語です。
  • SNPとvariant: SNPはvariantの一種として扱われますが、variantは1塩基差以外も含む広い語です。
  • mutationとSNV: mutationはDNA配列に生じた変化を指す語で、SNVは観察された1塩基差を表す解析上の語として使われます。
  • あるサンプルでSNVとして検出された候補を、すぐにSNPと呼ばない。
  • SNPという語が出てきても、頻度基準や集団の定義を確認する。
  • 1塩基差が遺伝子内にあることだけで、機能への影響が証明されたと考えない。
日本語 英語 略語 説明
SNP single nucleotide polymorphism SNP 集団の中で見られる1塩基の配列多型。
SNV single nucleotide variant SNV 参照配列と比べて1塩基が異なるバリアント。
バリアント variant - 参照配列や集団内の基準と比べて見つかる配列上の違い。
遺伝的変異 genetic variant variant ゲノム配列に見られる違い。
リファレンスゲノム reference genome - 配列解析やゲノム表示で基準として使う代表的なゲノム配列。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4