コンテンツにスキップ
biolearnexact823difx2xx32x2sx2tx30

indelとは何か

この記事で学ぶこと

  • indelが短い挿入や欠失として見つかる配列上の違いであることを説明できる
  • 挿入、欠失、1塩基置換との違いを区別できる
  • indelの解釈では位置、長さ、読み枠を確認する必要があることを理解する

indelは、リファレンスゲノムと比べて、短い塩基配列が挿入されたり欠失したりして見つかる配列上の違いです。

1塩基が別の塩基に置き換わるSNVとは異なり、indelでは配列の長さが変わります。タンパク質をコードする領域では読み枠に関わる場合がありますが、意味は位置や長さ、周辺の注釈と合わせて考えます。

リファレンス配列とサンプル配列を比べ、短い挿入と欠失によって配列の長さが変わる様子を示す教材イラスト
indelは短い挿入や欠失として見つかる 置換とは異なり、挿入や欠失では配列の長さが変わるため、位置と長さを合わせて読みます。

indelは、バリアント解析でSNVと並んでよく出てくる基本的な変化です。短い変化でも、コード領域、スプライシングに関わる領域、反復配列の近くなどでは解釈に注意が必要です。

また、indelはアラインメントやバリアントコールの条件の影響を受けやすいことがあります。候補が見つかったら、長さ、周辺配列、リードの支持、品質指標を確認します。

挿入は、参照配列にはない塩基がサンプル側に追加されているように見える変化です。欠失は、参照配列にある塩基がサンプル側では抜けているように見える変化です。

長さが3の倍数でないindelがタンパク質コード領域にある場合、読み枠がずれる可能性があります。一方、非コード領域や影響の小さい場所では、見つかっただけで大きな意味があるとは限りません。

indelは、シーケンシングで得たリードをリファレンスに対応づけ、挿入や欠失の候補として検出します。出力には、ゲノム座標、参照配列、代替配列、品質、リードの支持などが含まれます。

短い反復配列の近くでは、どこを開始位置として表すかが揺れることがあります。複数のツールや表記を比べるときは、同じ変化が別の座標表記に見える場合があることを意識します。

indelがコード領域にある場合、アミノ酸の挿入や欠失、読み枠の変化につながる可能性があります。調節領域やスプライシングに関わる領域では、遺伝子発現や転写産物の解釈に関わる場合があります。

ただし、indelの影響は一律ではありません。配列差の検出、機能予測、実験的な証拠、集団頻度などを分けて考える必要があります。

論文や実験ではどう出てくるか

Section titled “論文や実験ではどう出てくるか”

indelは、全ゲノムシーケンシングエクソーム解析、ターゲットシーケンシング、編集実験の結果確認などで登場します。Methodsでは、使ったバリアントコールツール、フィルタ条件、indelの長さの範囲が書かれることがあります。

ResultsFigureでは、バリアント表、アラインメント図、遺伝子モデル上の位置、読み枠への影響予測として示されます。図を見るときは、塩基の違いだけでなく、周辺のリード配置も確認します。

  • indelとSNV: SNVは1塩基の置換で、indelは挿入や欠失により配列の長さが変わる変化です。
  • indelと構造多型: indelは短い挿入や欠失を指すことが多く、構造多型はより大きなゲノム領域の違いを含みます。
  • 欠失と「存在しない」: 欠失は参照配列との比較でそう見える表記であり、比較の基準を確認します。
  • indelがコード領域にあることだけで、機能への影響を断定しない。
  • 反復配列周辺では、検出や表記が不安定になりやすい。
  • 同じ変化でもツールや正規化の方法によって見え方が変わる場合がある。
日本語 英語 略語 説明
indel insertion-deletion indel 短い挿入や欠失として見つかる配列上の違い。
バリアント variant - 参照配列や集団内の基準と比べて見つかる配列上の違い。
SNV single nucleotide variant SNV 参照配列と比べて1塩基が異なるバリアント。
リファレンスゲノム reference genome - 配列解析やゲノム表示で基準として使う代表的なゲノム配列。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4