コンテンツにスキップ
biolearnexactsv2gcvx2vx3bx2px37

GWASとは何か

この記事で学ぶこと

  • GWASがゲノム全体の多型と形質の関連を調べる研究であることを説明できる
  • 関連、効果量、p値、多重検定補正の関係を大まかに理解する
  • GWASの結果を原因や個人判断として読みすぎない注意点を説明できる

GWASは、ゲノム全体の多型と形質の統計的な関連を調べる研究です。

多くのサンプルについてSNPなどの多型を調べ、形質や測定値と一緒に解析します。見つかるのは「関連の手がかり」であり、その多型が直接の原因であることや個人の将来を決めることを意味しません。

多数のサンプルから得たゲノム上の多型と形質データを照合し、関連の強い領域が統計的な山として見える様子を示す教材イラスト
GWASは多型と形質の関連をゲノム全体で探す 多数の多型を一度に調べるため、関連の強さだけでなく、多重検定や集団構造も確認します。

複雑な形質には、多数のゲノム領域が少しずつ関わる場合があります。GWASは、特定の候補遺伝子だけに絞らず、ゲノム全体から関連のある領域を探す方法として使われます。

一方で、GWASは統計的な関連を調べる研究です。関連が見つかった位置の近くにある遺伝子が直接の原因とは限らず、機能的な解釈には追加の解析や実験が必要です。

GWASでは、量的な測定値、分類された形質、実験条件で得られた値などを対象にすることがあります。対象形質の定義や測定方法が変わると、結果の意味も変わります。

解析対象には、SNPアレイで得た多型、シーケンシングから得た多型、推定で補完した多型などがあります。どの集団で、どの多型をどの品質で使ったかが重要です。

GWASでは、各多型について形質との関連を統計的に検定します。多くの多型を同時に検定するため、p値だけでなく、多重検定補正やFDR、ゲノムワイド有意水準を確認します。

集団構造、年齢や性別のような共変量、サンプル数、品質管理も結果に影響します。論文では、主解析、再現解析、メタ解析などを組み合わせることがあります。

GWASの関連シグナルは、形質に関わる可能性のある領域を示す手がかりになります。近くの遺伝子、発現量との関連、機能アノテーション、細胞種ごとのデータなどと重ねて解釈します。

ただし、関連シグナルは原因変異そのものとは限りません。連鎖不平衡により、近くの複数の多型が似た関連を示すことがあり、どの変化が機能に関わるかは別に調べます。

論文や実験ではどう出てくるか

Section titled “論文や実験ではどう出てくるか”

GWASは、Methodsではサンプル、形質定義、遺伝型データ、品質管理、統計モデル、共変量として説明されます。Resultsでは、関連した領域、効果量、p値、再現性が示されます。

Figureでは、Manhattan plot、QQ plot、領域ズーム図、関連した座位の表として出てきます。図を読むときは、縦軸が何を表すか、しきい値、対象集団、サンプル数を確認します。

  • GWASと候補遺伝子研究: GWASはゲノム全体を広く調べ、候補遺伝子研究はあらかじめ注目した領域を調べます。
  • 関連と原因: 統計的な関連は、直接の原因を証明するものではありません。
  • リードSNPと原因変異: 最も強く関連するSNPが、機能的に原因となる変化とは限りません。
  • p値が小さいことだけで、生物学的な重要性が大きいと考えない。
  • 集団構造やサンプルの偏りを確認せずに結果を一般化しない。
  • GWASの結果を個人の健康判断や将来予測として単独で読まない。
日本語 英語 略語 説明
GWAS genome-wide association study GWAS ゲノム全体の多型と形質の統計的な関連を調べる研究。
SNP single nucleotide polymorphism SNP 集団の中で見られる1塩基の配列多型。
形質 trait - 生物や細胞の性質として観察される特徴。
p値 p-value - 帰無仮説のもとで、観察結果以上に極端な結果が得られる確率。
効果量 effect size - 差や関連の大きさを表す指標。
確認問題

読み終えた内容を、1問ずつ選択式で確認します。

未回答

4 最高記録なし 復習なし

確認問題

確認問題

1/4