コンテンツにスキップ

分布とは | BioLearn

分布

distribution

分布は、データがどの値の周辺にどれくらい集まっているかを表す見方です。

同じ平均値でも、データが狭く集まっている場合と、広く散らばっている場合があります。片側に偏った分布や、外れ値を含む分布もあります。

生命科学論文では、点、箱ひげ図、Violin plot、ヒストグラムなどで分布が示されます。

分布を見ると、平均だけでは見えないばらつき、外れ値、群内の多様性に気づけます。Figureの結論を読みすぎないための基本です。

  • 平均: 値の合計をデータ数で割った代表値。
  • 中央値: 並べた値の中央にある代表値。
  • 外れ値: 他の値から大きく離れた値。

分布とは何か で、平均だけでは見えないデータの広がりを確認しましょう。