平均と中央値
この記事で学ぶこと
- 平均と中央値の違いを説明できる
- 外れ値や偏った分布で代表値の読み方が変わることを理解する
- Figure legendで代表値の定義を確認できる
平均と中央値は、データの中心を表す代表値ですが、外れ値や分布の偏りへの影響が異なります。
平均は全体の合計を反映し、中央値は並べたときの中央を表します。どちらが使われているかを確認すると、棒グラフや箱ひげ図の値を読み違えにくくなります。
なぜ平均と中央値の視点が重要か
Section titled “なぜ平均と中央値の視点が重要か”Figureでは、棒や箱の位置がデータ全体を1つの値に要約して示すことがあります。その値が平均なのか中央値なのかを確認すると、外れ値や偏った分布をどの程度反映しているかを読みやすくなります。
外れ値や偏った分布があると、平均は大きく動くことがあります。中央値は外れ値の影響を受けにくいため、分布の形と合わせて読むと、代表値の意味を誤解しにくくなります。
どんな代表値があるか
Section titled “どんな代表値があるか”平均は、データ全体の合計を反映する代表値です。細胞数や蛍光強度の平均など、全体の水準をざっくり見るときに使われます。
中央値は、上半分と下半分を分ける位置を表します。発現量のように偏りや外れ値が出やすいデータでは、中央値を見ることで典型的な値をつかみやすくなる場合があります。
平均と中央値はどう確認するか
Section titled “平均と中央値はどう確認するか”Figureでは、棒グラフ、箱ひげ図、点を重ねた図、表の注記で、平均か中央値かが示されます。Figure legendに mean、median、mean ± SD、median with IQR などの表現がないか確認します。
Methodsでは、どの代表値を使ったか、外れ値をどう扱ったか、正規化や対数変換をしたかを見ます。代表値だけでなく、点や分布が表示されているかも確認します。
平均と中央値の違いは何につながるか
Section titled “平均と中央値の違いは何につながるか”平均と中央値が大きく離れている場合、分布が偏っている、外れ値がある、少数の高い値が全体を引き上げている、といった可能性を考えます。
ただし、どちらが常に正しいという話ではありません。研究の問い、データの性質、Figureで示したい情報に応じて、どちらの代表値が使われているかを読むことが大切です。
論文や実験ではどう出てくるか
Section titled “論文や実験ではどう出てくるか”論文では、棒グラフ、箱ひげ図、表、本文中の要約値として出てきます。箱ひげ図では中央値が線として表示されることが多く、棒グラフでは平均が使われることがあります。
読むときは、代表値が平均なのか中央値なのか、エラーバーや箱の範囲が何を表すのかを確認します。分布とは何かと合わせて読むと、代表値だけに頼りすぎない見方が身につきます。
どんな点でつまずきやすいか
Section titled “どんな点でつまずきやすいか”似た用語との区別
Section titled “似た用語との区別”- 平均と中央値: 平均は全値の合計から計算し、中央値は並べたときの中央です。
- 代表値と分布: 代表値はデータを要約しますが、広がりや外れ値までは表しません。
- 中央値と最頻値: 中央値は位置、最頻値は最も多く出る値です。
解釈の落とし穴
Section titled “解釈の落とし穴”- 平均だけを見て、外れ値や分布の偏りを見落とさないようにします。
- 棒グラフの高さを見ただけで、各点の広がりまで分かったと思わないようにします。
- 平均と中央値のどちらが使われているかが書かれていない場合は、Figure legendやMethodsを確認します。
| 日本語 | 英語 | 略語 | 説明 |
|---|---|---|---|
| 平均 | mean | - | すべての値を合計し、個数で割って得られる代表値。 |
| 中央値 | median | - | 値を小さい順に並べたとき、中央に位置する代表値。 |
| 分布 | distribution | - | データがどの値にどれくらい集まっているかを示す見方。 |
| 外れ値 | outlier | - | 他の値から大きく離れ、代表値に影響することがある値。 |
読み終えた内容を、1問ずつ選択式で確認します。
未回答