標準偏差と標準誤差とは何か
この記事で学ぶこと
- 標準偏差と標準誤差が何を表すか説明できる
- SDとSEMをFigure legendで区別できる
- SEMが小さいことをデータのばらつきが小さいことと混同しない
標準偏差は、データが平均値の周りにどれくらい散らばっているかを表す指標で、標準誤差はサンプルから推定した平均値がどれくらい不確かかを表す指標です。
どちらもばらつきに関係しますが、SDはデータそのもの、SEMは平均推定の不確かさを見るために使います。Figureで mean ± SD と mean ± SEM が同じ形に見えても、読むべき意味は違います。
なぜ標準偏差と標準誤差の視点が重要か
Section titled “なぜ標準偏差と標準誤差の視点が重要か”Figureのエラーバーを読むとき、SDとSEMを混同すると結果の印象が大きく変わります。SEMはサンプル数が増えると小さくなりやすいため、SEMが小さい図を見て「個々のデータのばらつきが小さい」と読むと誤解につながります。
生命科学では、細胞、個体、サンプル、独立実験など、何を測ったデータなのかによってばらつきの意味が変わります。平均値だけでなく、データの分布と推定の不確かさを分けて見ると、Figureから言える範囲を落ち着いて判断できます。
どんな違いがあるか
Section titled “どんな違いがあるか”標準偏差(standard deviation、SD)は、観測されたデータが平均値の周りにどれくらい広がっているかを表します。たとえば同じ条件で測った細胞の蛍光強度が大きく散らばる場合、SDは大きくなります。
標準誤差(standard error of the mean、SEM)は、平均値を推定するときの不確かさを表します。よく使われる形では、SEMはSDをサンプル数の平方根で割った値として計算されます。
SDは「データの散らばり」を見る指標、SEMは「平均値をどれくらい精度よく推定できているか」を見る指標です。個々のサンプルのばらつきを見たい場面では、SEMよりもSDや点の分布を見る方が適していることがあります。
標準偏差と標準誤差はどう計算・確認するか
Section titled “標準偏差と標準誤差はどう計算・確認するか”計算の前に、何を1つのデータ点として数えているかを確認します。n数が個体なのか、独立した培養なのか、同じサンプル内の細胞なのかによって、SDやSEMの意味は変わります。
平均、SD、SEMを計算すること自体は多くの表計算ソフトや統計ソフトでできます。ただし、技術的反復だけをnとして扱う、同じサンプル由来の多数の細胞を独立サンプルのように扱う、といった設計上の問題は、計算式だけでは直せません。
Figureでは、点が個々のデータを表しているか、バーが平均値を表しているか、エラーバーがSD、SEM、信頼区間のどれかを確認します。
標準偏差と標準誤差の変化は何につながるか
Section titled “標準偏差と標準誤差の変化は何につながるか”SDが大きい場合、測定対象の個体差、細胞間の違い、測定条件の違いなど、データそのものの広がりが大きい可能性があります。これは必ずしも悪いことではなく、生命現象の多様性を反映している場合もあります。
SEMが大きい場合、平均値の推定が不確かであることを示します。サンプル数が少ない、データのばらつきが大きい、独立した反復が限られている、といった要因が関係します。
一方で、SEMが小さいからといって実験設計が十分だとは限りません。サンプルの独立性、対照群、ランダム化、測定の偏りも合わせて読む必要があります。
論文や実験ではどう出てくるか
Section titled “論文や実験ではどう出てくるか”論文では、Figure legendに mean ± SD、mean ± SEM、mean with 95% CI のように書かれます。Methodsには、どのサンプルをnとして扱ったか、何回の独立実験を行ったかが書かれることがあります。
読むときは、エラーバーの定義、n数、データ点の意味、統計検定で使った単位を合わせて確認します。SDやSEMの表示だけで有意差や生物学的重要性を判断するのではなく、効果量や研究デザインも見ます。
どんな点でつまずきやすいか
Section titled “どんな点でつまずきやすいか”似た用語との区別
Section titled “似た用語との区別”- 標準偏差と標準誤差: SDはデータのばらつき、SEMは平均値の推定の不確かさです。
- SEMと信頼区間: どちらも推定の不確かさに関わりますが、表示される範囲や読み方は同じではありません。
- ばらつきと測定ミス: ばらつきは生命現象やサンプル差を含むことがあり、単に失敗を意味するわけではありません。
解釈の落とし穴
Section titled “解釈の落とし穴”- SEMのエラーバーはSDより小さく見えやすいため、データの散らばりが小さいと読み違えないようにします。
- エラーバーが重なるかどうかだけで、統計的有意性を判断することはできません。
- n数が大きく見えても、独立した生物学的反復が多いとは限りません。
| 日本語 | 英語 | 略語 | 説明 |
|---|---|---|---|
| 標準偏差 | standard deviation | SD | データが平均値の周りにどれくらい散らばっているかを表す指標。 |
| 標準誤差 | standard error of the mean | SEM | サンプルから推定した平均値の不確かさを表す指標。 |
| エラーバー | error bar | - | グラフ上でばらつきや不確かさを線で示す表示。 |
| 信頼区間 | confidence interval | CI | 推定値の不確かさを範囲として示す統計表示。 |
| n数 | sample size | n | Figureや統計解析で数えられているサンプル、個体、細胞、測定点などの数。 |
読み終えた内容を、1問ずつ選択式で確認します。
未回答