【数学Ⅰ】データの分析04:分散と標準偏差

データの分析
さん
さん

今日の板書はこれ!

分散と標準偏差

データが平均値のまわりにどれくらい散らばっているかを数値化したものが、分散標準偏差です。

偏差:各値と平均値の差 \(x – \bar{x}\)

分散 \(S^2\):偏差の2乗の平均値

\(S^2 = \frac{(x_1-\bar{x})^2 + (x_2-\bar{x})^2 + \cdots + (x_n-\bar{x})^2}{n}\)

別の公式:\(S^2 = \overline{x^2} – (\bar{x})^2\)(2乗の平均)-(平均の2乗)

標準偏差 \(S\):分散の正の平方根 \(S = \sqrt{S^2}\)

例題1

次のデータの分散と標準偏差を求めよ。
9, 3, 4, 10, 10, 5, 7, 9, 10, 3


▼ 解答

平均値は \(\bar{x} = \frac{9+3+4+10+10+5+7+9+10+3}{10} = 7\)

分散は \(S^2 = \frac{(9-7)^2+(3-7)^2+\cdots+(3-7)^2}{10} = \frac{80}{10} = 8\)

標準偏差は \(S = \sqrt{8} = 2\sqrt{2}\) ≒ 2.8(点)

生徒
生徒

もっと詳しく願いします!!

現役教員として数学を教えている「さん」と申します。

人より勉強に時間がかかる」と感じていませんか?教科書や参考書を理解するには、「自分なりに噛み砕いて考える力」が必要です。

このサイトでは、私が受けた質問やつまずきポイントをもとに、意味から理解できるように解説していきます。

分散とは?データの“散らばり”を数値で表す

生徒
生徒

平均値が同じでも、データの散らばり方が全然ちがうことってありますよね?

さん
さん

いいところに気づいたね!例えば「みんな7点前後にかたまっている」のか「0点や10点までバラバラ」なのかは、平均値だけでは区別できないんだ。そこで散らばり具合を数値にしたい、というのが今回のテーマだよ。

偏差 ― 各データが平均からどれだけ離れているか

まず、各値が平均値からどれだけ離れているかを表す偏差を考えます。

偏差は「各値と平均値の差」、つまり \(x – \bar{x}\) で計算します。

生徒
生徒

じゃあ、偏差を全部たし合わせれば散らばりの大きさになりそう!

さん
さん

残念ながら、それはうまくいかないんだ。偏差は平均より大きい値ではプラス、小さい値ではマイナスになる。だから全部たすと必ず0になってしまうんだよ。

偏差を2乗してから平均する ― これが分散

そこで、符号を消すために偏差を2乗します。

2乗すればすべて0以上になり、たし合わせても0になりません。

ただし、単純に2乗の合計をとるとデータの個数が多いほど値が大きくなってしまいます。

そこで、個数の影響をなくすために偏差の2乗の平均をとります。

これを散らばりの指標として定義したものが分散 \(S^2\) です。

\(S^2 = \frac{(x_1-\bar{x})^2 + (x_2-\bar{x})^2 + \cdots + (x_n-\bar{x})^2}{n}\)

標準偏差とは?単位をそろえた散らばりの指標

生徒
生徒

分散があれば散らばりは分かるのに、どうして標準偏差なんてもう一つ必要なんですか?

さん
さん

分散は偏差を「2乗」しているから、単位も2乗されてしまうんだ。例えばデータが「点」なら、分散の単位は「点²」になって意味がつかみにくい。

そこで、分散の正の平方根をとって単位を元にもどしたものが標準偏差 \(S\) です。

\(S = \sqrt{S^2}\)

さん
さん

こうすると元のデータと単位が一致するから、「だいたい平均から何点くらいばらついているか」を直感的に読めるようになるよ。

例題:分散と標準偏差の求め方

例題1

次のデータの分散と標準偏差を求めよ。
9, 3, 4, 10, 10, 5, 7, 9, 10, 3 (点)

ステップ1:まず平均値を求める

分散の式には平均値 \(\bar{x}\) が必要なので、先に平均を求めます。

\(\bar{x} = \frac{9+3+4+10+10+5+7+9+10+3}{10} = 7\)

ステップ2:偏差を2乗して平均する

各値について「値ー7」を2乗し、その合計を個数10で割ります。

\(S^2 = \frac{(9-7)^2+(3-7)^2+(4-7)^2+\cdots+(10-7)^2+(3-7)^2}{10}\)

\(= \frac{4+16+9+9+9+4+0+4+9+16}{10} = \frac{80}{10} = 8\)

ステップ3:標準偏差は分散の平方根

最後に分散の正の平方根をとれば標準偏差です。

\(S = \sqrt{8} = 2\sqrt{2}\) ≒ 2.8(点)

生徒
生徒

分散は8、標準偏差はおよそ2.8点だね!

便利な公式:(2乗の平均)-(平均の2乗)

さん
さん

偏差を1つずつ計算するのは大変だよね。実は分散には、もっとラクに計算できる公式があるんだ。

\(S^2 = \overline{x^2} – (\bar{x})^2\)

これは「2乗の平均から平均の2乗を引く」という意味です。

さっきと同じデータで確かめてみましょう。

\(x\)9341010579103計70
\(x^2\)819161001002549811009計570

表より、\(x\) の平均は \(\bar{x} = \frac{70}{10} = 7\)、\(x^2\) の平均は \(\overline{x^2} = \frac{570}{10} = 57\) です。

したがって分散は次のように求まります。

\(S^2 = \overline{x^2} – (\bar{x})^2 = 57 – 7^2 = 57 – 49 = 8\)

生徒
生徒

さっきと同じ8になった!偏差を1個ずつ出さなくていいから、こっちの方がラクですね。

さん
さん

そうなんだ。データが多いときや、平均がきれいな整数になるときは、この公式が特に強い味方になるよ。

まとめ:分散と標準偏差

さん
さん

さて、今回のまとめだよ!

分散と標準偏差

偏差:各値と平均値の差 \(x – \bar{x}\)

分散 \(S^2\):偏差の2乗の平均 \(S^2 = \frac{(x_1-\bar{x})^2 + \cdots + (x_n-\bar{x})^2}{n}\)

別公式:\(S^2 = \overline{x^2} – (\bar{x})^2\)

標準偏差 \(S\):分散の正の平方根 \(S = \sqrt{S^2}\)

標準偏差は元のデータと単位がそろうので、散らばりの大きさを直感的に比べられる。

生徒
生徒

また一つ賢くなった!

↑前の記事↑

(次の記事は準備中)

コメント