【数学Ⅰ】データの分析06:仮説検定と有意水準

データの分析
さん
さん

今日の板書はこれ!

仮説検定と有意水準

仮説検定 … 得られたデータをもとに仮説を立て、その仮説の妥当性を判定する統計的手法。

有意水準 … ある事象が起こる確率が「偶然とは考えにくい」と判断する基準となる確率。ふつうは \(\color{red}{0.05}\)、慎重に判断したいときは \(\color{red}{0.01}\) とすることが多い。

<仮説検定の手順>

① 正しいかどうか判定したい主張を、対立仮説 \(\color{deepskyblue}{H_1}\) とする。

② \(\color{deepskyblue}{H_1}\) を否定する仮説を、帰無仮説 \(\color{hotpink}{H_0}\) とする。

③ 有意水準をあらかじめ決め、\(\color{hotpink}{H_0}\) のもとで「得られたデータと同じか、それ以上に極端なこと」が起こる確率 \(P\) を求める。

④ \(P\) が有意水準より小さい → \(H_0\) を棄却し、\(H_1\) が正しいと判断する。\(P\) が有意水準以上 → \(H_0\) は棄却できず、判断を保留する。

例題1

ボールペンを製造する会社が、ボールペンAを改良して新製品Bを開発した。無作為に選んだ30人にAとBのどちらを好むかを調査したところ、21人が「Bを好む」と回答した。一般に新製品Bが好まれると判断してよいか。有意水準を(1) 0.05、(2) 0.01 として考えよ。ただし、公正なコインを30回投げて表の出た回数を記録する実験を200セット行ったところ、下の表のようになったとし、この結果を用いよ。


▼ 解答

表の回数891011121314151617181920212223
度数2331216222231312214126211200

対立仮説 \(\color{deepskyblue}{H_1}\):一般に新製品Bが好まれる。

帰無仮説 \(\color{hotpink}{H_0}\):新製品Bが特に好まれるわけではなく、AとBは等確率(半々)で選ばれる。

\(\color{hotpink}{H_0}\) が正しいとすると、30人中「21人以上」がBを好むと回答する確率は、公正なコイン30回で表が21回以上出る割合で近似できる。表より、

\[\color{red}{P=\frac{2+1+1}{200}=\frac{4}{200}=0.02}\]

(1) 有意水準 \(0.05\):\(\color{red}{0.02<0.05}\) なので \(H_0\) を棄却。→ 新製品Bが好まれると判断してよい。

(2) 有意水準 \(0.01\):\(\color{red}{0.02\geq 0.01}\) なので \(H_0\) は棄却できない。→ 好まれるとは判断できない(保留)。

生徒
生徒

もっと詳しくお願いします!!

現役教員として数学を教えている「さん」と申します。

人より勉強に時間がかかる」と感じていませんか?教科書や参考書を理解するには、「自分なりに噛み砕いて考える力」が必要です。

このサイトでは、私が受けた質問やつまずきポイントをもとに、意味から理解できるように解説していきます。

仮説検定とは?データが「偶然か必然か」を見抜く考え方

生徒
生徒

先生、アンケートで30人中21人が「新製品Bが好き」と答えたら、もう「Bのほうが人気」って言い切っていいんですか?

さん
さん

良いところに気づいたね。もし30人全員がBと答えたら、当然「Bが好まれている」と言えるよね。

さん
さん

逆に、Bと答えたのが11人くらいだったら?「これはただの誤差で、本当はどちらも同じくらい好まれている」と思うのが自然じゃないかな。

生徒
生徒

たしかに…。でも21人だと、多いような、誤差のような、微妙な数で判断に困ります。

この「微妙な数」を感覚ではなく、確率を使って客観的に判断する方法が仮説検定です。

仮説検定とは、得られたデータをもとに仮説を立て、その仮説が正しいといえるかどうかを判定する統計的な手法のことです。

「このデータの偏りは、たまたま(偶然)なのか、それとも意味のある差(必然)なのか」を見抜くための道具だと思ってください。

有意水準とは?「偶然とは考えにくい」の境界線

仮説検定のカギになるのが有意水準です。

有意水準とは、ある事象が起こる確率が「これはもう偶然とは考えにくい」と判断するための、基準となる確率のことです。

さん
さん

たとえば有意水準 \(\color{red}{0.05}\) は、「100回やって5回以下しか起こらないくらいレアなことが起きたなら、それは偶然じゃない(意味がある)とみなそう」という約束のことだよ。

有意水準はふつう \(0.05\)(5%)とします。

より慎重に判断したい場面では \(0.01\)(1%)とすることも多いです。

基準を厳しく(小さく)するほど、「偶然じゃない」と結論づけるためのハードルが上がります。

仮説検定のやり方|4つの手順

さん
さん

仮説検定は、次の4ステップで進めるよ。流れを覚えてしまえば、どんな問題でも同じように解けるんだ。

① 対立仮説 H₁ を立てる

まず、自分が「正しいと示したい主張」を対立仮説 \(\color{deepskyblue}{H_1}\) とします。

今回なら「一般に新製品Bが好まれる」が \(\color{deepskyblue}{H_1}\) です。

② 帰無仮説 H₀ を立てる

次に、その主張を否定する仮説を帰無仮説 \(\color{hotpink}{H_0}\) とします。

「Bが特に好まれるわけではなく、AとBは等確率で選ばれる」が \(\color{hotpink}{H_0}\) です。

さん
さん

ポイントは、いったん「差はない(\(\color{hotpink}{H_0}\))」と仮定してみること。背理法に似ているね。「差がない」と仮定したのに、実際のデータがめったに起きないほど偏っていたら、その仮定がおかしい=差がある、と結論できるんだ。

③ H₀ のもとで確率 P を求める

有意水準を決めたうえで、\(\color{hotpink}{H_0}\) が正しいと仮定したときに「得られたデータと同じか、それ以上に極端なこと」が起こる確率 \(P\) を計算します。

④ 有意水準と比べて判断する

最後に、求めた確率 \(P\) を有意水準と比べます。

\(P\) が有意水準より小さければ「\(\color{hotpink}{H_0}\) のもとではめったに起きないことが起きた」ことになるので、\(H_0\) を棄却し、\(H_1\) が正しいと判断します。

\(P\) が有意水準以上なら \(H_0\) は棄却できず、判断は保留します。

例題で仮説検定をやってみよう|新製品アンケート

例題1

ボールペンを製造する会社が、ボールペンAを改良して新製品Bを開発した。無作為に選んだ30人にAとBのどちらを好むかを調査したところ、21人が「Bを好む」と回答した。一般に新製品Bが好まれると判断してよいか。有意水準を(1) 0.05、(2) 0.01 として考えよ。ただし、公正なコインを30回投げて表の出た回数を記録する実験を200セット行ったところ、下の表のようになったとし、この結果を用いよ。

手順①②:仮説を立てる

さん
さん

示したいのは「Bが好まれる」こと。だからこれを対立仮説に、その否定を帰無仮説にするよ。

対立仮説 \(\color{deepskyblue}{H_1}\):一般に新製品Bが好まれる。

帰無仮説 \(\color{hotpink}{H_0}\):新製品Bが特に好まれるわけではなく、AとBは等確率(半々)で選ばれる。

手順③:確率 P を求める

\(\color{hotpink}{H_0}\) が正しいなら、1人がBを選ぶ確率は \(\frac{1}{2}\) で、コイン投げと同じ状況です。

そこで「30人中21人以上がBを好む」確率を、公正なコインを30回投げて表が21回以上出る割合で近似します。

表で表の回数が21回以上(21回・22回・23回)の度数は \(2+1+1=4\) なので、実験全体の200セットに対して、

\[\color{red}{P=\frac{2+1+1}{200}=\frac{4}{200}=0.02}\]

手順④:有意水準と比べて判断する

(1) 有意水準を \(0.05\) とするとき:\(\color{red}{0.02<0.05}\) なので、\(H_0\) を棄却できます。

よって \(H_1\) が正しい、つまり「一般に新製品Bが好まれる」と判断してよいといえます。

(2) 有意水準を \(0.01\) とするとき:\(\color{red}{0.02\geq 0.01}\) なので、\(H_0\) を棄却できません。

よって「新製品Bが好まれる」とは判断できず、結論は保留となります。

生徒
生徒

同じデータなのに、有意水準を厳しくすると結論が変わるんですね!

さん
さん

そうなんだ。だから「どの有意水準で検定したか」をセットで述べることが大切だよ。

練習問題|水道水はおいしくなった?

例題2

ある地域の水道局が、水道水の品質改善に取り組んでいる。無作為に選んだ住民20人に、以前に比べて水道水がおいしくなったと感じるか回答してもらったところ、15人が「以前よりおいしくなった」と回答した。このデータから、水道水がおいしくなったと住民から評価されていると判断してよいか。有意水準を 0.05 として考えよ。ただし、公正なコインを20回投げて表の出た回数を記録する実験を200セット行ったところ、下の表のようになったとし、この結果を用いよ。

表の回数567891011121314151617
度数17232030353518207301200

考え方と解答

対立仮説 \(\color{deepskyblue}{H_1}\):水道水がおいしくなったと評価されている。

帰無仮説 \(\color{hotpink}{H_0}\):そう評価されているわけではなく、「おいしくなった」「そうでない」が等確率で選ばれる。

\(\color{hotpink}{H_0}\) のもとで「20人中15人以上がおいしくなったと回答する」確率を、コイン20回で表が15回以上出る割合で近似します。

表より、15回以上(15回・16回・17回)の度数は \(3+0+1=4\) なので、

\[\color{red}{P=\frac{3+0+1}{200}=\frac{4}{200}=0.02}\]

\(\color{red}{0.02<0.05}\) なので \(H_0\) を棄却できます。

よって、水道水はおいしくなったと評価されていると判断してよいといえます。

生徒
生徒

手順が同じだから、数字が変わっても迷わず解けました!

まとめ|仮説検定と有意水準

さん
さん

さて、今回のまとめだよ!

仮説検定と有意水準

仮説検定=データが「偶然(誤差)」か「必然」かを、確率を使って判定する手法。

有意水準=「偶然とは考えにくい」とみなす境界の確率(ふつう \(\color{red}{0.05}\)、慎重なら \(\color{red}{0.01}\))。

手順:① 主張=対立仮説 \(\color{deepskyblue}{H_1}\) → ② その否定=帰無仮説 \(\color{hotpink}{H_0}\) → ③ \(H_0\) のもとで確率 \(P\) を計算 → ④ \(P\) と有意水準を比較。

\(P<\)(有意水準)なら \(H_0\) を棄却して \(H_1\) を採用。そうでなければ判断は保留(\(H_0\) は「正しい」と認めたわけではない)。

生徒
生徒

「偶然か必然か」を確率で判断する。これでデータの分析もマスターだ!

↑前の記事↑

↑まとめページへ↑

コメント