「仮説を検証し母集団を調べる 検定・推定超入門」の自分用メモ。メインテーマは、χ^2分布とF分布を使った検定。
身近な問題で理解するために、通りを歩く男女比とかの検定も行なってみました。
母集団から標本を選ぶ方法
検定とは関係ないけど標本抽出方法もメモ。
単純無作為抽出法
母集団全体から無作為に標本を選ぶ方法。理論的には優れているが、実際問題として、母集団が多岐に渡るときに正しく標本を選ぶのが難しい。
集落抽出法
いくつかの調査単位の集落(集まり)を抽出単位として抽出する方法。
例:50人の生徒から5人を選ぶ場合に、5人ごとの集落を10個作り、その中から1つの集落を選び出す。
二段抽出法
単純無作為抽出法と二弾抽出法のいいとこ取り。
例:50人の生徒から5人を選ぶ場合に、10人の集落を5つ作り、集落1つを選ぶ。その集落の中から、さらに無作為に5人を選ぶ。
層化抽出法
二段抽出法をさらに発展させたもの。集落ごとに何らかの特性が現れるような区切り方をする方法。
例:50人の生徒から5人を選ぶ場合に、成績の良い順に10人ずつの集落に区切り、5個の集落を作る。その上で、それぞれの集落から1人ずつ選ぶ。
層化抽出法のポイントは、「代表性の高い標本を選びたい場合は、集落内の分散を小さくし、集落間の分散を大きくすること」という点です。
正規分布を標準化する
正規分布を標準化すると色々と計算が楽になる。標準化するとは、「平均が0になるように分布を横に平行移動」して、「分散が1になるように横幅を調整」すること。
(変換前のデータ - 平均値) / 標準偏差
式としてはこれだけ。
母集団の分散の求め方
母分散は標本分散よりも少し小さくなる。この小ささ(偏り)を調整したものを不偏分散と呼ぶ。
普通の分散 = 偏差平方和 / データの個数
不偏分散 = 偏差平方和 / (データの個数 - 1)
(データの個数 - 1)を自由度と言います。
偏差平方和を求めるために標本平均を使うことがこの誤差の元になっています。もし母平均を使っていればこの誤差は発生しないです。
標本の分布はt分布
小さな標本を元に母分散が分かっていない母集団の平均値を推定するときに使う。
標本平均の分布がt分布であり、t分布の平均=母集団の平均、t分布の標準偏差=母集団の標準偏差の1/√nとなる。
t分布で解ける例題
通常は200ml入っている飲み物があります。2杯注文したところ、機械の誤差によりそれぞれ194mlと208mlでした。この注文結果から、この飲み物の平均の量が200mlであるか調べてみましょう。
平均値 = (194 + 208) / 2 = 201
不偏分散 = ( (194 - 201)^2 + (208 - 201)^2 ) / (2 - 1) = 98
標準偏差 = √98 = 9.89
t = (標本平均 - 検定する母平均) / (標準偏差 / √標本数)
= (201 - 200) / (9.89 / √2) = 0.14
t分布表の自由度1、5%点 = 12.71
t = 0.14 < 12.71
よって、偶然この結果になる確率が5%以上あるので、平均値が200mlかどうかは分からない。標本数を増やすと違う結果になるかもしれない。
という結論になる。最後の結果の解釈がちょっと曖昧なので間違ってたら教えてください(^^)
通りを歩く男女の偏りを知るにはχ^2分布
χ^2分布は標本分散に関する分布。色々な検定に汎用的に使える便利な分布。
χ^2 = ( (期待値 - 実現値)^2 / 期待値 ) の総和
χ^2分布は具体例を見ると分かりやすいです。
通りを歩く男女の割合が偏っているかどうか
六本木通りを歩く10人の男女を観察したところ、8人が女性で2人が男性でした。日本人の男女比はほぼ半々のはずです。この六本木通りの男女比の偏りはその時の偶然でしょうか? それとも、六本木通り沿いには人口平均よりも女性が多くいるのでしょうか?
データ | 期待値 | 食い違い | |
女 | 8 | 5 | 3 |
男 | 2 | 5 | -3 |
χ^2 = 3^2 / 5 + (-3)^2 / 5 = 3.6
自由度 = 取りうる値は男、女の二通り = 1
χ^2分布表における自由度1、5%点 = 3.84
3.6 < 3.84
よって、偶然この結果になる確率が5%以上あるので、六本木通りには女性が多いとは言えない。
仮に、20人中女性が16人だったとする。割合だけを見ると、前回と同じで8割が女性。この結果も偶然と言えるだろうか?
データ | 期待値 | 食い違い | |
女 | 16 | 10 | 6 |
男 | 4 | 10 | -6 |
χ^2 = 6^2 / 10 + (-6)^2 / 10 = 7.2
自由度 = 取りうる値は男、女の二通り = 1
χ^2分布表における自由度1、5%点 = 3.84
7.2 > 3.84
よって、偶然この結果になる可能性は5%以下なので、六本木通りには女性が多いと言える。
このように、割合が同じだったとしても異なる検定結果になります。この差は、「3打数1安打のバッターと300打数100安打のバッターでは価値が違うよね」ということを表していることになります。
分散の比の分布を知るにはF分布
χ^2分布は標本分散そのものの分布でした。F分布は標本分散の比に関する分布です。
説明よりも例題を見た方が分かりやすいと思うので例題を書きます。
時計Aと時計Bの精度はどちらが良いか
時計Aは最大で1日あたり30秒ずれます。時計Bは最大で1日あたり15秒ずれます。しかし、ずれる秒数の平均値は時計Aも時計Bも同じです。この時、時計Aの方が精度の悪い時計だと言えるのでしょうか?
1日目 | 2日目 | 3日目 | 4日目 | 5日目 | 平均 | |
時計A | -30秒 | 0秒 | +10秒 | -10秒 | +30秒 | 0 |
時計B | 0秒 | +10秒 | -15秒 | +5秒 | 0 |
※プラスの数字=遅れた秒数、マイナスの数字=早すぎた秒数、です。
時計Aの普遍分散 = ( (秒数 - 平均)^2 の総和 ) / 自由度(=4) = 500
時計Bの普遍分散 = ( (秒数 - 平均)^2 の総和 ) / 自由度(=4) = 116.7
F = 時計Aの不偏分散 / 時計Bの不偏分散 = 500 / 116.7 = 4.28
F表における分子の自由度4、分母の自由度4の2.5%点 = 15.1
4.28 < 15.1
よって、偶然この結果になる可能性が5%以上あるので、時計Aの方が時計Bよりも精度が悪いとは言えない。
まとめ
本の内容はまだまだ区間推定の話とかが続くのですが、記事が長くなってきたので一旦ここまで。
書籍の内容通りに進んでいますが、例題は私が改変しています。書籍内の例題はもっと真面目で分かりやすいものになっているので、気になる方はぜひ購入してみてください。
参考書籍