同じ千葉県内で,北部の千葉市と南部の勝浦市では気温差はあるのだろうか。2011年の8月上旬(1日〜10日)の気温に差があるかどうかを調べてみよう。
パッと見では,北にある千葉市の方が,南にある勝浦市より気温が高いように見える。両市の気温には統計的に見て有意な差があるのかどうか,検定してみよう。
2011年8月上旬の千葉市と勝浦市の平均気温に違いがあるのか?
「千葉市の平均気温」と「勝浦市の平均気温」に差があるかどうかを知りたいので・・・
が同じかどうかを検定すればいい。なお,ここでは以下を前提としておく。
帰無仮説: 2011年8月上旬の千葉市と勝浦市の平均気温は等しい
対立仮説: 2011年8月上旬の千葉市と勝浦市の平均気温は等しくない
上の例では,セルA18に出力するように指定しているので,その場所に結果が出力される。あとでわからなくならないように,セルA17に「平均気温の差」と書いておこう。
「P(T<=t) 両側」を見ると,0.2041となっている。「0.2041 > 設定した有意水準(0.05) 」なので,帰無仮説は棄却されないということになる。
「平均値が等しい」という帰無仮説が「棄却されない」のだから,採択されるのは「帰無仮説」の方である。つまり「千葉市と勝浦市の平均気温に差があるとは言えない」ということになる。
データには「最高気温」と「最低気温」もあるので,これらについても検定してみよう。
「千葉市と勝浦市の気温 (2)」に進もう。
上の例では「データ分析」の中から「分散が等しくないと仮定した・・・」を選んだが,「データ分析」の中には「分散の検定(F検定)」も入っている。
一般的には,t検定を行う前にF検定を行って,「分散が等しくないと仮定した2標本による検定」を選ぶか「等分散を仮定した2標本による検定」を選ぶかを決める。
帰無仮説: 千葉市の平均気温の分散と勝浦市の平均気温の分散は等しい
対立仮説: 千葉市の平均気温の分散と勝浦市の平均気温の分散は等しくない
「P(F<=f) 片側」を見ると 0.109 である。「片側」を「両側」にするために2倍すると 0.218 となり,0.218 > 0.05(有意水準を5%として)なので,帰無仮説は棄却できない。つまり「分散が等しくないとは言えない」ということになる。
ということは,この例については「等分散を仮定した2標本による検定」でもよさそうだ,ということになる。もちろん,分散が「等しくないとは言えない」からといって「必ず等しい」とは限らない。