検定いろいろ:あの二人付き合ってるよね~?
t検定やカイ二乗検定について。
まずは仮説検定とは
説明を読むと、帰無仮説?対立仮説?棄却?・・・裁判かよっ!と、どうにもとっつきにくいので超ざっくり考えた。
仮設検定とは:
- あの二人あやしいよね?付き合ってるよね?(対立仮説)
- 仮に付き合ってない(帰無仮説)としたら、その確率は?(かくかくしかじかな計算)
- 計算の結果、付き合ってない確率は0.05(5%)未満 → うわーやっぱりあやしい → 「付き合ってない」という考えを捨てる(帰無仮説を棄却)
- つまり二人は付き合っているってことにしておこう(対立仮説を採用する)
雰囲気はつかめた気がする。(えっ!)
仮設検定とは、母集団について立てた仮説(帰無仮説)を捨てるか捨てないかを、母集団から抽出した標本(測定値)によって定めること。母集団から任意にn個のサンプルを選び分布を調べる。それが95%(※)の範囲の外にあれば、めったに有り得ないこととして、帰無仮説を捨てる。
※ここでは有意水準を0.05(5%)としたので95%。有意水準は一般的に0.05や0.01に設定する。
では逆に、95%の範囲内にあったらどうなるのか?
- 「『仮定:付き合ってない』は、間違いというわけではない」とは言える
- しかし、だからと言って「『仮定:付き合っていない』は正しい」ということではない
計算の結果めったにありえないことだったので、違っていることの立証はできる。但し、そうじゃなかったからといって、正しいことの立証はできない。それが統計的仮説検定。なんだそう。
(↑ 補足:検定の非対称性を参照)
t検定・t値・p値(有意確率)
先の例で、帰無仮説(棄却されることを期待される仮説)は「つきあってない」だったが、p値(有意確率)とは、帰無仮説が正しいと仮定したときに出る確率。p値が0.05(※有意水準)を下回るとき、仮説はありえないとされ、棄却される。p値は、t値から計算できる。このような検定をt検定という。
t検定 (Pythonを使ったデータ解析入門 3idea) | OpenBook
名前からもわかるように、元のデータが「正規分布」に従っている場合に、t値は「t分布」に従い、t検定が使える。
t値やp値は、RやPythonで回帰分析を行った際、出力される。分析結果の確からしさを確認する目的で使う。