notebook 001

notebook 001

INPUTとOUTPUTの個人的な備忘録です。

検定いろいろ:あの二人付き合ってるよね~?

 

t検定やカイ二乗検定について。

まずは仮説検定とは

説明を読むと、帰無仮説?対立仮説?棄却?・・・裁判かよっ!と、どうにもとっつきにくいので超ざっくり考えた。

仮設検定とは:

  1. あの二人あやしいよね?付き合ってるよね?(対立仮説)
  2. 仮に付き合ってない帰無仮説としたら、その確率は?(かくかくしかじかな計算)
  3. 計算の結果、付き合ってない確率は0.05(5%)未満 → うわーやっぱりあやしい → 「付き合ってない」という考えを捨てる帰無仮説を棄却)
  4. つまり二人は付き合っているってことにしておこう(対立仮説を採用する)

雰囲気はつかめた気がする。(えっ!)

仮設検定とは、母集団について立てた仮説(帰無仮説)を捨てるか捨てないかを、母集団から抽出した標本(測定値)によって定めること。母集団から任意にn個のサンプルを選び分布を調べる。それが95%(※)の範囲の外にあれば、めったに有り得ないこととして、帰無仮説を捨てる。

※ここでは有意水準を0.05(5%)としたので95%。有意水準は一般的に0.05や0.01に設定する。

 

では逆に、95%の範囲内にあったらどうなるのか?

  • 「『仮定:付き合ってない』は、間違いというわけではない」とは言える
  • しかし、だからと言って「『仮定:付き合っていない』は正しい」ということではない

計算の結果めったにありえないことだったので、違っていることの立証はできる。但し、そうじゃなかったからといって、正しいことの立証はできない。それが統計的仮説検定。なんだそう。

t検定の考え方 | Logics of Blue

(↑ 補足:検定の非対称性を参照)

f:id:mkmkipy:20181004012713p:plain

t検定・t値・p値(有意確率)

先の例で、帰無仮説(棄却されることを期待される仮説)は「つきあってない」だったが、p値(有意確率)とは、帰無仮説が正しいと仮定したときに出る確率。p値が0.05(※有意水準)を下回るとき、仮説はありえないとされ、棄却される。p値は、t値から計算できる。このような検定をt検定という。

t検定 (Pythonを使ったデータ解析入門 3idea) | OpenBook

 

名前からもわかるように、元のデータが「正規分布」に従っている場合に、t値は「t分布」に従い、t検定が使える

t値やp値は、RやPython回帰分析を行った際、出力される。分析結果の確からしさを確認する目的で使う。

 

カイ二乗検定

カイ二乗検定 | Logics of Blue

今日の単語帳

  • 仮説検定:hypothesis testing
  • t検定:t test
  • カイ二乗検定:Chi-squared test
  • 有意水準:significance level
  • 有意確率:significance probability