notebook 001

INPUTとOUTPUTの個人的な備忘録です。

緑本を読み始めました

統計学

GLMについて調べていたら、いろんな記事で参照されていたので読んでいます。

できれば1日1章ずつ気になった内容を備忘録していきたい。

第1章

ブラックボックスな統計解析の悪夢として、背景を理解せずに色々と数字をこねくり回して自分が正しいことを証明しがち。ここに書かれている、やってしまいがちな例はまた後で戻ってきて読み返したい。
線形予測子の構成要素の便宜的な説明。説明変数を伴わないものを切片。それ以外の係数を傾き。なるほどそういう説明方法が。
用語とその英訳がたっぷりあってとても参考になる。これ書き出したい。。

第2章

種子数のばらつきを近似するのにポワソン分布がよさげ、という仮定で。
なぜポアソン分布がよかったのか？
①データが非負の整数
②下限（＝0）はあるが上限がよくわからない
③この観測データでは平均と分散がだいたい等しい
最尤推定法とは、尤度なる「あてはまりの良さ」を表す統計量を最大にするパラメータを探そうとするパラメータ推定方法。
尤度関数はそのままでは扱いにくいので、対数変換した対数尤度関数を使ってパラメータを最尤推定する
「この統計モデリングではこういう理由でこの確率分布を使った」と、説明できるようになること。確率分布の選び方、着眼すべき点、この本で扱う確率分布の説明が纏められている。
複雑に見えるばらつきも、簡単な確率分布を混ぜ合わせることで対処できる。

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

作者: 久保拓弥
出版社/メーカー: 岩波書店
発売日: 2012/05/19
メディア: 単行本
購入: 16人クリック: 163回
この商品を含むブログ (29件) を見る