2018-11-24 統計にまつわる類義語をまとめる 統計学 いろいろと本を読んでいて混乱するのが、統計学にまつわる用語、同じモノを指す・結果的に同じものを指しているのだけど、違う言葉を使っていることが多いこと。。。 続きを読む
2018-11-16 Kafka (Confluent) インストールと動作確認 Kafka Linux環境にKafka (Confluent) インストール。 クラスタは組まず、お試し構成。1台で。 続きを読む
2018-10-27 線形回帰をstatsmodelsで実行・2回目(簡略な書き方編) 統計学 Python 機械学習 statsmodelsとscikit-learn Pythonで機械学習といえばscikit-learn。ですが、まずは統計学寄りのstatsmodelから触ってみる。statsmodelは予測モデルの表示に加えて、その名の通り、統計的な情報、例えば検定結果も計算して表示する。t値とかp値とか。 Webの情報を探すのに疲れてきたので、Python本を購入。 そしたら、前回の内容よりも、短く書けるやり方が分かったので、書き直した。「切片が必要だったら書くべし」という、前回のおまじないのような一文も不要。 続きを読む
2018-10-17 線形回帰をstatsmodelsで実行。scikit-learnの結果と比べてみる。 統計学 Python 機械学習 statsmodelsとscikit-learn Pythonで機械学習といえばscikit-learn。ですが、まずは統計学寄りのstatsmodelから触ってみる。statsmodelは予測モデルの表示に加えて、その名の通り、統計的な情報、例えば検定結果も計算して表示する。t値とかp値とか。 scikit-learnの実行例があったので、それと同じことをstatsmodelで書いて、結果(=予測モデル)が一致するかどうかを確認する。 続きを読む
2018-10-07 箱ひげ図や、分布(二項分布・正規分布・t分布・カイ二乗分布)のグラフで使用したPythonコード Python Pythonでmatploblibを使ってグラフ作成 視覚的に理解するの大事!とmatplotlibパッケージを触っている。慣れてきたら、さらにそれを美しく簡単に描けるらしいseaborn(matplotlibベース)も触りたい。 続きを読む
2018-10-06 PythonとJupyter Notebook環境をWindows10にセットアップ。文字化け対応も。 機械学習 Python PythonとJupyter Notebook環境をWindows10にセットアップする。 続きを読む