notebook 001

notebook 001

INPUTとOUTPUTの個人的な備忘録です。

箱ひげ図や、分布(二項分布・正規分布・t分布・カイ二乗分布)のグラフで使用したPythonコード

Pythonでmatploblibを使ってグラフ作成

視覚的に理解するの大事!とmatplotlibパッケージを触っている。慣れてきたら、さらにそれを美しく簡単に描けるらしいseaborn(matplotlibベース)も触りたい。

 

箱ひげ図を描く

箱ひげ図を描いたときは、グラフの見出しも記載した。日本語表示につまづいた(後述)。

f:id:mkmkipy:20181004004644p:plain

 

import matplotlib.pyplot as plt

# A店:第1週の売上個数
A = [400, 520, 480, 390, 420, 490, 900]
# B店:第1週の売上個数
B = [520, 500, 530, 560, 490, 510, 530]
# 売上個数のタプル
counts = (A, B)

# 箱ひげ図
fig, ax = plt.subplots()

bp = ax.boxplot(counts)
ax.set_xticklabels(['店舗A', '店舗B'])

# タイトル, Y軸を指定
plt.title('7月第1週のケーキ販売個数')
plt.ylabel('販売個数')

# 描画
plt.show()

日本語表示が文字化けしたときの対応

こちらに。

mkmkipy.hatenablog.com

 

分布(二項分布・正規分布・t分布・カイ二乗分布)を描く

次はこの投稿で使用したグラフについて。

 

mkmkipy.hatenablog.com

 

scipy.statsモジュール

scipyにはstatsという統計関数をまとめたモジュールがあり、その公式リファレンスを写経するかのごとく、グラフを描いていった。

Statistical functions (scipy.stats) — SciPy v1.1.0 Reference Guide

  • scipy.stats.binom(二項分布)
  • scipy.stats.norm(正規分布)
  • scipy.stats.t(t分布)
  • scipy.stats.chi2(カイ二乗分布)

公式リファレンスでは、直接Callする場合と、分布に対するパラメータを与えたfrozen RV object(後で使いまわすのに便利)を作成する場合の、両方でグラフを描いている。以下のコードでは前者で。(Gistからの貼り付け↓※何も見えない場合はReloadしてみてください)。*1

 

  

scipy.statsのチュートリアルも参考にした。

Statistics (scipy.stats) — SciPy v1.1.0 Reference Guide

 

*1:どうでもよいことですが、なぜかはてなブログの「Gist貼り付け」がうまくいかないので、gist のソースの上にある Embed からコピーしてHTML編集にペースト。