はてなブログでの数式の書き方
q-qプロット
実務でデータ解析をしていると、二つのデータ間の分布の差を実データから直接比較したいといったことがあります。
つまり、平均や分散のような統計量だけ見ても違いがわかりづらく、統計検定をやってもうまく差が見えないような時でも何かしら分布間の違いの差を見て、解析のヒントにしたいといったような状況です。そんな泥臭い解析を想定してます。
そこで使用できるが、qq plotです。実際に使うコードはこちらです。
Pythonのstatsmodels.graphics.gofplots.qqplot_2samplesを使用します。
www.statsmodels.org
import statsmodels.api as sm import numpy as np import matplotlib.pyplot as plt from statsmodels.graphics.gofplots import qqplot_2samples x = np.random.normal(loc=8.5, scale=2.5, size=37) y = np.random.normal(loc=8.0, scale=3.0, size=37) pp_x = sm.ProbPlot(x) pp_y = sm.ProbPlot(y) qqplot_2samples(pp_x, pp_y) plt.show()
正規分布などを理論分布と仮定したqq plot
特に、正規分布を理論分布と仮定している場合は正規Q-Qプロットと呼ばれます。*1
以下のサイトを参考にしてください。
docs.scipy.org
統計的仮説検定をPythonで実装する Part.1
シミュレーションをやっていたので統計力学はできるのですが、
統計学は実際に使ったことがありませんでした。
なので、統計的仮説検定をPythonで実装していきたいと思います。
検定自体の詳細は良書がいくつもあると思うので、そちらにお任せします。
ここでは、簡単な考え方やポイント、コードを書いていきたいと思います。
(全て独学なので、間違い等あれば教えていただけると助かります)
使用時の注意点
帰無仮説を棄却できなかった時の「有意差がない」場合でも、「等しい」ということではありません。言えることとしては、実験などで得られた結果は「偶然でも十分起こる」程度ですという意味でしかありません。
具体的な検定について
*1:対立仮説が「母平均の差が0でない()」のような場合は両側検定、対立仮説が「母平均の差が0より大きい()」のような場合は片側検定になります。
*2:t分布の説明はこちらhttps://atarimae.biz/archives/14046
はてなブログの練習
引用をつける
>> << の中にコードを書くと自動で引用の形式になる。
ここは引用の文章