Python で信頼区間をプロットする方法


信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。

このチュートリアルでは、 Seaborn 視覚化ライブラリを使用して Python でデータセットの信頼区間をプロットする方法を説明します。

lineplot() を使用した信頼区間のプロット

信頼区間をプロットする最初の方法は、lineplot() 関数を使用することです。これは、データセット内のすべてのデータ ポイントを線で結び、各ポイントの周囲の信頼帯を表示します。

 import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

#create some random data
np.random.seed(0)
x = np.random.randint(1, 10, 30)
y = x+np.random.normal(0, 1, 30)

#create lineplot
ax = sns.lineplot(x, y)

Python の信頼区間グラフ

デフォルトでは、lineplot() 関数は 95% 信頼区間を使用しますが、 ciコマンドで使用する信頼レベルを指定できます。

信頼水準が小さいほど、線の周りの信頼区間は狭くなります。たとえば、まったく同じデータセットに対する 80% 信頼区間は次のようになります。

 #create lineplot
ax = sns.lineplot(x, y, ci= 80 )

Seaborn を使用した Python の信頼区間

regplot() を使用した信頼区間のプロット

regplot() 関数を使用して信頼区間をプロットすることもできます。これにより、推定された回帰直線の周囲に信頼帯を持つデータ セットの散布図が表示されます。

 import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

#create some random data
np.random.seed(0)
x = np.random.randint(1, 10, 30)
y = x+np.random.normal(0, 1, 30)

#create regplot
ax = sns.regplot(x, y) 

Python での信頼区間を含む散布図

lineplot() と同様に、regplot() 関数はデフォルトで 95% 信頼区間に設定されますが、 ciコマンドで使用する信頼レベルを指定できます。

繰り返しになりますが、信頼水準が小さいほど、回帰直線付近の信頼区間は狭くなります。たとえば、まったく同じデータセットに対する 80% 信頼区間は次のようになります。

 #create regplot
ax = sns.regplot(x, y, ci= 80 )

Python での信頼区間のプロット

追加リソース

信頼区間とは何ですか?
Python で信頼区間を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です