Python で信頼区間をプロットする方法
信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。
このチュートリアルでは、 Seaborn 視覚化ライブラリを使用して Python でデータセットの信頼区間をプロットする方法を説明します。
lineplot() を使用した信頼区間のプロット
信頼区間をプロットする最初の方法は、lineplot() 関数を使用することです。これは、データセット内のすべてのデータ ポイントを線で結び、各ポイントの周囲の信頼帯を表示します。
import numpy as np import seaborn as sns import matplotlib.pyplot as plt #create some random data np.random.seed(0) x = np.random.randint(1, 10, 30) y = x+np.random.normal(0, 1, 30) #create lineplot ax = sns.lineplot(x, y)
デフォルトでは、lineplot() 関数は 95% 信頼区間を使用しますが、 ciコマンドで使用する信頼レベルを指定できます。
信頼水準が小さいほど、線の周りの信頼区間は狭くなります。たとえば、まったく同じデータセットに対する 80% 信頼区間は次のようになります。
#create lineplot ax = sns.lineplot(x, y, ci= 80 )
regplot() を使用した信頼区間のプロット
regplot() 関数を使用して信頼区間をプロットすることもできます。これにより、推定された回帰直線の周囲に信頼帯を持つデータ セットの散布図が表示されます。
import numpy as np import seaborn as sns import matplotlib.pyplot as plt #create some random data np.random.seed(0) x = np.random.randint(1, 10, 30) y = x+np.random.normal(0, 1, 30) #create regplot ax = sns.regplot(x, y)
lineplot() と同様に、regplot() 関数はデフォルトで 95% 信頼区間に設定されますが、 ciコマンドで使用する信頼レベルを指定できます。
繰り返しになりますが、信頼水準が小さいほど、回帰直線付近の信頼区間は狭くなります。たとえば、まったく同じデータセットに対する 80% 信頼区間は次のようになります。
#create regplot ax = sns.regplot(x, y, ci= 80 )