Comment tracer un intervalle de confiance en Python
Un intervalle de confiance est une plage de valeurs susceptible de contenir un paramètre de population avec un certain niveau de confiance.
Ce didacticiel explique comment tracer un intervalle de confiance pour un ensemble de données en Python à l’aide de la bibliothèque de visualisation Seaborn .
Tracer des intervalles de confiance à l’aide de lineplot()
La première façon de tracer un intervalle de confiance consiste à utiliser lafonction lineplot() , qui relie tous les points de données d’un ensemble de données avec une ligne et affiche une bande de confiance autour de chaque point :
import numpy as np import seaborn as sns import matplotlib.pyplot as plt #create some random data np.random.seed(0) x = np.random.randint(1, 10, 30) y = x+np.random.normal(0, 1, 30) #create lineplot ax = sns.lineplot(x, y)
Par défaut, la fonction lineplot() utilise un intervalle de confiance de 95 % mais peut spécifier le niveau de confiance à utiliser avec la commande ci .
Plus le niveau de confiance est petit, plus l’intervalle de confiance autour de la ligne est étroit. Par exemple, voici à quoi ressemble un intervalle de confiance de 80 % pour exactement le même ensemble de données :
#create lineplot ax = sns.lineplot(x, y, ci=80)
Tracer des intervalles de confiance à l’aide de regplot()
Vous pouvez également tracer des intervalles de confiance à l’aide de la fonction regplot() , qui affiche un nuage de points d’un ensemble de données avec des bandes de confiance autour de la droite de régression estimée :
import numpy as np import seaborn as sns import matplotlib.pyplot as plt #create some random data np.random.seed(0) x = np.random.randint(1, 10, 30) y = x+np.random.normal(0, 1, 30) #create regplot ax = sns.regplot(x, y)
Semblable à lineplot(), la fonction regplot() utilise par défaut un intervalle de confiance de 95 % mais peut spécifier le niveau de confiance à utiliser avec la commande ci .
Encore une fois, plus le niveau de confiance est petit, plus l’intervalle de confiance sera étroit autour de la droite de régression. Par exemple, voici à quoi ressemble un intervalle de confiance de 80 % pour exactement le même ensemble de données :
#create regplot ax = sns.regplot(x, y, ci=80)
Ressources additionnelles
Que sont les intervalles de confiance ?
Comment calculer les intervalles de confiance en Python