Comment tracer un intervalle de confiance en Python



Un intervalle de confiance est une plage de valeurs susceptible de contenir un paramètre de population avec un certain niveau de confiance.

Ce didacticiel explique comment tracer un intervalle de confiance pour un ensemble de données en Python à l’aide de la bibliothèque de visualisation Seaborn .

Tracer des intervalles de confiance à l’aide de lineplot()

La première façon de tracer un intervalle de confiance consiste à utiliser lafonction lineplot() , qui relie tous les points de données d’un ensemble de données avec une ligne et affiche une bande de confiance autour de chaque point :

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

#create some random data
np.random.seed(0)
x = np.random.randint(1, 10, 30)
y = x+np.random.normal(0, 1, 30)

#create lineplot
ax = sns.lineplot(x, y)

Graphique de l'intervalle de confiance en Python

Par défaut, la fonction lineplot() utilise un intervalle de confiance de 95 % mais peut spécifier le niveau de confiance à utiliser avec la commande ci .

Plus le niveau de confiance est petit, plus l’intervalle de confiance autour de la ligne est étroit. Par exemple, voici à quoi ressemble un intervalle de confiance de 80 % pour exactement le même ensemble de données :

#create lineplot
ax = sns.lineplot(x, y, ci=80)

Intervalle de confiance en Python utilisant Seaborn

Tracer des intervalles de confiance à l’aide de regplot()

Vous pouvez également tracer des intervalles de confiance à l’aide de la fonction regplot() , qui affiche un nuage de points d’un ensemble de données avec des bandes de confiance autour de la droite de régression estimée :

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

#create some random data
np.random.seed(0)
x = np.random.randint(1, 10, 30)
y = x+np.random.normal(0, 1, 30)

#create regplot
ax = sns.regplot(x, y)

Nuage de points avec intervalle de confiance en Python

Semblable à lineplot(), la fonction regplot() utilise par défaut un intervalle de confiance de 95 % mais peut spécifier le niveau de confiance à utiliser avec la commande ci .

Encore une fois, plus le niveau de confiance est petit, plus l’intervalle de confiance sera étroit autour de la droite de régression. Par exemple, voici à quoi ressemble un intervalle de confiance de 80 % pour exactement le même ensemble de données :

#create regplot
ax = sns.regplot(x, y, ci=80)

Tracer l'intervalle de confiance en Python

Ressources additionnelles

Que sont les intervalles de confiance ?
Comment calculer les intervalles de confiance en Python

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *