Un barplot est utile pour visualiser les quantités de différentes variables catégorielles. Parfois, nous souhaitons créer un barplot qui visualise les quantités de variables catégorielles divisées en sous-groupes. Par exemple, nous souhaiterions peut-être visualiser les ventes totales de pop-corn et de...
En statistiques, un score z nous indique à combien d’écarts types une valeur donnée se trouve par rapport à la moyenne . Nous utilisons la formule suivante pour calculer un z-score : z = (X – μ) / σ où: X est...
En statistiques, l’ erreur absolue moyenne (MAE) est un moyen de mesurer la précision d’un modèle donné. Il est calculé comme suit : MAE = (1/n) * Σ|y je – x je | où: Σ : Un symbole grec qui signifie « somme » y...
En statistiques, une proportion de population fait référence à la fraction d’individus dans une population présentant une certaine caractéristique. Par exemple, supposons que 43,8 % des habitants d’une certaine ville soutiennent une nouvelle loi. La valeur 0,438 représente une proportion de...
Dans une distribution de fréquence, les limites de classe sont les valeurs qui séparent les classes. Nous utilisons les étapes suivantes pour calculer les limites de classe dans une distribution de fréquence : 1. Soustrayez la limite supérieure de la première classe...
Un histogramme est un graphique qui nous aide à visualiser la distribution des valeurs dans un ensemble de données. Il s’avère que le nombre de cases utilisées dans un histogramme peut avoir un impact énorme sur la façon dont nous interprétons...
L’asymétrie est une façon de décrire la symétrie d’une distribution. Une distribution est asymétrique si elle a une « queue » sur le côté gauche de la distribution : Une distribution est asymétrique à droite si elle a une « queue »...
La fonction pandas fillna() est utile pour remplir les valeurs manquantes dans les colonnes d’un pandas DataFrame. Ce didacticiel fournit plusieurs exemples d’utilisation de cette fonction pour remplir les valeurs manquantes pour plusieurs colonnes du DataFrame pandas suivant : import pandas as...
Un test de tendance Mann-Kendall est utilisé pour déterminer s’il existe ou non une tendance dans les données de séries chronologiques. Il s’agit d’un test non paramétrique, ce qui signifie qu’aucune hypothèse sous-jacente n’est formulée quant à la normalité des données....
Une carte thermique est un type de graphique qui utilise différentes nuances de couleurs pour représenter les valeurs des données. Ce didacticiel explique comment créer des cartes thermiques à l’aide de la bibliothèque de visualisation Python Seaborn avec l’ensemble de données...