Un barplot est un type de graphique qui affiche les valeurs numériques de différentes variables catégorielles. Ce didacticiel explique comment créer des cartes thermiques à l’aide de la bibliothèque de visualisation Python Seaborn avec l’ensemble de données de conseils intégré : import...
Le moyen le plus simple d’obtenir une liste de valeurs uniques dans une colonne Pandas DataFrame est d’utiliser la fonction unique() . Ce didacticiel fournit plusieurs exemples d’utilisation de cette fonction avec le DataFrame pandas suivant : import pandas as pd #create...
Vous pouvez utiliser la syntaxe suivante pour supprimer les lignes contenant une certaine chaîne dans un DataFrame pandas : df[df["col"].str.contains("this string")==False] Ce tutoriel explique plusieurs exemples d’utilisation pratique de cette syntaxe avec le DataFrame suivant : import pandas as pd #create DataFrame df...
Vous pouvez utiliser la syntaxe suivante pour additionner les valeurs d’une colonne dans un DataFrame pandas en fonction d’une condition : df.loc[df['col1'] == some_value, 'col2'].sum() Ce tutoriel fournit plusieurs exemples d’utilisation pratique de cette syntaxe à l’aide du DataFrame pandas suivant : import...
Le théorème central limite stipule que la distribution d’échantillonnage d’une moyenne d’échantillon est approximativement normale si la taille de l’échantillon est suffisamment grande, même si la distribution de la population n’est pas normale . Pour appliquer le théorème central limite, quatre...
Un histogramme est un graphique qui nous aide à visualiser la distribution des valeurs dans un ensemble de données. L’axe des x d’un histogramme affiche des groupes de valeurs de données et l’axe des y nous indique combien d’observations dans un...
Un test d’indépendance du chi carré est utilisé pour déterminer s’il existe ou non une association significative entre deux variables catégorielles. Ce test utilise les hypothèses nulles et alternatives suivantes : H 0 : (hypothèse nulle) Les deux variables sont indépendantes. H...
Un biais de vérification se produit lorsque les données d’une étude sont collectées de telle sorte que certains membres d’une population sont plus susceptibles d’être inclus dans l’échantillon que d’autres. Cela peut donner lieu à des échantillons qui ne sont pas...
Un test de Chow est un test statistique développé par l’économiste Gregory Chow qui est utilisé pour tester si les coefficients de deux modèles de régression différents sur différents ensembles de données sont égaux. Le test de Chow est généralement utilisé...
Un test de Chow est utilisé pour tester si les coefficients de deux modèles de régression différents sur des ensembles de données différents sont égaux. Ce test est généralement utilisé dans le domaine de l’économétrie avec des données de séries chronologiques...