Souvent, vous souhaiterez peut-être remplacer les valeurs dans une ou plusieurs colonnes d’un DataFrame pandas. Heureusement, cela est facile à faire en utilisant la fonction .replace() . Ce tutoriel fournit plusieurs exemples d’utilisation pratique de cette fonction sur le DataFrame suivant :...
Souvent, en statistiques, nous souhaitons tester si une hypothèse est vraie ou non concernant un paramètre de population . Par exemple, nous pourrions supposer que le poids moyen d’une certaine population de tortues est de 300 livres. Pour déterminer si cette...
Souvent, vous souhaiterez peut-être sélectionner les lignes d’un DataFrame pandas en fonction de leur valeur d’index. Si vous souhaitez sélectionner des lignes basées sur une indexation entière, vous pouvez utiliser la fonction .iloc . Si vous souhaitez sélectionner des lignes en...
Souvent, vous souhaiterez peut-être trouver la valeur maximale par groupe dans un DataFrame pandas. Heureusement, cela est facile à faire en utilisant les fonctions groupby() et max() avec la syntaxe suivante : df.groupby('column_name').max() Ce tutoriel explique plusieurs exemples d’utilisation pratique de cette...
Un plan de panel à décalage croisé est un type de modèle d’équation structurelle qui mesure deux variables différentes à deux moments précis. Par exemple, supposons que nous mesurions le montant total dépensé pour l’éducation et le revenu médian des ménages...
Lorsque deux ensembles de données sont de longueur égale et que chaque observation d’un ensemble de données peut être « jumelée » à une observation d’un autre ensemble de données, nous appelons cela des données appariées . Pour que deux ensembles...
L’interpolation est le processus d’estimation d’une valeur inconnue d’une fonction entre deux valeurs connues. Étant donné deux valeurs connues (x 1 , y 1 ) et (x 2 , y 2 ), nous pouvons estimer la valeur y pour un point...
Il arrive souvent que vous ayez une ou plusieurs valeurs manquantes dans une série dans Excel que vous souhaiteriez remplir. Le moyen le plus simple de remplir les valeurs manquantes consiste à utiliser la fonction Remplir la série dans la section...
L’ écart type relatif est une mesure de l’écart type de l’échantillon par rapport à la moyenne de l’échantillon pour un ensemble de données donné. Il est calculé comme suit : Écart type relatif = s/ x * 100 % où: s : écart type...
Le test de White est utilisé pour déterminer si l’hétéroscédasticité est présente dans un modèle de régression. L’hétéroscédasticité fait référence à la dispersion inégale des résidus à différents niveaux d’une variable de réponse dans un modèle de régression, ce qui viole...