Un ensemble de données peut être écrit dans deux formats différents : large et long . Un format large contient des valeurs qui ne se répètent pas dans la première colonne. Un format long contient des valeurs qui se répètent dans...
En statistiques, les cas font simplement référence aux individus dans un ensemble de données. Dans la plupart des ensembles de données, nous avons des cas (les individus) et des variables (les attributs des individus). Par exemple, l’ensemble de données suivant contient...
Vous pouvez utiliser l’argument cmap dans Matplotlib pour afficher facilement des images en niveaux de gris . L’exemple suivant montre comment utiliser cet argument dans la pratique. Exemple : afficher l’image en niveaux de gris dans Matplotlib Supposons que j’ai l’image suivante...
Le test de Kolmogorov-Smirnov est utilisé pour déterminer si un échantillon est normalement distribué ou non. Ce test est largement utilisé car de nombreux tests et procédures statistiques supposent que les données sont normalement distribuées. L’exemple étape par étape suivant montre...
La fonction scale() dans R peut être utilisée pour mettre à l’échelle les valeurs dans un vecteur, une matrice ou un bloc de données. Cette fonction utilise la syntaxe de base suivante : scale(x, center = TRUE, scale = TRUE) où: x...
Une erreur que vous pouvez rencontrer en Python est la suivante : TypeError:Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool] Cette erreur se produit généralement lorsque vous tentez de filtrer un DataFrame pandas en utilisant plusieurs conditions...
Centrer un ensemble de données signifie soustraire la valeur moyenne de chaque observation individuelle dans l’ensemble de données. Une fois que vous avez centré un ensemble de données, la valeur moyenne de l’ensemble de données devient nulle. Les exemples suivants montrent...
La formule de Spearman-Brown est utilisée pour prédire la fiabilité d’un test après avoir modifié la durée du test. La formule est : Fiabilité prévue = kr / (1 + (k-1)r) où: k : Facteur par lequel la durée du test...
La fonction split() dans R peut être utilisée pour diviser les données en groupes en fonction des niveaux de facteurs. Cette fonction utilise la syntaxe de base suivante : diviser(x, f, …) où: x : Nom du vecteur ou du bloc de...
Un test de Wald peut être utilisé pour tester si un ou plusieurs paramètres d’un modèle sont égaux à certaines valeurs. Ce test est souvent utilisé pour déterminer si une ou plusieurs variables prédictives dans un modèle de régression sont égales...