Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment centrer les données dans R (avec exemples)



Centrer un ensemble de données signifie soustraire la valeur moyenne de chaque observation individuelle dans l’ensemble de données.

Par exemple, supposons que nous ayons l’ensemble de données suivant :

Il s’avère que la valeur moyenne est de 14. Ainsi, pour centrer cet ensemble de données, nous soustrairions 14 à chaque observation individuelle :

Comment centrer les données

Notez que la valeur moyenne de l’ensemble de données centré est nulle.

Ce didacticiel fournit plusieurs exemples sur la manière de centrer les données dans R.

Exemple 1 : Centrer les valeurs d’un vecteur

Le code suivant montre comment utiliser la fonction scale() de la base R pour centrer les valeurs dans un vecteur :

#create vector
data <- c(4, 6, 9, 13, 14, 17, 18, 19, 19, 21)

#subtract the mean value from each observation in the vector
scale(data, scale=FALSE)

      [,1]
 [1,]  -10
 [2,]   -8
 [3,]   -5
 [4,]   -1
 [5,]    0
 [6,]    3
 [7,]    4
 [8,]    5
 [9,]    5
[10,]    7

attr(,"scaled:center")
[1] 14

Les valeurs résultantes sont les valeurs centrées de l’ensemble de données. La fonction scale() nous indique également que la valeur moyenne de l’ensemble de données est de 14.

Notez que la fonction scale() , par défaut, soustrait la moyenne de chaque observation individuelle, puis la divise par l’écart type.

En spécifiant scale=FALSE , nous disons à R de ne pas diviser par l’écart type.

Exemple 2 : centrer les colonnes dans un bloc de données

Le code suivant montre comment utiliser la fonction sapply() et la fonction scale() de la base R pour centrer les valeurs de chaque colonne d’un bloc de données :

#create data frame
df <- data.frame(x = c(1, 4, 5, 6, 6, 8, 9),
                 y = c(7, 7, 8, 8, 8, 9, 12),
                 z = c(3, 3, 4, 4, 6, 7, 7))

#center each column in the data frame
df_new <- sapply(df, function(x) scale(x, scale=FALSE))

#display data frame
df_new

              x          y          z
[1,] -4.5714286 -1.4285714 -1.8571429
[2,] -1.5714286 -1.4285714 -1.8571429
[3,] -0.5714286 -0.4285714 -0.8571429
[4,]  0.4285714 -0.4285714 -0.8571429
[5,]  0.4285714 -0.4285714  1.1428571
[6,]  2.4285714  0.5714286  2.1428571
[7,]  3.4285714  3.5714286  2.1428571

Nous pouvons vérifier que la moyenne de chaque colonne du nouveau bloc de données est égale à zéro en utilisant la fonction colMeans() :

colMeans(df_new)

            x             y             z 
 2.537653e-16 -2.537653e-16  3.806479e-16 

Les valeurs sont indiquées en notation scientifique, mais chaque valeur est essentiellement égale à zéro.

Ressources additionnelles

Comment faire la moyenne sur les colonnes dans R
Comment additionner des colonnes spécifiques dans R
Comment supprimer les valeurs aberrantes de plusieurs colonnes dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *