Comment utiliser la fonction colSums() dans R
La fonction colSums() dans R peut être utilisée pour calculer la somme des valeurs de chaque colonne d’une matrice ou d’un bloc de données dans R.
Cette fonction utilise la syntaxe de base suivante :
colSums(x, na.rm=FALSE)
où:
- x : Nom de la matrice ou du bloc de données.
- na.rm : s’il faut ignorer les valeurs NA. La valeur par défaut est FALSE.
Les exemples suivants montrent comment utiliser cette fonction dans la pratique.
Exemple 1 : utiliser colSums() avec Data Frame
Le code suivant montre comment utiliser colSums() pour trouver la somme des valeurs dans chaque colonne d’un bloc de données :
#create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
var2=c(7, 2, 5, 3, 2),
var3=c(3, 3, 6, 6, 8),
var4=c(1, 1, 2, 14, 9))
#view data frame
df
var1 var2 var3 var4
1 1 7 3 1
2 3 2 3 1
3 3 5 6 2
4 4 3 6 14
5 5 2 8 9
#find sum of each column
colSums(df)
var1 var2 var3 var4
16 19 26 27
Voici comment interpréter le résultat :
- La somme des valeurs dans la colonne ‘var1’ est 16 .
- La somme des valeurs dans la colonne ‘var2’ est 19 .
- La somme des valeurs dans la colonne ‘var3’ est 26 .
- La somme des valeurs dans la colonne ‘var4’ est 27 .
Exemple 2 : utilisez colSums() avec des valeurs NA dans le bloc de données
Le code suivant montre comment utiliser colSums() pour trouver la somme des valeurs dans chaque colonne d’un bloc de données lorsqu’il y a des valeurs NA dans certaines colonnes :
#create data frame with some NA values
df <- data.frame(var1=c(1, 3, 3, 4, 5),
var2=c(7, NA, NA, 3, 2),
var3=c(3, 3, 6, 6, 8),
var4=c(1, 1, 2, NA, 9))
#view data frame
df
var1 var2 var3 var4
1 1 7 3 1
2 3 NA 3 1
3 3 NA 6 2
4 4 3 6 NA
5 5 2 8 9
#find sum of each column
colSums(df, na.rm=TRUE)
var1 var2 var3 var4
16 12 26 13
Exemple 3 : utilisez colSums() avec des colonnes spécifiques
Le code suivant montre comment utiliser colSums() pour trouver la somme des valeurs dans des colonnes spécifiques d’un bloc de données :
#create data frame with some NA values
df <- data.frame(var1=c(1, 3, 3, 4, 5),
var2=c(7, NA, NA, 3, 2),
var3=c(3, 3, 6, 6, 8),
var4=c(1, 1, 2, NA, 9))
#view data frame
df
var1 var2 var3 var4
1 1 7 3 1
2 3 NA 3 1
3 3 NA 6 2
4 4 3 6 NA
5 5 2 8 9
#find sum of columns 1, 3, and 4
colSums(df[, c(1, 3, 4)], na.rm=TRUE)
var1 var3 var4
16 26 13
Ressources additionnelles
Comment additionner des colonnes spécifiques dans R (avec exemples)
Comment additionner des lignes spécifiques dans R (avec des exemples)