Comment créer un tableau de fréquence de plusieurs variables dans R
Pour calculer un tableau de fréquences pour plusieurs variables dans un bloc de données dans R, vous pouvez utiliser la fonction apply() , qui utilise la syntaxe suivante :
appliquer (X, MARGE AMUSANTE)
où:
- X : un tableau, une matrice ou un bloc de données
- MARGE : appliquer une fonction sur les lignes (1) ou les colonnes (2)
- FUN : La fonction à appliquer
Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.
Exemple 1 : Tableau de fréquence pour toutes les variables de R
Le code suivant montre comment calculer un tableau de fréquences pour chaque variable d’un bloc de données :
#create data frame df <- data.frame(var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #view first few rows of data frame head(df) var1 var2 var3 1 1 A 6 2 1 A 7 3 2 A 7 4 2 A 7 5 2 B 8 6 2 B 8 #calculate frequency table for every variable in data frame apply((df), 2, table) $var1 1 2 3 2 4 1 $var2 A B 4 3 $var3 6 7 8 9 1 3 2 1
Le résultat est trois tableaux de fréquences – un pour chaque variable de la trame de données.
Voici comment interpréter le premier tableau de fréquences :
- La valeur 1 apparaît 2 fois dans la colonne « var1 »
- La valeur 2 apparaît 4 fois dans la colonne « var2 »
- La valeur 3 apparaît 1 fois dans la colonne « var3 »
Les autres tableaux de fréquences peuvent être interprétés de la même manière.
Exemple 2 : Tableau de fréquence pour des variables spécifiques dans R
Le code suivant montre comment calculer un tableau de fréquence pour des variables spécifiques dans un bloc de données
#create data frame df <- data.frame(var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for var1 and var3 columns apply((df[c('var1', 'var3')]), 2, table) $var1 1 2 3 2 4 1 $var3 6 7 8 9 1 3 2 1
Exemple 3 : Tableau de fréquence pour toutes les variables sauf une dans R
Supposons que nous ayons une colonne d’index dans un bloc de données et que nous souhaitions calculer un tableau de fréquences pour chaque variable du bloc de données , à l’exception de la colonne d’index.
Le code suivant montre comment procéder :
#create data frame df <- data.frame(index=c(1, 2, 3, 4, 5, 6, 7), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for all columns except index column apply((df[-1]), 2, table) $var2 A B 4 3 $var3 6 7 8 9 1 3 2 1
Ressources additionnelles
Comment créer une table à deux voies dans R
Comment créer un histogramme de fréquence relative dans R