Comment créer un tableau de fréquence de plusieurs variables dans R



Pour calculer un tableau de fréquences pour plusieurs variables dans un bloc de données dans R, vous pouvez utiliser la fonction apply() , qui utilise la syntaxe suivante :

appliquer (X, MARGE AMUSANTE)

où:

  • X : un tableau, une matrice ou un bloc de données
  • MARGE : appliquer une fonction sur les lignes (1) ou les colonnes (2)
  • FUN : La fonction à appliquer

Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.

Exemple 1 : Tableau de fréquence pour toutes les variables de R

Le code suivant montre comment calculer un tableau de fréquences pour chaque variable d’un bloc de données :

#create data frame
df <- data.frame(var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#view first few rows of data frame
head(df)

  var1 var2 var3
1    1    A    6
2    1    A    7
3    2    A    7
4    2    A    7
5    2    B    8
6    2    B    8

#calculate frequency table for every variable in data frame
apply((df), 2, table)

$var1

1 2 3 
2 4 1 

$var2

A B 
4 3 

$var3

6 7 8 9 
1 3 2 1

Le résultat est trois tableaux de fréquences – un pour chaque variable de la trame de données.

Voici comment interpréter le premier tableau de fréquences :

  • La valeur 1 apparaît 2 fois dans la colonne « var1 »
  • La valeur 2 apparaît 4 fois dans la colonne « var2 »
  • La valeur 3 apparaît 1 fois dans la colonne « var3 »

Les autres tableaux de fréquences peuvent être interprétés de la même manière.

Exemple 2 : Tableau de fréquence pour des variables spécifiques dans R

Le code suivant montre comment calculer un tableau de fréquence pour des variables spécifiques dans un bloc de données

#create data frame
df <- data.frame(var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for var1 and var3 columns
apply((df[c('var1', 'var3')]), 2, table)

$var1

1 2 3 
2 4 1

$var3

6 7 8 9 
1 3 2 1

Exemple 3 : Tableau de fréquence pour toutes les variables sauf une dans R

Supposons que nous ayons une colonne d’index dans un bloc de données et que nous souhaitions calculer un tableau de fréquences pour chaque variable du bloc de données , à l’exception de la colonne d’index.

Le code suivant montre comment procéder :

#create data frame
df <- data.frame(index=c(1, 2, 3, 4, 5, 6, 7),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for all columns except index column
apply((df[-1]), 2, table)

$var2

A B 
4 3 

$var3

6 7 8 9 
1 3 2 1

Ressources additionnelles

Comment créer une table à deux voies dans R
Comment créer un histogramme de fréquence relative dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *