Comment créer des tableaux de fréquences dans R (avec exemples)



Un tableau de fréquences est un tableau qui affiche les fréquences de différentes catégories. Ce type de tableau est particulièrement utile pour comprendre la distribution des valeurs dans un ensemble de données.

Ce didacticiel explique comment créer des tables de fréquences dans R à l’aide du bloc de données suivant :

#make this example reproducible
set.seed(0)

#create data frame 
df <- data.frame(store=rep(c('A', 'B', 'C'), each=3),
                 sales=round(runif(9, 2, 6), 0),
                 returns=round(runif(9, 1, 3), 0))

#view data frame 
df

  store sales returns
1     A     6       2
2     A     3       1
3     A     3       1
4     B     4       1
5     B     6       2
6     B     3       2
7     C     6       3
8     C     6       2
9     C     5       2

Tableaux de fréquences unidirectionnelles dans R

Le code suivant montre comment créer une table de fréquence unidirectionnelle dans R pour le magasin de variables :

#calculate frequency of each store
table(df$store)

A B C 
3 3 3 

Ce tableau nous dit simplement :

  • Le magasin A apparaît 3 fois dans le bloc de données.
  • Le magasin B apparaît 3 fois dans le bloc de données.
  • Le magasin C apparaît 3 fois dans le bloc de données.

Tableaux de fréquences bidirectionnels dans R

Le code suivant montre comment créer une table de fréquence bidirectionnelle dans R pour les variables store et sales :

#calculate two-way frequency table
table(df$store, df$sales)

    3 4 5 6
  A 2 0 0 1
  B 1 1 0 1
  C 0 0 1 2 

Ce tableau nous dit :

  • Le magasin A a réalisé 3 ventes à 2 occasions différentes.
  • Le magasin A a réalisé 4 ventes à 0 occasion.
  • Le magasin A a réalisé 5 ventes à 0 occasion.
  • Le magasin A a réalisé 1 vente à 1 reprises.

Et ainsi de suite.

Tableaux de fréquences à trois voies dans R

Le code suivant montre comment créer un tableau de fréquences à trois voies pour les trois variables de notre bloc de données :

#calculate three-way frequency table
table(df$store, df$sales, df$returns)

, ,  = 1

   
    3 4 5 6
  A 2 0 0 0
  B 0 1 0 0
  C 0 0 0 0

, ,  = 2

   
    3 4 5 6
  A 0 0 0 1
  B 1 0 0 1
  C 0 0 1 1

, ,  = 3

   
    3 4 5 6
  A 0 0 0 0
  B 0 0 0 0
  C 0 0 0 1 

Le premier tableau nous indique les ventes totales par magasin lorsque le nombre de retours était égal à 1. Le deuxième tableau nous indique les ventes totales par magasin lorsque le nombre de retours était égal à 2. Et le troisième tableau nous indique les ventes totales par stocker lorsque le nombre de retours était égal à 3.

Notez que R peut créer des tableaux de fréquences pour des dimensions encore plus élevées (par exemple, des tableaux de fréquences à 4 voies, des tableaux de fréquences à 5 voies), mais la sortie peut devenir assez importante pour des dimensions plus élevées.

En pratique, les tableaux de fréquences unidirectionnels et bidirectionnels sont le plus souvent utilisés.

Ressources additionnelles

Comment créer des tables dans R
Comment effectuer un test d’indépendance du chi carré dans R
Comment effectuer un test d’ajustement du chi carré dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *