Comment créer des tableaux de fréquences relatives dans R



Un tableau de fréquence relative vous indique la fréquence à laquelle certaines valeurs d’un ensemble de données apparaissent par rapport au nombre total de valeurs de l’ensemble de données.

Vous pouvez utiliser la syntaxe de base suivante pour créer une table de fréquences dans R :

table(data)/length(data)

La fonction table() calcule la fréquence de chaque valeur de données individuelle et la fonction length() calcule le nombre total de valeurs dans l’ensemble de données.

Ainsi, en divisant chaque fréquence individuelle par la longueur de l’ensemble de données, nous obtenons la fréquence relative de chaque valeur de l’ensemble de données.

Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.

Exemple 1 : Tableau de fréquence relative pour un vecteur

Le code suivant montre comment créer une table de fréquence relative pour un seul vecteur dans R :

#define data
data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C')

#create relative frequency table
table(data)/length(data)

  A   B   C 
0.2 0.3 0.5 

Voici comment interpréter le tableau :

  • 20 % de toutes les valeurs de l’ensemble de données sont la lettre A
  • 30 % de toutes les valeurs de l’ensemble de données sont la lettre B
  • 50 % de toutes les valeurs de l’ensemble de données sont la lettre C

Exemple 2 : Tableau de fréquence relative pour une colonne de bloc de données

Le code suivant montre comment créer une table de fréquence relative pour une colonne d’un bloc de données dans R :

#define data frame
df <- data.frame(team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 points=c(1, 2, 2, 2, 3, 3, 3, 3))

#view first few rows of data frame
head(df)

  team wins points
1    A    2      1
2    A    9      2
3    A   11      2
4    A   12      2
5    A   15      3
6    B   17      3

#calculate relative frequency table for 'team' column
table(df$team)/length(df$team)
 
    A      B      C 
0.625  0.250  0.125

Exemple 3 : Tableau de fréquence relative pour toutes les colonnes du bloc de données

Le code suivant montre comment créer une table de fréquence relative pour chaque colonne d’un bloc de données dans R :

#define data frame
df <- data.frame(team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 points=c(1, 2, 2, 2, 3, 3, 3, 3))

#calculate relative frequency table for each column
sapply(df, function(x) table(x)/nrow(df))

$team
x
    A     B     C 
0.625 0.250 0.125 

$wins
x
    2     9    11    12    15    17    18    19 
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 

$points
x
    1     2     3 
0.125 0.375 0.500 

Ressources additionnelles

Comment créer des tableaux de fréquences dans R
Comment créer un tableau de fréquence de plusieurs variables dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *