Comment créer des tableaux de fréquences relatives dans R
Un tableau de fréquence relative vous indique la fréquence à laquelle certaines valeurs d’un ensemble de données apparaissent par rapport au nombre total de valeurs de l’ensemble de données.
Vous pouvez utiliser la syntaxe de base suivante pour créer une table de fréquences dans R :
table(data)/length(data)
La fonction table() calcule la fréquence de chaque valeur de données individuelle et la fonction length() calcule le nombre total de valeurs dans l’ensemble de données.
Ainsi, en divisant chaque fréquence individuelle par la longueur de l’ensemble de données, nous obtenons la fréquence relative de chaque valeur de l’ensemble de données.
Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.
Exemple 1 : Tableau de fréquence relative pour un vecteur
Le code suivant montre comment créer une table de fréquence relative pour un seul vecteur dans R :
#define data data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C') #create relative frequency table table(data)/length(data) A B C 0.2 0.3 0.5
Voici comment interpréter le tableau :
- 20 % de toutes les valeurs de l’ensemble de données sont la lettre A
- 30 % de toutes les valeurs de l’ensemble de données sont la lettre B
- 50 % de toutes les valeurs de l’ensemble de données sont la lettre C
Exemple 2 : Tableau de fréquence relative pour une colonne de bloc de données
Le code suivant montre comment créer une table de fréquence relative pour une colonne d’un bloc de données dans R :
#define data frame df <- data.frame(team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), points=c(1, 2, 2, 2, 3, 3, 3, 3)) #view first few rows of data frame head(df) team wins points 1 A 2 1 2 A 9 2 3 A 11 2 4 A 12 2 5 A 15 3 6 B 17 3 #calculate relative frequency table for 'team' column table(df$team)/length(df$team) A B C 0.625 0.250 0.125
Exemple 3 : Tableau de fréquence relative pour toutes les colonnes du bloc de données
Le code suivant montre comment créer une table de fréquence relative pour chaque colonne d’un bloc de données dans R :
#define data frame df <- data.frame(team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), points=c(1, 2, 2, 2, 3, 3, 3, 3)) #calculate relative frequency table for each column sapply(df, function(x) table(x)/nrow(df)) $team x A B C 0.625 0.250 0.125 $wins x 2 9 11 12 15 17 18 19 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $points x 1 2 3 0.125 0.375 0.500
Ressources additionnelles
Comment créer des tableaux de fréquences dans R
Comment créer un tableau de fréquence de plusieurs variables dans R