Hoe relatieve frequentietabellen te maken in r
Een relatieve frequentietabel vertelt je hoe vaak bepaalde waarden in een dataset voorkomen ten opzichte van het totale aantal waarden in de dataset.
U kunt de volgende basissyntaxis gebruiken om een frequentietabel in R te maken:
table(data)/length(data)
De functie table() berekent de frequentie van elke individuele gegevenswaarde en de functie length() berekent het totale aantal waarden in de dataset.
Door elke individuele frequentie te delen door de lengte van de dataset, krijgen we de relatieve frequentie van elke waarde in de dataset.
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: Relatieve frequentietabel voor een vector
De volgende code laat zien hoe u een relatieve frequentietabel maakt voor een enkele vector in R:
#define data data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C') #create relative frequency table table(data)/length(data) ABC 0.2 0.3 0.5
Zo interpreteert u de tabel:
- 20% van alle waarden in de dataset zijn de letter A
- 30% van alle waarden in de dataset zijn de letter B
- 50% van alle waarden in de dataset zijn de letter C
Voorbeeld 2: Relatieve frequentietabel voor een dataframekolom
De volgende code laat zien hoe u een relatieve frequentietabel maakt voor een kolom van een gegevensframe in R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #view first few rows of data frame head(df) team wins points 1 to 2 1 2 to 9 2 3 to 11 2 4 to 12 2 5 to 15 3 6 B 17 3 #calculate relative frequency table for 'team' column table(df$team)/length(df$team) ABC 0.625 0.250 0.125
Voorbeeld 3: Relatieve frequentietabel voor alle kolommen in het dataframe
De volgende code laat zien hoe u een relatieve frequentietabel maakt voor elke kolom van een gegevensframe in R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #calculate relative frequency table for each column sapply(df, function (x) table(x)/nrow(df)) $team x ABC 0.625 0.250 0.125 $wins x 2 9 11 12 15 17 18 19 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $points x 1 2 3 0.125 0.375 0.500
Aanvullende bronnen
Hoe frequentietabellen te maken in R
Hoe maak je een frequentietabel van meerdere variabelen in R