Hoe relatieve frequentietabellen te maken in r


Een relatieve frequentietabel vertelt je hoe vaak bepaalde waarden in een dataset voorkomen ten opzichte van het totale aantal waarden in de dataset.

U kunt de volgende basissyntaxis gebruiken om een frequentietabel in R te maken:

 table(data)/length(data)

De functie table() berekent de frequentie van elke individuele gegevenswaarde en de functie length() berekent het totale aantal waarden in de dataset.

Door elke individuele frequentie te delen door de lengte van de dataset, krijgen we de relatieve frequentie van elke waarde in de dataset.

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Relatieve frequentietabel voor een vector

De volgende code laat zien hoe u een relatieve frequentietabel maakt voor een enkele vector in R:

 #define data
data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C')

#create relative frequency table
table(data)/length(data)

  ABC
0.2 0.3 0.5

Zo interpreteert u de tabel:

  • 20% van alle waarden in de dataset zijn de letter A
  • 30% van alle waarden in de dataset zijn de letter B
  • 50% van alle waarden in de dataset zijn de letter C

Voorbeeld 2: Relatieve frequentietabel voor een dataframekolom

De volgende code laat zien hoe u een relatieve frequentietabel maakt voor een kolom van een gegevensframe in R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#view first few rows of data frame
head(df)

  team wins points
1 to 2 1
2 to 9 2
3 to 11 2
4 to 12 2
5 to 15 3
6 B 17 3

#calculate relative frequency table for 'team' column
table(df$team)/length(df$team)
 
    ABC
0.625 0.250 0.125

Voorbeeld 3: Relatieve frequentietabel voor alle kolommen in het dataframe

De volgende code laat zien hoe u een relatieve frequentietabel maakt voor elke kolom van een gegevensframe in R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#calculate relative frequency table for each column
sapply(df, function (x) table(x)/nrow(df))

$team
x
    ABC
0.625 0.250 0.125 

$wins
x
    2 9 11 12 15 17 18 19 
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 

$points
x
    1 2 3 
0.125 0.375 0.500 

Aanvullende bronnen

Hoe frequentietabellen te maken in R
Hoe maak je een frequentietabel van meerdere variabelen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert