Frequentietabellen maken in r (met voorbeelden)
Een frequentietabel is een tabel die de frequenties van verschillende categorieën weergeeft. Dit type tabel is vooral handig om de verdeling van waarden in een dataset te begrijpen.
In deze zelfstudie wordt uitgelegd hoe u frequentietabellen in R kunt maken met behulp van het volgende dataframe:
#make this example reproducible set.seed(0) #create data frame df <- data.frame(store= rep (c(' A ', ' B ', ' C '), each = 3 ), sales= round (runif(9, 2, 6), 0 ), returns= round (runif(9, 1, 3), 0 )) #view data frame df store sales returns 1 to 6 2 2 to 3 1 3 to 3 1 4 B 4 1 5 B 6 2 6 B 3 2 7 C 6 3 8 C 6 2 9 C 5 2
Eenrichtingsfrequentietabellen in R
De volgende code laat zien hoe u een eenrichtingsfrequentietabel in R maakt voor het variabelenarchief :
#calculate frequency of each store
table(df$store)
ABC
3 3 3
Deze tabel vertelt ons eenvoudigweg:
- Winkel A verschijnt 3 keer in het dataframe.
- Winkel B verschijnt 3 keer in het dataframe.
- Winkel C verschijnt 3 keer in het dataframe.
Bidirectionele frequentietabellen in R
De volgende code laat zien hoe u een bidirectionele frequentietabel in R maakt voor de winkel- en verkoopvariabelen :
#calculate two-way frequency table
table(df$store, df$sales)
3 4 5 6
A 2 0 0 1
B 1 1 0 1
C 0 0 1 2
Deze tabel vertelt ons:
- Winkel A had 3 verkopen bij 2 verschillende gelegenheden.
- Winkel A had 4 verkopen in 0 gevallen.
- Winkel A had 5 verkopen in 0 gevallen.
- Winkel A heeft bij 1 gelegenheid 1 verkoop gedaan.
Enzovoort.
Driewegfrequentietabellen in R
De volgende code laat zien hoe u een driewegfrequentietabel maakt voor de drie variabelen in ons dataframe:
#calculate three-way frequency table
table(df$store, df$sales, df$returns)
, , = 1
3 4 5 6
A 2 0 0 0
B 0 1 0 0
C 0 0 0 0
, , = 2
3 4 5 6
A 0 0 0 1
B 1 0 0 1
C 0 0 1 1
, , = 3
3 4 5 6
A 0 0 0 0
B 0 0 0 0
C 0 0 0 1
De eerste tabel vertelt ons de totale omzet per winkel toen het aantal retourzendingen gelijk was aan 1. De tweede tabel vertelt ons de totale omzet per winkel toen het aantal retourzendingen gelijk was aan 2. En de derde tabel vertelt ons de totale omzet per winkel opslaan toen het aantal retourzendingen gelijk was aan 3.
Merk op dat R frequentietabellen kan maken voor nog hogere dimensies (bijvoorbeeld 4-weg frequentietabellen, 5-weg frequentietabellen), maar de output kan behoorlijk groot worden voor hogere dimensies.
In de praktijk worden meestal unidirectionele en bidirectionele frequentietabellen gebruikt.
Aanvullende bronnen
Tabellen maken in R
Hoe voer je een chi-kwadraat-onafhankelijkheidstest uit in R
Hoe voer je een chi-kwadraat goodness-of-fit test uit in R