Hoe u een frequentietabel van meerdere variabelen in r maakt


Om een frequentietabel voor meerdere variabelen in een dataframe in R te berekenen, kunt u de functie apply() gebruiken, die de volgende syntaxis gebruikt:

toepassen (X, FUN-MARGE)

Goud:

  • X: een array, matrix of gegevensblok
  • MARGE: pas een functie toe op rijen (1) of kolommen (2)
  • FUN: De functie die moet worden toegepast

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Frequentietabel voor alle variabelen in R

De volgende code laat zien hoe u een frequentietabel berekent voor elke variabele in een dataframe:

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#view first few rows of data frame
head(df)

  var1 var2 var3
1 1 To 6
2 1 A 7
3 2 To 7
4 2 To 7
5 2 B 8
6 2 B 8

#calculate frequency table for every variable in data frame
apply((df), 2, table)

$var1

1 2 3 
2 4 1 

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Het resultaat zijn drie frequentietabellen – één voor elke variabele in het dataframe.

Zo interpreteert u de eerste frequentietabel:

  • De waarde 1 verschijnt tweemaal in de kolom “var1”.
  • De waarde 2 verschijnt 4 keer in de kolom “var2”.
  • De waarde 3 verschijnt 1 keer in de kolom “var3”.

De andere frequentietabellen kunnen op dezelfde manier worden geïnterpreteerd.

Voorbeeld 2: Frequentietabel voor specifieke variabelen in R

De volgende code laat zien hoe u een frequentietabel voor specifieke variabelen in een gegevensframe kunt berekenen

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for var1 and var3 columns
apply((df[c(' var1 ', ' var3 ')]), 2, table)

$var1

1 2 3 
2 4 1

$var3

6 7 8 9 
1 3 2 1

Voorbeeld 3: Frequentietabel voor op één na alle variabelen in R

Stel dat we een indexkolom in een dataframe hebben en we willen een frequentietabel berekenen voor elke variabele in het dataframe, behalve de indexkolom.

De volgende code laat zien hoe u dit doet:

 #create data frame
df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for all columns except index column
apply((df[-1]), 2, table)

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Aanvullende bronnen

Hoe u een tweerichtingstabel maakt in R
Hoe maak je een relatief frequentiehistogram in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert