Jak utworzyć tabelę częstości wielu zmiennych w r


Aby obliczyć tabelę częstości dla wielu zmiennych w ramce danych w R, możesz użyć funkcji Apply() , która wykorzystuje następującą składnię:

zastosuj (X, ZABAWNY MARGINES)

Złoto:

  • X: tablica, macierz lub blok danych
  • MARGINES: zastosuj funkcję w wierszach (1) lub kolumnach (2)
  • ZABAWA: Funkcja do zastosowania

Poniższe przykłady pokazują, jak używać tej składni w praktyce.

Przykład 1: Tabela częstości dla wszystkich zmiennych w R

Poniższy kod pokazuje, jak obliczyć tabelę częstości dla każdej zmiennej w ramce danych:

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#view first few rows of data frame
head(df)

  var1 var2 var3
1 1 To 6
2 1 A 7
3 2 To 7
4 2 To 7
5 2 B 8
6 2 B 8

#calculate frequency table for every variable in data frame
apply((df), 2, table)

$var1

1 2 3 
2 4 1 

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Rezultatem są trzy tabele częstości – po jednej dla każdej zmiennej w ramce danych.

Oto jak interpretować pierwszą tabelę częstości:

  • Wartość 1 pojawia się dwukrotnie w kolumnie „var1”.
  • Wartość 2 pojawia się 4 razy w kolumnie „var2”.
  • Wartość 3 pojawia się 1 raz w kolumnie „var3”.

Pozostałe tabele częstości można interpretować w ten sam sposób.

Przykład 2: Tabela częstości dla określonych zmiennych w R

Poniższy kod pokazuje, jak obliczyć tabelę częstości dla określonych zmiennych w ramce danych

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for var1 and var3 columns
apply((df[c(' var1 ', ' var3 ')]), 2, table)

$var1

1 2 3 
2 4 1

$var3

6 7 8 9 
1 3 2 1

Przykład 3: Tabela częstości dla wszystkich zmiennych z wyjątkiem jednej w R

Załóżmy, że mamy kolumnę indeksu w ramce danych i chcemy obliczyć tabelę częstości dla każdej zmiennej w ramce danych z wyjątkiem kolumny indeksu.

Poniższy kod pokazuje, jak to zrobić:

 #create data frame
df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for all columns except index column
apply((df[-1]), 2, table)

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Dodatkowe zasoby

Jak utworzyć tabelę dwukierunkową w R
Jak utworzyć histogram częstotliwości względnej w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *