Jak utworzyć tabelę częstości wielu zmiennych w r
Aby obliczyć tabelę częstości dla wielu zmiennych w ramce danych w R, możesz użyć funkcji Apply() , która wykorzystuje następującą składnię:
zastosuj (X, ZABAWNY MARGINES)
Złoto:
- X: tablica, macierz lub blok danych
- MARGINES: zastosuj funkcję w wierszach (1) lub kolumnach (2)
- ZABAWA: Funkcja do zastosowania
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Tabela częstości dla wszystkich zmiennych w R
Poniższy kod pokazuje, jak obliczyć tabelę częstości dla każdej zmiennej w ramce danych:
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #view first few rows of data frame head(df) var1 var2 var3 1 1 To 6 2 1 A 7 3 2 To 7 4 2 To 7 5 2 B 8 6 2 B 8 #calculate frequency table for every variable in data frame apply((df), 2, table) $var1 1 2 3 2 4 1 $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Rezultatem są trzy tabele częstości – po jednej dla każdej zmiennej w ramce danych.
Oto jak interpretować pierwszą tabelę częstości:
- Wartość 1 pojawia się dwukrotnie w kolumnie „var1”.
- Wartość 2 pojawia się 4 razy w kolumnie „var2”.
- Wartość 3 pojawia się 1 raz w kolumnie „var3”.
Pozostałe tabele częstości można interpretować w ten sam sposób.
Przykład 2: Tabela częstości dla określonych zmiennych w R
Poniższy kod pokazuje, jak obliczyć tabelę częstości dla określonych zmiennych w ramce danych
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for var1 and var3 columns apply((df[c(' var1 ', ' var3 ')]), 2, table) $var1 1 2 3 2 4 1 $var3 6 7 8 9 1 3 2 1
Przykład 3: Tabela częstości dla wszystkich zmiennych z wyjątkiem jednej w R
Załóżmy, że mamy kolumnę indeksu w ramce danych i chcemy obliczyć tabelę częstości dla każdej zmiennej w ramce danych z wyjątkiem kolumny indeksu.
Poniższy kod pokazuje, jak to zrobić:
#create data frame df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for all columns except index column apply((df[-1]), 2, table) $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Dodatkowe zasoby
Jak utworzyć tabelę dwukierunkową w R
Jak utworzyć histogram częstotliwości względnej w R