Jak tworzyć tabele częstości w r (z przykładami)
Tabela częstości to tabela, która wyświetla częstotliwości różnych kategorii. Ten typ tabeli jest szczególnie przydatny do zrozumienia rozkładu wartości w zbiorze danych.
W tym samouczku wyjaśniono, jak tworzyć tabele częstości w języku R przy użyciu następującej ramki danych:
#make this example reproducible set.seed(0) #create data frame df <- data.frame(store= rep (c(' A ', ' B ', ' C '), each = 3 ), sales= round (runif(9, 2, 6), 0 ), returns= round (runif(9, 1, 3), 0 )) #view data frame df store sales returns 1 to 6 2 2 to 3 1 3 to 3 1 4 B 4 1 5 B 6 2 6 B 3 2 7 C 6 3 8 C 6 2 9 C 5 2
Jednokierunkowe tablice częstości w R
Poniższy kod pokazuje, jak utworzyć jednokierunkową tabelę częstości w R dla magazynu zmiennych:
#calculate frequency of each store
table(df$store)
ABC
3 3 3
Ta tabela mówi nam po prostu:
- Sklep A pojawia się 3 razy w ramce danych.
- Sklep B pojawia się 3 razy w ramce danych.
- Sklep C pojawia się 3 razy w ramce danych.
Dwukierunkowe tablice częstotliwości w R
Poniższy kod pokazuje, jak utworzyć dwukierunkową tabelę częstotliwości w R dla zmiennych store i sales :
#calculate two-way frequency table
table(df$store, df$sales)
3 4 5 6
A 2 0 0 1
B 1 1 0 1
C 0 0 1 2
Ta tabela mówi nam:
- Sklep A miał 3 sprzedaże przy 2 różnych okazjach.
- Sklep A miał 4 sprzedaże przy 0 okazjach.
- Sklep A miał 5 sprzedaży przy 0 okazjach.
- Sklep A dokonał 1 sprzedaży przy 1 okazji.
I tak dalej.
Trójczynnikowe tablice częstości w R
Poniższy kod pokazuje, jak utworzyć trójczynnikową tabelę częstości dla trzech zmiennych w naszej ramce danych:
#calculate three-way frequency table
table(df$store, df$sales, df$returns)
, , = 1
3 4 5 6
A 2 0 0 0
B 0 1 0 0
C 0 0 0 0
, , = 2
3 4 5 6
A 0 0 0 1
B 1 0 0 1
C 0 0 1 1
, , = 3
3 4 5 6
A 0 0 0 0
B 0 0 0 0
C 0 0 0 1
Pierwsza tabela przedstawia całkowitą sprzedaż według sklepu, gdy liczba zwrotów była równa 1. Druga tabela przedstawia całkowitą sprzedaż według sklepu, gdy liczba zwrotów była równa 2. Trzecia tabela przedstawia całkowitą sprzedaż według store, gdy liczba zwrotów była równa 3.
Należy zauważyć, że R może tworzyć tabele częstości dla jeszcze wyższych wymiarów (np. 4-kierunkowe tablice częstości, 5-kierunkowe tablice częstości), ale dane wyjściowe mogą być dość duże w przypadku wyższych wymiarów.
W praktyce najczęściej stosuje się jednokierunkowe i dwukierunkowe tablice częstotliwości.
Dodatkowe zasoby
Jak tworzyć tabele w R
Jak wykonać test niezależności chi-kwadrat w R
Jak wykonać test dobroci dopasowania chi-kwadrat w R