Jak utworzyć tabele częstości względnych w r
Tabela częstości względnej informuje, jak często pewne wartości w zbiorze danych pojawiają się w stosunku do całkowitej liczby wartości w zbiorze danych.
Aby utworzyć tabelę częstości w R, możesz użyć następującej podstawowej składni:
table(data)/length(data)
Funkcja table() oblicza częstotliwość każdej pojedynczej wartości danych, a funkcja długości() oblicza całkowitą liczbę wartości w zbiorze danych.
Zatem dzieląc każdą indywidualną częstotliwość przez długość zbioru danych, otrzymujemy względną częstotliwość każdej wartości w zbiorze danych.
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Tabela częstości względnej wektora
Poniższy kod pokazuje, jak utworzyć tabelę częstości względnej dla pojedynczego wektora w R:
#define data data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C') #create relative frequency table table(data)/length(data) ABC 0.2 0.3 0.5
Oto jak interpretować tabelę:
- 20% wszystkich wartości w zbiorze danych to litera A
- 30% wszystkich wartości w zbiorze danych to litera B
- 50% wszystkich wartości w zbiorze danych to litera C
Przykład 2: Tabela częstotliwości względnych dla kolumny ramki danych
Poniższy kod pokazuje, jak utworzyć tabelę częstotliwości względnych dla kolumny ramki danych w R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #view first few rows of data frame head(df) team wins points 1 to 2 1 2 to 9 2 3 to 11 2 4 to 12 2 5 to 15 3 6 B 17 3 #calculate relative frequency table for 'team' column table(df$team)/length(df$team) ABC 0.625 0.250 0.125
Przykład 3: Tabela częstotliwości względnych dla wszystkich kolumn w ramce danych
Poniższy kod pokazuje, jak utworzyć tabelę częstotliwości względnych dla każdej kolumny ramki danych w R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #calculate relative frequency table for each column sapply(df, function (x) table(x)/nrow(df)) $team x ABC 0.625 0.250 0.125 $wins x 2 9 11 12 15 17 18 19 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $points x 1 2 3 0.125 0.375 0.500
Dodatkowe zasoby
Jak tworzyć tabele częstości w R
Jak utworzyć tabelę częstości wielu zmiennych w R