Jak utworzyć tabele częstości względnych w r


Tabela częstości względnej informuje, jak często pewne wartości w zbiorze danych pojawiają się w stosunku do całkowitej liczby wartości w zbiorze danych.

Aby utworzyć tabelę częstości w R, możesz użyć następującej podstawowej składni:

 table(data)/length(data)

Funkcja table() oblicza częstotliwość każdej pojedynczej wartości danych, a funkcja długości() oblicza całkowitą liczbę wartości w zbiorze danych.

Zatem dzieląc każdą indywidualną częstotliwość przez długość zbioru danych, otrzymujemy względną częstotliwość każdej wartości w zbiorze danych.

Poniższe przykłady pokazują, jak używać tej składni w praktyce.

Przykład 1: Tabela częstości względnej wektora

Poniższy kod pokazuje, jak utworzyć tabelę częstości względnej dla pojedynczego wektora w R:

 #define data
data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C')

#create relative frequency table
table(data)/length(data)

  ABC
0.2 0.3 0.5

Oto jak interpretować tabelę:

  • 20% wszystkich wartości w zbiorze danych to litera A
  • 30% wszystkich wartości w zbiorze danych to litera B
  • 50% wszystkich wartości w zbiorze danych to litera C

Przykład 2: Tabela częstotliwości względnych dla kolumny ramki danych

Poniższy kod pokazuje, jak utworzyć tabelę częstotliwości względnych dla kolumny ramki danych w R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#view first few rows of data frame
head(df)

  team wins points
1 to 2 1
2 to 9 2
3 to 11 2
4 to 12 2
5 to 15 3
6 B 17 3

#calculate relative frequency table for 'team' column
table(df$team)/length(df$team)
 
    ABC
0.625 0.250 0.125

Przykład 3: Tabela częstotliwości względnych dla wszystkich kolumn w ramce danych

Poniższy kod pokazuje, jak utworzyć tabelę częstotliwości względnych dla każdej kolumny ramki danych w R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#calculate relative frequency table for each column
sapply(df, function (x) table(x)/nrow(df))

$team
x
    ABC
0.625 0.250 0.125 

$wins
x
    2 9 11 12 15 17 18 19 
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 

$points
x
    1 2 3 
0.125 0.375 0.500 

Dodatkowe zasoby

Jak tworzyć tabele częstości w R
Jak utworzyć tabelę częstości wielu zmiennych w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *