Jak utworzyć tabelę i uwzględnić wartości na w r
Domyślnie funkcja table() w R tworzy tabelę wartości częstotliwości, ale nie uwzględnia częstotliwości wartości NA.
Można jednak użyć następujących metod, aby utworzyć tabelę i uwzględnić wartości NA:
Metoda 1: Utwórz tabelę i zawsze pokazuj liczbę wartości NA
table(df$my_column, useNA = " always ")
Metoda 2: Utwórz tabelę i wyświetl tylko liczbę wartości NA, jeśli takie istnieją
table(df$my_column, useNA = " ifany ")
Poniższe przykłady pokazują, jak zastosować każdą metodę w praktyce.
Przykład 1: Utwórz tabelę i zawsze wyświetlaj liczbę wartości NA
Załóżmy, że mamy następującą ramkę danych w R, która zawiera informacje o różnych koszykarzach:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(20, 25, 14, 18, 19, 12, 12, 15))
#view data frame
df
team points
1 to 20
2 to 25
3 to 14
4 to 18
5 B 19
6 B 12
7 B 12
8 B 15
Możemy użyć następującej składni, aby utworzyć tabelę częstotliwości wartości w kolumnie zespołu i wyświetlić liczbę wartości NA, niezależnie od tego, czy istnieją, czy nie:
#create frequency table of values in team column, including NA values
table(df$team, useNA = " always ")
AB <NA>
4 4 0
Należy zauważyć, że wynikowa tabela pokazuje, że w kolumnie zespołu ramki danych znajduje się 0 wartości NA.
Ponieważ użyliśmy argumentu useNA = „zawsze” , tabela nadal pokazywała liczbę wartości NA, nawet jeśli ich nie było.
Przykład 2: Utwórz tabelę i wyświetl tylko liczbę wartości NA, jeśli takie istnieją
Załóżmy jeszcze raz, że mamy w R następującą ramkę danych zawierającą informacje o różnych koszykarzach:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(20, 25, 14, 18, 19, 12, 12, 15))
#view data frame
df
team points
1 to 20
2 to 25
3 to 14
4 to 18
5 B 19
6 B 12
7 B 12
8 B 15
Możemy użyć poniższej składni, aby utworzyć tabelę częstotliwości wartości w kolumnie zespołu i wyświetlić tylko liczbę wartości NA, jeśli takie istnieją:
#create frequency table of values in team column, including NA values if any exist
table(df$team, useNA = " ifany ")
AB
4 4
Należy pamiętać, że wynikowa tabela pokazuje częstotliwość wartości „A” i „B” w kolumnie zespołu , ale nie pokazuje częstotliwości wartości NA, ponieważ ich nie ma.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w języku R:
Jak utworzyć tabelę dwukierunkową w R
Jak przekonwertować tablicę na macierz w R
Jak przekonwertować tabelę na ramkę danych w R