Come contare i valori univoci in una colonna in r
È possibile utilizzare i seguenti metodi per contare il numero di valori univoci in una colonna di un frame di dati in R:
Metodo 1: utilizzare Base R
length(unique(df$my_column))
Metodo 2: usa dplyr
library (dplyr)
n_distinct(df$my_column)
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))
#view data frame
df
team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22
Metodo 1: conta i valori univoci nella colonna utilizzando la base R
Il codice seguente mostra come contare il numero di valori univoci nella colonna dei punti del frame di dati utilizzando le funzioni di base R:
#count unique values in points column
length(unique(df$points))
[1] 7
Ci sono 7 valori univoci nella colonna dei punti .
Per contare il numero di valori univoci in ciascuna colonna del data frame, possiamo utilizzare la funzione sapply() :
#count unique values in each column
sapply(df, function (x) length(unique(x)))
team points
4 7
Dal risultato possiamo vedere:
- Ci sono 7 valori univoci nella colonna dei punti .
- Ci sono 4 valori univoci nella colonna della squadra .
Metodo 2: conta i valori univoci nella colonna utilizzando dplyr
Il codice seguente mostra come contare il numero di valori distinti nella colonna dei punti utilizzando la funzione n_distinct() del pacchetto dplyr:
library (dplyr)
#count unique values in points column
n_distinct(df$points)
[1] 7
Ci sono 7 valori univoci nella colonna dei punti .
Per contare il numero di valori univoci in ciascuna colonna del data frame, possiamo utilizzare la funzione sapply() :
library (dplyr)
#count unique values in each column
sapply(df, function (x) n_distinct(x))
team points
4 7
Dal risultato possiamo vedere:
- Ci sono 7 valori univoci nella colonna dei punti .
- Ci sono 4 valori univoci nella colonna della squadra .
Si noti che questi risultati corrispondono a quelli del metodo base R.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come contare i duplicati in R
Come contare valori univoci per gruppo in R
Come contare il numero di valori NA in ciascuna colonna in R