Come contare i valori univoci in una colonna in r


È possibile utilizzare i seguenti metodi per contare il numero di valori univoci in una colonna di un frame di dati in R:

Metodo 1: utilizzare Base R

 length(unique(df$my_column))

Metodo 2: usa dplyr

 library (dplyr)

n_distinct(df$my_column)

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

Metodo 1: conta i valori univoci nella colonna utilizzando la base R

Il codice seguente mostra come contare il numero di valori univoci nella colonna dei punti del frame di dati utilizzando le funzioni di base R:

 #count unique values in points column
length(unique(df$points))

[1] 7

Ci sono 7 valori univoci nella colonna dei punti .

Per contare il numero di valori univoci in ciascuna colonna del data frame, possiamo utilizzare la funzione sapply() :

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

Dal risultato possiamo vedere:

  • Ci sono 7 valori univoci nella colonna dei punti .
  • Ci sono 4 valori univoci nella colonna della squadra .

Metodo 2: conta i valori univoci nella colonna utilizzando dplyr

Il codice seguente mostra come contare il numero di valori distinti nella colonna dei punti utilizzando la funzione n_distinct() del pacchetto dplyr:

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

Ci sono 7 valori univoci nella colonna dei punti .

Per contare il numero di valori univoci in ciascuna colonna del data frame, possiamo utilizzare la funzione sapply() :

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

Dal risultato possiamo vedere:

  • Ci sono 7 valori univoci nella colonna dei punti .
  • Ci sono 4 valori univoci nella colonna della squadra .

Si noti che questi risultati corrispondono a quelli del metodo base R.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come contare i duplicati in R
Come contare valori univoci per gruppo in R
Come contare il numero di valori NA in ciascuna colonna in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *