Come verificare se esiste una colonna nel frame di dati in r
È possibile utilizzare i seguenti metodi per verificare se esiste una colonna in un frame di dati in R:
Metodo 1: controlla se il nome esatto della colonna esiste nel frame di dati
' this_column ' %in% names(df)
Metodo 2: controlla se esiste un nome di colonna parziale nel frame di dati
any(grepl(' partial_name ', names(df)))
Metodo 3: controlla se nel frame di dati esistono più nomi di colonne esatti
all(c(' this_column ', ' that_column ', ' another_column ') %in% names(df))
Questo tutorial spiega come utilizzare ciascun metodo nella pratica con il seguente frame di dati:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(33, 28, 31, 39, 34),
rebounds=c(30, 28, 24, 24, 28))
#view data frame
df
team points assists rebounds
1 A 99 33 30
2 B 90 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28
Esempio 1: controlla se il nome esatto della colonna esiste nel frame di dati
Il codice seguente mostra come verificare se il nome esatto della colonna “rimbalzi” esiste nel frame di dati:
#check if exact column name 'rebounds' exists in data frame ' rebounds ' %in% names(df) [1] TRUE
L’output restituisce TRUE .
Questo ci dice che il nome esatto della colonna “rimbalzi” esiste nel frame di dati.
Nota : questa sintassi fa distinzione tra maiuscole e minuscole. Ciò significa che se utilizzassimo “Rebounds”, riceveremmo un valore FALSE poiché il nome “Rebounds” con una lettera maiuscola non esiste nel frame di dati.
Esempio 2: controlla se esiste un nome di colonna parziale nel frame di dati
Il codice seguente mostra come verificare se il nome parziale della colonna “tea” esiste nel frame di dati:
#check if partial column name 'tea' exists in data frame any(grepl(' tea ', names(df))) [1] TRUE
L’output restituisce TRUE .
Questo ci dice che il nome parziale della colonna “tea” esiste effettivamente nel frame di dati.
Esempio 3: controlla se nel frame di dati esistono più nomi di colonne esatti
Il codice seguente mostra come verificare se i nomi “team”, “punti” e “blocchi” esistono tutti nel frame di dati:
#check if three column names all exist in data frame all(c(' team ', ' points ', ' blocks ') %in% names(df)) [1] FALSE
L’output restituisce FALSE .
Questo ci dice che i tre nomi di colonna che abbiamo controllato non esistono tutti nel frame di dati.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come selezionare colonne contenenti una stringa specifica in R
Come rimuovere caratteri da una stringa in R
Come trovare la posizione del carattere in una stringa in R