Come verificare se esiste una colonna nel frame di dati in r


È possibile utilizzare i seguenti metodi per verificare se esiste una colonna in un frame di dati in R:

Metodo 1: controlla se il nome esatto della colonna esiste nel frame di dati

 ' this_column ' %in% names(df)

Metodo 2: controlla se esiste un nome di colonna parziale nel frame di dati

 any(grepl(' partial_name ', names(df)))

Metodo 3: controlla se nel frame di dati esistono più nomi di colonne esatti

 all(c(' this_column ', ' that_column ', ' another_column ') %in% names(df))

Questo tutorial spiega come utilizzare ciascun metodo nella pratica con il seguente frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 90 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

Esempio 1: controlla se il nome esatto della colonna esiste nel frame di dati

Il codice seguente mostra come verificare se il nome esatto della colonna “rimbalzi” esiste nel frame di dati:

 #check if exact column name 'rebounds' exists in data frame
' rebounds ' %in% names(df)

[1] TRUE

L’output restituisce TRUE .

Questo ci dice che il nome esatto della colonna “rimbalzi” esiste nel frame di dati.

Nota : questa sintassi fa distinzione tra maiuscole e minuscole. Ciò significa che se utilizzassimo “Rebounds”, riceveremmo un valore FALSE poiché il nome “Rebounds” con una lettera maiuscola non esiste nel frame di dati.

Esempio 2: controlla se esiste un nome di colonna parziale nel frame di dati

Il codice seguente mostra come verificare se il nome parziale della colonna “tea” esiste nel frame di dati:

 #check if partial column name 'tea' exists in data frame
any(grepl(' tea ', names(df)))

[1] TRUE

L’output restituisce TRUE .

Questo ci dice che il nome parziale della colonna “tea” esiste effettivamente nel frame di dati.

Esempio 3: controlla se nel frame di dati esistono più nomi di colonne esatti

Il codice seguente mostra come verificare se i nomi “team”, “punti” e “blocchi” esistono tutti nel frame di dati:

 #check if three column names all exist in data frame
all(c(' team ', ' points ', ' blocks ') %in% names(df))

[1] FALSE

L’output restituisce FALSE .

Questo ci dice che i tre nomi di colonna che abbiamo controllato non esistono tutti nel frame di dati.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come selezionare colonne contenenti una stringa specifica in R
Come rimuovere caratteri da una stringa in R
Come trovare la posizione del carattere in una stringa in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *