R: importa un file csv con nomi di colonne contenenti spazi
Se importi un file CSV in R che contiene nomi di colonne con spazi, R sostituirà automaticamente gli spazi con punti in modo che i nomi delle colonne abbiano nomi di variabili “validi”.
Se desideri importare il file CSV e mantenere gli spazi nei nomi delle colonne, devi utilizzare l’argomento check.names=FALSE come segue:
df <- read. csv (" my_data.csv ", check.names = FALSE )
Ciò importerà il file CSV in R e conserverà gli spazi nei nomi delle colonne.
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: importare un file CSV in R con nomi di colonne contenenti spazi
Supponiamo di avere il seguente file CSV chiamato basket.csv :
Tieni presente che nel file CSV sono presenti quattro nomi di colonne e due di esse contengono spazi nel nome.
Se utilizziamo la funzione read.csv() per importare questo file CSV, R sostituirà automaticamente gli spazi con punti:
#import CSV file
df <- read. csv (' basketball_data.csv ')
#view data frame
df
team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Si noti che i punti hanno sostituito gli spazi nei nomi di due colonne con spazi.
Se desideri importare il file CSV e preservare gli spazi nei nomi delle colonne, puoi utilizzare l’argomento check.names=FALSE come segue:
#import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )
#view data frame
df
team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Tieni presente che gli spazi sono stati mantenuti nei nomi di due colonne con spazi.
Tuttavia, tieni presente che se tenti di eseguire calcoli utilizzando questi nomi di colonna con spazi, devi racchiuderli tra virgolette singole (`), altrimenti riceverai un errore.
Ad esempio, se provi a calcolare la somma dei valori nella colonna dei punti contrassegnati senza utilizzare virgolette singole, riceverai un errore:
#attempt to calculate sum of points scored column
sum(df$points scored)
Error: unexpected symbol in "sum(df$points scored"
È invece necessario racchiudere il nome della colonna tra virgolette singole (`) come segue:
#calculate sum of points scored column
sum(df$`points scored`)
[1] 101
Tieni presente che questa volta non riceviamo un errore.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come leggere un CSV da un URL in R
Come unire più file CSV in R
Come leggere righe specifiche da un file CSV in R
Come esportare un dataframe in un file CSV in R