Odp.: zaimportuj plik csv z nazwami kolumn zawierającymi spacje


Jeśli zaimportujesz do R plik CSV zawierający nazwy kolumn ze spacjami, R automatycznie zastąpi spacje kropkami, tak aby nazwy kolumn miały „poprawne” nazwy zmiennych.

Jeśli chcesz zaimportować plik CSV i zachować spacje w nazwach kolumn, musisz użyć argumentu check.names=FALSE w następujący sposób:

 df <- read. csv (" my_data.csv ", check.names = FALSE )

Spowoduje to zaimportowanie pliku CSV do R i zachowanie spacji w nazwach kolumn.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Zaimportuj plik CSV do R z nazwami kolumn zawierającymi spacje

Załóżmy, że mamy następujący plik CSV o nazwie koszykówka.csv :

Zwróć uwagę, że w pliku CSV znajdują się cztery nazwy kolumn, a dwie z nich zawierają spacje w nazwie.

Jeśli do zaimportowania tego pliku CSV użyjemy funkcji read.csv() , R automatycznie zastąpi spacje kropkami:

 #import CSV file
df <- read. csv (' basketball_data.csv ')

#view data frame
df

  team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Należy pamiętać, że kropki zastąpiły spacje w nazwach dwóch kolumn spacjami.

Jeśli chcesz zaimportować plik CSV i zachować spacje w nazwach kolumn, możesz użyć argumentu check.names=FALSE w następujący sposób:

 #import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )

#view data frame
df

  team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Należy pamiętać, że w nazwach dwóch kolumn ze spacjami zachowano spacje.

Należy jednak pamiętać, że jeśli spróbujesz wykonać obliczenia, używając nazw kolumn ze spacjami, musisz ująć je w pojedyncze cudzysłowy (`), w przeciwnym razie pojawi się błąd.

Przykładowo, jeśli spróbujesz obliczyć sumę wartości w kolumnie zaznaczonych punktów bez użycia cudzysłowu, pojawi się błąd:

 #attempt to calculate sum of points scored column
sum(df$points scored)

Error: unexpected symbol in "sum(df$points scored"

Zamiast tego należy ująć nazwę kolumny w pojedynczy cudzysłów (`) w następujący sposób:

 #calculate sum of points scored column
sum(df$`points scored`)

[1] 101

Pamiętaj, że tym razem nie otrzymamy błędu.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak odczytać plik CSV z adresu URL w R
Jak połączyć wiele plików CSV w R
Jak odczytać określone linie z pliku CSV w R
Jak wyeksportować ramkę danych do pliku CSV w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *