Odp.: zaimportuj plik csv z nazwami kolumn zawierającymi spacje
Jeśli zaimportujesz do R plik CSV zawierający nazwy kolumn ze spacjami, R automatycznie zastąpi spacje kropkami, tak aby nazwy kolumn miały „poprawne” nazwy zmiennych.
Jeśli chcesz zaimportować plik CSV i zachować spacje w nazwach kolumn, musisz użyć argumentu check.names=FALSE w następujący sposób:
df <- read. csv (" my_data.csv ", check.names = FALSE )
Spowoduje to zaimportowanie pliku CSV do R i zachowanie spacji w nazwach kolumn.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Zaimportuj plik CSV do R z nazwami kolumn zawierającymi spacje
Załóżmy, że mamy następujący plik CSV o nazwie koszykówka.csv :
Zwróć uwagę, że w pliku CSV znajdują się cztery nazwy kolumn, a dwie z nich zawierają spacje w nazwie.
Jeśli do zaimportowania tego pliku CSV użyjemy funkcji read.csv() , R automatycznie zastąpi spacje kropkami:
#import CSV file
df <- read. csv (' basketball_data.csv ')
#view data frame
df
team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Należy pamiętać, że kropki zastąpiły spacje w nazwach dwóch kolumn spacjami.
Jeśli chcesz zaimportować plik CSV i zachować spacje w nazwach kolumn, możesz użyć argumentu check.names=FALSE w następujący sposób:
#import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )
#view data frame
df
team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Należy pamiętać, że w nazwach dwóch kolumn ze spacjami zachowano spacje.
Należy jednak pamiętać, że jeśli spróbujesz wykonać obliczenia, używając nazw kolumn ze spacjami, musisz ująć je w pojedyncze cudzysłowy (`), w przeciwnym razie pojawi się błąd.
Przykładowo, jeśli spróbujesz obliczyć sumę wartości w kolumnie zaznaczonych punktów bez użycia cudzysłowu, pojawi się błąd:
#attempt to calculate sum of points scored column
sum(df$points scored)
Error: unexpected symbol in "sum(df$points scored"
Zamiast tego należy ująć nazwę kolumny w pojedynczy cudzysłów (`) w następujący sposób:
#calculate sum of points scored column
sum(df$`points scored`)
[1] 101
Pamiętaj, że tym razem nie otrzymamy błędu.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak odczytać plik CSV z adresu URL w R
Jak połączyć wiele plików CSV w R
Jak odczytać określone linie z pliku CSV w R
Jak wyeksportować ramkę danych do pliku CSV w R