Ответ: импортируйте файл csv с именами столбцов, содержащими пробелы.
Если вы импортируете в R файл CSV, содержащий имена столбцов с пробелами, R автоматически заменит пробелы точками, чтобы имена столбцов имели «действительные» имена переменных.
Если вы хотите импортировать файл CSV и сохранить пробелы в именах столбцов, вы должны использовать аргумент check.names=FALSE следующим образом:
df <- read. csv (" my_data.csv ", check.names = FALSE )
Это позволит импортировать файл CSV в R и сохранить пробелы в именах столбцов.
В следующем примере показано, как использовать этот синтаксис на практике.
Пример. Импортируйте CSV-файл в R с именами столбцов, содержащими пробелы.
Допустим, у нас есть следующий CSV-файл с именем баскетбол.csv :
Обратите внимание, что в файле CSV есть четыре имени столбца, и два из них содержат пробелы.
Если мы используем функцию read.csv() для импорта этого CSV-файла, R автоматически заменит пробелы точками:
#import CSV file
df <- read. csv (' basketball_data.csv ')
#view data frame
df
team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Обратите внимание, что точки заменили пробелы в названиях двух столбцов на пробелы.
Если вы хотите импортировать файл CSV и сохранить пробелы в именах столбцов, вы можете использовать аргумент check.names=FALSE следующим образом:
#import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )
#view data frame
df
team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Обратите внимание, что в названиях двух столбцов с пробелами сохранены пробелы.
Однако следует учитывать, что если вы попытаетесь выполнить вычисления, используя имена этих столбцов с пробелами, вы должны заключить их в одинарные кавычки (`), в противном случае вы получите сообщение об ошибке.
Например, если вы попытаетесь посчитать сумму значений в столбце отмеченных точек без использования одинарных кавычек, вы получите ошибку:
#attempt to calculate sum of points scored column
sum(df$points scored)
Error: unexpected symbol in "sum(df$points scored"
Вместо этого вы должны заключить имя столбца в одинарные кавычки (`) следующим образом:
#calculate sum of points scored column
sum(df$`points scored`)
[1] 101
Обратите внимание, что на этот раз мы не получили сообщение об ошибке.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как прочитать CSV по URL-адресу в R
Как объединить несколько файлов CSV в R
Как прочитать определенные строки из файла CSV в R
Как экспортировать фрейм данных в файл CSV в R