Ответ: импортируйте файл csv с именами столбцов, содержащими пробелы.


Если вы импортируете в R файл CSV, содержащий имена столбцов с пробелами, R автоматически заменит пробелы точками, чтобы имена столбцов имели «действительные» имена переменных.

Если вы хотите импортировать файл CSV и сохранить пробелы в именах столбцов, вы должны использовать аргумент check.names=FALSE следующим образом:

 df <- read. csv (" my_data.csv ", check.names = FALSE )

Это позволит импортировать файл CSV в R и сохранить пробелы в именах столбцов.

В следующем примере показано, как использовать этот синтаксис на практике.

Пример. Импортируйте CSV-файл в R с именами столбцов, содержащими пробелы.

Допустим, у нас есть следующий CSV-файл с именем баскетбол.csv :

Обратите внимание, что в файле CSV есть четыре имени столбца, и два из них содержат пробелы.

Если мы используем функцию read.csv() для импорта этого CSV-файла, R автоматически заменит пробелы точками:

 #import CSV file
df <- read. csv (' basketball_data.csv ')

#view data frame
df

  team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Обратите внимание, что точки заменили пробелы в названиях двух столбцов на пробелы.

Если вы хотите импортировать файл CSV и сохранить пробелы в именах столбцов, вы можете использовать аргумент check.names=FALSE следующим образом:

 #import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )

#view data frame
df

  team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Обратите внимание, что в названиях двух столбцов с пробелами сохранены пробелы.

Однако следует учитывать, что если вы попытаетесь выполнить вычисления, используя имена этих столбцов с пробелами, вы должны заключить их в одинарные кавычки (`), в противном случае вы получите сообщение об ошибке.

Например, если вы попытаетесь посчитать сумму значений в столбце отмеченных точек без использования одинарных кавычек, вы получите ошибку:

 #attempt to calculate sum of points scored column
sum(df$points scored)

Error: unexpected symbol in "sum(df$points scored"

Вместо этого вы должны заключить имя столбца в одинарные кавычки (`) следующим образом:

 #calculate sum of points scored column
sum(df$`points scored`)

[1] 101

Обратите внимание, что на этот раз мы не получили сообщение об ошибке.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как прочитать CSV по URL-адресу в R
Как объединить несколько файлов CSV в R
Как прочитать определенные строки из файла CSV в R
Как экспортировать фрейм данных в файл CSV в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *