В: імпортуйте файл csv із назвами стовпців, які містять пробіли


Якщо ви імпортуєте файл CSV у R, який містить імена стовпців із пробілами, R автоматично замінить пробіли крапками, щоб імена стовпців мали «дійсні» імена змінних.

Якщо ви хочете імпортувати файл CSV і залишити пробіли в іменах стовпців, ви повинні використовувати аргумент check.names=FALSE таким чином:

 df <- read. csv (" my_data.csv ", check.names = FALSE )

Це імпортує файл CSV у R і збереже пробіли в назвах стовпців.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: імпортуйте файл CSV у R із назвами стовпців, які містять пробіли

Скажімо, у нас є такий файл CSV під назвою basketball.csv :

Зауважте, що у файлі CSV є чотири назви стовпців, і два з них містять пробіли в імені.

Якщо ми використовуємо функцію read.csv() для імпорту цього файлу CSV, R автоматично замінить пробіли крапками:

 #import CSV file
df <- read. csv (' basketball_data.csv ')

#view data frame
df

  team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Зауважте, що крапки замінили пробіли в назвах двох стовпців пробілами.

Якщо ви хочете імпортувати файл CSV і зберегти пробіли в іменах стовпців, ви можете використати аргумент check.names=FALSE таким чином:

 #import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )

#view data frame
df

  team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Зверніть увагу, що в назвах двох колонок з пробілами збережено пробіли.

Однак слід зауважити, що якщо ви намагаєтеся виконати обчислення, використовуючи ці назви стовпців із пробілами, ви повинні взяти їх у одинарні лапки (`), інакше ви отримаєте помилку.

Наприклад, якщо ви спробуєте обчислити суму значень у стовпці з позначеними балами без використання одинарних лапок, ви отримаєте помилку:

 #attempt to calculate sum of points scored column
sum(df$points scored)

Error: unexpected symbol in "sum(df$points scored"

Натомість ви повинні взяти назву стовпця в одинарні лапки (`) таким чином:

 #calculate sum of points scored column
sum(df$`points scored`)

[1] 101

Зауважте, що цього разу ми не отримуємо повідомлення про помилку.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як читати CSV з URL-адреси в R
Як об’єднати декілька файлів CSV у R
Як читати певні рядки з файлу CSV у R
Як експортувати фрейм даних у файл CSV у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *