A: impor file csv dengan nama kolom yang mengandung spasi


Jika Anda mengimpor file CSV ke R yang berisi nama kolom dengan spasi, R secara otomatis akan mengganti spasi dengan titik sehingga nama kolom memiliki nama variabel yang “valid”.

Jika Anda ingin mengimpor file CSV dan mempertahankan spasi pada nama kolom, Anda harus menggunakan argumen check.names=FALSE sebagai berikut:

 df <- read. csv (" my_data.csv ", check.names = FALSE )

Ini akan mengimpor file CSV ke R dan mempertahankan spasi pada nama kolom.

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Impor file CSV ke R dengan nama kolom yang mengandung spasi

Katakanlah kita memiliki file CSV berikut bernama basket.csv :

Perhatikan bahwa ada empat nama kolom dalam file CSV dan dua di antaranya berisi spasi pada namanya.

Jika kita menggunakan fungsi read.csv() untuk mengimpor file CSV ini, R secara otomatis akan mengganti spasi dengan titik:

 #import CSV file
df <- read. csv (' basketball_data.csv ')

#view data frame
df

  team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Perhatikan bahwa titik telah menggantikan spasi pada nama dua kolom dengan spasi.

Jika Anda ingin mengimpor file CSV dan mempertahankan spasi pada nama kolom, Anda dapat menggunakan argumen check.names=FALSE sebagai berikut:

 #import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )

#view data frame
df

  team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Perhatikan bahwa spasi telah dipertahankan dalam nama dua kolom dengan spasi.

Namun, perlu diperhatikan bahwa jika Anda mencoba melakukan penghitungan menggunakan nama kolom yang diberi spasi, Anda harus mengapitnya dengan tanda kutip tunggal (`), jika tidak, Anda akan menerima kesalahan.

Misalnya, jika Anda mencoba menghitung jumlah nilai di kolom poin yang ditandai tanpa menggunakan tanda kutip tunggal, Anda akan menerima pesan kesalahan:

 #attempt to calculate sum of points scored column
sum(df$points scored)

Error: unexpected symbol in "sum(df$points scored"

Sebagai gantinya, Anda harus mengapit nama kolom dalam tanda kutip tunggal (`) sebagai berikut:

 #calculate sum of points scored column
sum(df$`points scored`)

[1] 101

Perhatikan bahwa kami tidak menerima kesalahan kali ini.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara membaca CSV dari URL di R
Cara menggabungkan beberapa file CSV di R
Cara membaca baris tertentu dari file CSV di R
Cara mengekspor kerangka data ke file CSV di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *