Cara membaca baris tertentu dari file csv di r


Anda dapat menggunakan metode berikut untuk membaca baris tertentu dari file CSV di R:

Metode 1: Impor file CSV dari baris tertentu

 df <- read. csv (" my_data.csv ", skip= 2 )

Contoh khusus ini akan melewatkan dua baris pertama file CSV dan mengimpor semua baris file lainnya yang dimulai dengan baris ketiga.

Metode 2: Impor file CSV yang barisnya memenuhi ketentuan

 library (sqldf)

df <- read. csv . sql (" my_data.csv ",
                    sql = " select * from file where `points` > 90 ", eol = " \n ")

Contoh khusus ini hanya akan mengimpor baris dari file CSV yang nilainya di kolom “poin” lebih besar dari 90.

Contoh berikut menunjukkan cara menggunakan masing-masing metode ini dalam praktiknya dengan file CSV berikut bernama my_data.csv :

Contoh 1: Impor file CSV dari baris tertentu

Kode berikut menunjukkan cara mengimpor file CSV dan mengabaikan dua baris pertama file:

 #import data frame and skip first two rows
df <- read. csv (' my_data.csv ', skip= 2 )

#view data frame
df

  B X90 X28 X28.1
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28

Perhatikan bahwa dua baris pertama (dengan tim A dan B) diabaikan saat mengimpor file CSV.

Secara default, R mencoba menggunakan nilai baris berikutnya yang tersedia sebagai nama kolom.

Untuk mengganti nama kolom, Anda dapat menggunakan fungsi nama() sebagai berikut:

 #rename columns
names(df) <- c(' team ', ' points ', ' assists ', ' rebounds ')

#view updated data frame
df

  team points assists rebounds
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28

Contoh 2: Impor file CSV yang barisnya memenuhi ketentuan

Misalkan kita ingin mengimpor hanya baris-baris tersebut dari file CSV yang nilainya di kolom poin lebih besar dari 90.

Kita dapat menggunakan fungsi read.csv.sql dari paket sqldf untuk melakukan ini:

 library (sqldf)

#only import rows where points > 90
df <- read. csv . sql (" my_data.csv ",
                    sql = " select * from file where `points` > 90 ", eol = " \n ")

#view data frame
df

  team points assists rebounds
1 “A” 99 33 30
2 “E” 95 34 28

Perhatikan bahwa hanya dua baris file CSV yang nilainya di kolom “poin” lebih besar dari 90 yang telah diimpor.

Catatan #1 : Dalam contoh ini, kami menggunakan argumen eol untuk menentukan bahwa “akhir baris” dalam file ditandai dengan \n , yang mewakili baris baru.

Catatan #2: Dalam contoh ini, kami menggunakan kueri SQL sederhana, namun Anda bisa menulis kueri yang lebih kompleks untuk memfilter baris berdasarkan lebih banyak kondisi.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara membaca CSV dari URL di R
Cara menggabungkan beberapa file CSV di R
Cara mengekspor bingkai data ke file CSV di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *