Cara membaca baris tertentu dari file csv di r
Anda dapat menggunakan metode berikut untuk membaca baris tertentu dari file CSV di R:
Metode 1: Impor file CSV dari baris tertentu
df <- read. csv (" my_data.csv ", skip= 2 )
Contoh khusus ini akan melewatkan dua baris pertama file CSV dan mengimpor semua baris file lainnya yang dimulai dengan baris ketiga.
Metode 2: Impor file CSV yang barisnya memenuhi ketentuan
library (sqldf) df <- read. csv . sql (" my_data.csv ", sql = " select * from file where `points` > 90 ", eol = " \n ")
Contoh khusus ini hanya akan mengimpor baris dari file CSV yang nilainya di kolom “poin” lebih besar dari 90.
Contoh berikut menunjukkan cara menggunakan masing-masing metode ini dalam praktiknya dengan file CSV berikut bernama my_data.csv :
Contoh 1: Impor file CSV dari baris tertentu
Kode berikut menunjukkan cara mengimpor file CSV dan mengabaikan dua baris pertama file:
#import data frame and skip first two rows
df <- read. csv (' my_data.csv ', skip= 2 )
#view data frame
df
B X90 X28 X28.1
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28
Perhatikan bahwa dua baris pertama (dengan tim A dan B) diabaikan saat mengimpor file CSV.
Secara default, R mencoba menggunakan nilai baris berikutnya yang tersedia sebagai nama kolom.
Untuk mengganti nama kolom, Anda dapat menggunakan fungsi nama() sebagai berikut:
#rename columns
names(df) <- c(' team ', ' points ', ' assists ', ' rebounds ')
#view updated data frame
df
team points assists rebounds
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28
Contoh 2: Impor file CSV yang barisnya memenuhi ketentuan
Misalkan kita ingin mengimpor hanya baris-baris tersebut dari file CSV yang nilainya di kolom poin lebih besar dari 90.
Kita dapat menggunakan fungsi read.csv.sql dari paket sqldf untuk melakukan ini:
library (sqldf)
#only import rows where points > 90
df <- read. csv . sql (" my_data.csv ",
sql = " select * from file where `points` > 90 ", eol = " \n ")
#view data frame
df
team points assists rebounds
1 “A” 99 33 30
2 “E” 95 34 28
Perhatikan bahwa hanya dua baris file CSV yang nilainya di kolom “poin” lebih besar dari 90 yang telah diimpor.
Catatan #1 : Dalam contoh ini, kami menggunakan argumen eol untuk menentukan bahwa “akhir baris” dalam file ditandai dengan \n , yang mewakili baris baru.
Catatan #2: Dalam contoh ini, kami menggunakan kueri SQL sederhana, namun Anda bisa menulis kueri yang lebih kompleks untuk memfilter baris berdasarkan lebih banyak kondisi.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:
Cara membaca CSV dari URL di R
Cara menggabungkan beberapa file CSV di R
Cara mengekspor bingkai data ke file CSV di R