So lesen sie bestimmte zeilen aus einer csv-datei in r
Sie können die folgenden Methoden verwenden, um bestimmte Zeilen aus einer CSV-Datei in R zu lesen:
Methode 1: Importieren Sie eine CSV-Datei aus einer bestimmten Zeile
df <- read. csv (" my_data.csv ", skip= 2 )
In diesem speziellen Beispiel werden die ersten beiden Zeilen der CSV-Datei übersprungen und alle anderen Zeilen der Datei, beginnend mit der dritten Zeile, importiert.
Methode 2: Importieren Sie eine CSV-Datei, in der die Zeilen die Bedingung erfüllen
library (sqldf) df <- read. csv . sql (" my_data.csv ", sql = " select * from file where `points` > 90 ", eol = " \n ")
In diesem speziellen Beispiel werden nur Zeilen aus der CSV-Datei importiert, deren Wert in der Spalte „Punkte“ größer als 90 ist.
Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis mit der folgenden CSV-Datei namens my_data.csv verwendet wird:
Beispiel 1: Importieren Sie eine CSV-Datei aus einer bestimmten Zeile
Der folgende Code zeigt, wie Sie die CSV-Datei importieren und die ersten beiden Zeilen der Datei ignorieren:
#import data frame and skip first two rows
df <- read. csv (' my_data.csv ', skip= 2 )
#view data frame
df
B X90 X28 X28.1
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28
Beachten Sie, dass die ersten beiden Zeilen (mit den Teams A und B) beim Import der CSV-Datei ignoriert wurden.
Standardmäßig versucht R, die Werte der nächsten verfügbaren Zeile als Spaltennamen zu verwenden.
Um Spalten umzubenennen, können Sie die Funktion „names()“ wie folgt verwenden:
#rename columns
names(df) <- c(' team ', ' points ', ' assists ', ' rebounds ')
#view updated data frame
df
team points assists rebounds
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28
Beispiel 2: Importieren Sie eine CSV-Datei, in der die Zeilen die Bedingung erfüllen
Angenommen, wir möchten nur die Zeilen aus der CSV-Datei importieren, deren Wert in der Punktespalte größer als 90 ist.
Wir können dazu die Funktion read.csv.sql aus dem sqldf- Paket verwenden:
library (sqldf)
#only import rows where points > 90
df <- read. csv . sql (" my_data.csv ",
sql = " select * from file where `points` > 90 ", eol = " \n ")
#view data frame
df
team points assists rebounds
1 “A” 99 33 30
2 “E” 95 34 28
Beachten Sie, dass nur die beiden Zeilen der CSV-Datei importiert wurden, deren Wert in der Spalte „Punkte“ größer als 90 ist.
Hinweis Nr. 1 : In diesem Beispiel haben wir das Argument eol verwendet, um anzugeben, dass das „Zeilenende“ in der Datei durch \n angegeben wird, was eine neue Zeile darstellt.
Hinweis Nr. 2: In diesem Beispiel haben wir eine einfache SQL-Abfrage verwendet, Sie können jedoch komplexere Abfragen schreiben, um Zeilen nach noch mehr Bedingungen zu filtern.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:
So lesen Sie eine CSV-Datei von einer URL in R
So führen Sie mehrere CSV-Dateien in R zusammen
So exportieren Sie einen Datenrahmen in eine CSV-Datei in R