A: importieren sie eine csv-datei mit spaltennamen, die leerzeichen enthalten


Wenn Sie eine CSV-Datei in R importieren, die Spaltennamen mit Leerzeichen enthält, ersetzt R die Leerzeichen automatisch durch Punkte, sodass die Spaltennamen „gültige“ Variablennamen haben.

Wenn Sie die CSV-Datei importieren und Leerzeichen in den Spaltennamen beibehalten möchten, müssen Sie das Argument check.names=FALSE wie folgt verwenden:

 df <- read. csv (" my_data.csv ", check.names = FALSE )

Dadurch wird die CSV-Datei in R importiert und Leerzeichen in den Spaltennamen bleiben erhalten.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Importieren Sie eine CSV-Datei in R mit Spaltennamen, die Leerzeichen enthalten

Nehmen wir an, wir haben die folgende CSV-Datei mit dem Namen „basketball.csv“ :

Beachten Sie, dass die CSV-Datei vier Spaltennamen enthält und zwei davon Leerzeichen im Namen enthalten.

Wenn wir die Funktion read.csv() verwenden, um diese CSV-Datei zu importieren, ersetzt R automatisch Leerzeichen durch Punkte:

 #import CSV file
df <- read. csv (' basketball_data.csv ')

#view data frame
df

  team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Beachten Sie, dass die Punkte die Leerzeichen in den Namen zweier Spalten durch Leerzeichen ersetzt haben.

Wenn Sie die CSV-Datei importieren und Leerzeichen in den Spaltennamen beibehalten möchten, können Sie das Argument check.names=FALSE wie folgt verwenden:

 #import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )

#view data frame
df

  team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Beachten Sie, dass Leerzeichen in den Namen von zwei Spalten mit Leerzeichen erhalten geblieben sind.

Sie sollten jedoch beachten, dass Sie, wenn Sie versuchen, Berechnungen mit diesen Spaltennamen mit Leerzeichen durchzuführen, diese in einfache Anführungszeichen (`) setzen müssen, andernfalls erhalten Sie eine Fehlermeldung.

Wenn Sie beispielsweise versuchen, die Summe der Werte in der Spalte „Markierte Punkte“ ohne einfache Anführungszeichen zu berechnen, erhalten Sie eine Fehlermeldung:

 #attempt to calculate sum of points scored column
sum(df$points scored)

Error: unexpected symbol in "sum(df$points scored"

Stattdessen müssen Sie den Spaltennamen wie folgt in einfache Anführungszeichen (`) setzen:

 #calculate sum of points scored column
sum(df$`points scored`)

[1] 101

Beachten Sie, dass wir dieses Mal keine Fehlermeldung erhalten.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So lesen Sie eine CSV-Datei von einer URL in R
So führen Sie mehrere CSV-Dateien in R zusammen
So lesen Sie bestimmte Zeilen aus einer CSV-Datei in R
So exportieren Sie einen Datenrahmen in eine CSV-Datei in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert