A: importeer een csv-bestand met kolomnamen die spaties bevatten


Als u een CSV-bestand in R importeert dat kolomnamen met spaties bevat, zal R de spaties automatisch vervangen door punten, zodat de kolomnamen „geldige“ variabelenamen hebben.

Als u het CSV-bestand wilt importeren en spaties in de kolomnamen wilt behouden, moet u het check.names=FALSE argument als volgt gebruiken:

 df <- read. csv (" my_data.csv ", check.names = FALSE )

Hierdoor wordt het CSV-bestand in R geïmporteerd en blijven de spaties in de kolomnamen behouden.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: importeer een CSV-bestand in R met kolomnamen die spaties bevatten

Laten we zeggen dat we het volgende CSV-bestand hebben met de naam basketball.csv :

Houd er rekening mee dat er vier kolomnamen in het CSV-bestand staan en dat twee daarvan spaties in de naam bevatten.

Als we de functie read.csv() gebruiken om dit CSV-bestand te importeren, zal R automatisch spaties vervangen door punten:

 #import CSV file
df <- read. csv (' basketball_data.csv ')

#view data frame
df

  team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Merk op dat de punten de spaties in de namen van twee kolommen hebben vervangen door spaties.

Als u het CSV-bestand wilt importeren en spaties in de kolomnamen wilt behouden, kunt u het check.names=FALSE argument als volgt gebruiken:

 #import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )

#view data frame
df

  team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Merk op dat spaties behouden zijn gebleven in de namen van twee kolommen met spaties.

Houd er echter rekening mee dat als u probeert berekeningen uit te voeren met behulp van deze kolomnamen met spaties, u deze tussen enkele aanhalingstekens (`) moet plaatsen, anders krijgt u een foutmelding.

Als u bijvoorbeeld de som van de waarden in de gemarkeerde puntenkolom probeert te berekenen zonder enkele aanhalingstekens te gebruiken, krijgt u een foutmelding:

 #attempt to calculate sum of points scored column
sum(df$points scored)

Error: unexpected symbol in "sum(df$points scored"

In plaats daarvan moet u de kolomnaam als volgt tussen enkele aanhalingstekens (`) plaatsen:

 #calculate sum of points scored column
sum(df$`points scored`)

[1] 101

Houd er rekening mee dat we deze keer geen foutmelding ontvangen.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe een CSV van een URL in R te lezen
Hoe meerdere CSV-bestanden samen te voegen in R
Hoe specifieke regels uit een CSV-bestand in R te lezen
Een dataframe exporteren naar een CSV-bestand in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert