A: importeer een csv-bestand met kolomnamen die spaties bevatten
Als u een CSV-bestand in R importeert dat kolomnamen met spaties bevat, zal R de spaties automatisch vervangen door punten, zodat de kolomnamen „geldige“ variabelenamen hebben.
Als u het CSV-bestand wilt importeren en spaties in de kolomnamen wilt behouden, moet u het check.names=FALSE argument als volgt gebruiken:
df <- read. csv (" my_data.csv ", check.names = FALSE )
Hierdoor wordt het CSV-bestand in R geïmporteerd en blijven de spaties in de kolomnamen behouden.
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: importeer een CSV-bestand in R met kolomnamen die spaties bevatten
Laten we zeggen dat we het volgende CSV-bestand hebben met de naam basketball.csv :
Houd er rekening mee dat er vier kolomnamen in het CSV-bestand staan en dat twee daarvan spaties in de naam bevatten.
Als we de functie read.csv() gebruiken om dit CSV-bestand te importeren, zal R automatisch spaties vervangen door punten:
#import CSV file
df <- read. csv (' basketball_data.csv ')
#view data frame
df
team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Merk op dat de punten de spaties in de namen van twee kolommen hebben vervangen door spaties.
Als u het CSV-bestand wilt importeren en spaties in de kolomnamen wilt behouden, kunt u het check.names=FALSE argument als volgt gebruiken:
#import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )
#view data frame
df
team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Merk op dat spaties behouden zijn gebleven in de namen van twee kolommen met spaties.
Houd er echter rekening mee dat als u probeert berekeningen uit te voeren met behulp van deze kolomnamen met spaties, u deze tussen enkele aanhalingstekens (`) moet plaatsen, anders krijgt u een foutmelding.
Als u bijvoorbeeld de som van de waarden in de gemarkeerde puntenkolom probeert te berekenen zonder enkele aanhalingstekens te gebruiken, krijgt u een foutmelding:
#attempt to calculate sum of points scored column
sum(df$points scored)
Error: unexpected symbol in "sum(df$points scored"
In plaats daarvan moet u de kolomnaam als volgt tussen enkele aanhalingstekens (`) plaatsen:
#calculate sum of points scored column
sum(df$`points scored`)
[1] 101
Houd er rekening mee dat we deze keer geen foutmelding ontvangen.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe een CSV van een URL in R te lezen
Hoe meerdere CSV-bestanden samen te voegen in R
Hoe specifieke regels uit een CSV-bestand in R te lezen
Een dataframe exporteren naar een CSV-bestand in R