Hoe op te lossen in r: meer kolommen dan kolomnamen


Een fout die je tegen kunt komen in R is:

 Error in read.table("my_data.csv", header=TRUE): 
  more columns than column names 

Deze fout treedt meestal op wanneer u probeert een CSV-bestand in R te lezen met de functie read.table() en er niet in slaagt op te geven dat het scheidingsteken ( sep ) een komma moet zijn.

In deze tutorial wordt precies uitgelegd hoe u deze fout kunt oplossen.

Hoe de fout te reproduceren

Laten we zeggen dat we het volgende CSV-bestand hebben met de naam basketball_data.csv :

Stel nu dat we proberen dit bestand in R te importeren met behulp van de read.table() functie:

 #attempt to import CSV into data frame
df <- read. table ("basketball_data.csv", header= TRUE ) 

Error in read.table("basketball_data.csv", header = TRUE): 
  more columns than column names

We ontvangen een foutmelding omdat we niet hebben opgegeven dat de waarden in ons bestand door komma’s zijn gescheiden.

Omdat er spaties zijn tussen de waarden in de rijen van het dataframe, maar niet in de header, denkt de functie read.table() dat er maar één kolom is.

Dit vertelt ons dus dat er meer kolommen zijn dan kolomnamen.

Hoe u de fout kunt oplossen

De manier om deze fout op te lossen is door eenvoudigweg sep=““ te gebruiken bij het importeren van het bestand:

 #import CSV file into data frame
df <- read. table ("basketball_data.csv", header= TRUE , sep=",")

#view data frame
df
team points rebounds
1 to 22 10
2 B 14 9
3 C 29 6
4 D 30 2

We kunnen het CSV-bestand zonder fouten importeren omdat we hebben opgegeven dat de waarden in het bestand door komma’s gescheiden zijn.

Als alternatief kunnen we gewoon read.csv() gebruiken om het bestand te importeren als we weten dat het een CSV-bestand is:

 #import CSV file into data frame
df <- read. csv ("basketball_data.csv", header= TRUE )

#view data frame
df

  team points rebounds
1 'A' 22 10
2 'B' 14 9
3 'C' 29 6
4 'D' 30 2

Houd er rekening mee dat we deze keer ook geen fouten krijgen bij het importeren van het CSV-bestand.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende fouten in R kunt oplossen:

Oplossing in R: namen komen niet overeen met eerdere namen
Hoe op te lossen in R: de lengte van een langer object is geen veelvoud van de lengte van een korter object
Hoe op te lossen in R: contrasten kunnen alleen worden toegepast op factoren met 2 of meer niveaus

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert