Panda's: negeer de eerste kolom bij het importeren van een csv-bestand


U kunt de volgende basissyntaxis gebruiken om de eerste kolom te negeren bij het importeren van een CSV-bestand in een Panda DataFrame:

 with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

In dit specifieke voorbeeld wordt elke kolom van een CSV-bestand met de naam basketball_data.csv in een panda’s DataFrame gelezen, behalve de eerste kolom.

Met behulp van deze code vinden we eerst het aantal kolommen in het CSV-bestand en wijzen dit toe aan een variabele genaamd ncols .

Vervolgens gebruiken we het argument usecols om aan te geven dat we alleen de kolommen tussen 1 (dat wil zeggen de tweede kolom) en de laatste kolom van het CSV-bestand willen importeren.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Negeer de eerste kolom bij het importeren van een CSV-bestand in Pandas

Laten we zeggen dat we het volgende CSV-bestand hebben met de naam basketball_data.csv :

We kunnen de volgende syntaxis gebruiken om het CSV-bestand in een Panda DataFrame te importeren en de eerste kolom te negeren:

 import pandas as pd

#calculate number of columns in CSV file
with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Houd er rekening mee dat de eerste kolom met de naam team is verwijderd toen we het CSV-bestand in panda’s importeerden.

Houd er rekening mee dat als u het totale aantal kolommen in het CSV-bestand al van tevoren weet, u deze waarde rechtstreeks kunt opgeven in het usecols- argument.

Stel dat we bijvoorbeeld al weten dat er drie kolommen in het CVS-bestand staan.

We kunnen de volgende syntaxis gebruiken om het CSV-bestand in een Panda DataFrame te importeren en de eerste kolom te negeren:

 import pandas as pd

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Houd er rekening mee dat de eerste kolom met de naam team is verwijderd toen we het CSV-bestand in panda’s importeerden.

Omdat we al wisten dat er drie kolommen in het CSV-bestand stonden, gebruikten we eenvoudigweg range(1,3) in het usecols- argument.

Opmerking : u kunt de volledige documentatie van de pandas read_csv() functie hier vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Python kunt uitvoeren:

Panda’s: regels overslaan bij het lezen van een CSV-bestand
Panda’s: gegevens toevoegen aan een bestaand CSV-bestand
Panda’s: hoe read_csv te gebruiken met het usecols-argument

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert