Panda's: negeer de eerste kolom bij het importeren van een csv-bestand
U kunt de volgende basissyntaxis gebruiken om de eerste kolom te negeren bij het importeren van een CSV-bestand in een Panda DataFrame:
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
In dit specifieke voorbeeld wordt elke kolom van een CSV-bestand met de naam basketball_data.csv in een panda’s DataFrame gelezen, behalve de eerste kolom.
Met behulp van deze code vinden we eerst het aantal kolommen in het CSV-bestand en wijzen dit toe aan een variabele genaamd ncols .
Vervolgens gebruiken we het argument usecols om aan te geven dat we alleen de kolommen tussen 1 (dat wil zeggen de tweede kolom) en de laatste kolom van het CSV-bestand willen importeren.
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Negeer de eerste kolom bij het importeren van een CSV-bestand in Pandas
Laten we zeggen dat we het volgende CSV-bestand hebben met de naam basketball_data.csv :
We kunnen de volgende syntaxis gebruiken om het CSV-bestand in een Panda DataFrame te importeren en de eerste kolom te negeren:
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Houd er rekening mee dat de eerste kolom met de naam team is verwijderd toen we het CSV-bestand in panda’s importeerden.
Houd er rekening mee dat als u het totale aantal kolommen in het CSV-bestand al van tevoren weet, u deze waarde rechtstreeks kunt opgeven in het usecols- argument.
Stel dat we bijvoorbeeld al weten dat er drie kolommen in het CVS-bestand staan.
We kunnen de volgende syntaxis gebruiken om het CSV-bestand in een Panda DataFrame te importeren en de eerste kolom te negeren:
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Houd er rekening mee dat de eerste kolom met de naam team is verwijderd toen we het CSV-bestand in panda’s importeerden.
Omdat we al wisten dat er drie kolommen in het CSV-bestand stonden, gebruikten we eenvoudigweg range(1,3) in het usecols- argument.
Opmerking : u kunt de volledige documentatie van de pandas read_csv() functie hier vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Python kunt uitvoeren:
Panda’s: regels overslaan bij het lezen van een CSV-bestand
Panda’s: gegevens toevoegen aan een bestaand CSV-bestand
Panda’s: hoe read_csv te gebruiken met het usecols-argument