Panda's: verwijder een specifieke kolom bij het importeren van een csv-bestand
U kunt de volgende basissyntaxis gebruiken om een specifieke kolom te verwijderen bij het importeren van een CSV-bestand in een Panda DataFrame:
df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ')
In dit specifieke voorbeeld wordt elke kolom uit een CSV-bestand met de naam basketball_data.csv gelezen in een panda’s DataFrame, behalve de kolom met de naam rebounds .
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Verwijder een specifieke kolom bij het importeren van een CSV-bestand in Pandas
Laten we zeggen dat we het volgende CSV-bestand hebben met de naam basketball_data.csv :
We kunnen de volgende syntaxis gebruiken om het CSV-bestand in panda’s te importeren en de kolom met de naam bounces tijdens het importeren te verwijderen:
import pandas as pd #import all columns except 'rebounds' into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ') #view resulting DataFrame print (df) team points 0 to 22 1 B 14 2 C 29 3 D 30
Houd er rekening mee dat de kolom met teruggestuurde berichten is verwijderd toen we het CSV-bestand in panda’s importeerden.
Als u tijdens het importeren meerdere kolommen wilt verwijderen, kunt u de operator not in als volgt gebruiken:
import pandas as pd #import all columns except 'team' and 'rebounds' into DataFrame df=pd. read_csv (' basketball_data.csv ', usecols= lambda x:x not in [' team ', ' rebounds ']) #view resulting DataFrame print (df) points 0 22 1 14 2 29 3 30
Houd er rekening mee dat de kolommen team en rebounds beide zijn verwijderd toen we het CSV-bestand in panda’s importeerden.
Houd er rekening mee dat u zoveel kolomnamen kunt opnemen als u wilt in de lijst na de not in- operator om zoveel kolommen te verwijderen als u wilt bij het importeren van een CSV-bestand.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Python kunt uitvoeren:
Panda’s: regels overslaan bij het lezen van een CSV-bestand
Panda’s: gegevens toevoegen aan een bestaand CSV-bestand
Panda’s: hoe read_csv te gebruiken met het usecols-argument