Hoe een naamloze kolom in pandas dataframe te verwijderen


U kunt de volgende twee methoden gebruiken om een kolom te verwijderen in een Pandas DataFrame die ‚Unnamed‘ in de kolomnaam bevat:

Methode 1: Naamloze kolom verwijderen bij het importeren van gegevens

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

Methode 2: Naamloze kolom verwijderen na het importeren van gegevens

 df = df. loc [:, ~df. columns . str . contains (' ^Unnamed ')]

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken.

Voorbeeld 1: Verwijder een naamloze kolom bij het importeren van gegevens

Laten we zeggen dat we een eenvoudig panda’s DataFrame maken en dit exporteren naar een CSV-bestand:

 import pandas as pd

#createDataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [4, 4, 6, 8, 9, 5],
                    ' rebounds ': [12, 7, 8, 8, 5, 11]})

#view DataFrame
print (df1)

  team points rebounds
0 to 4 12
1 B 4 7
2 C 6 8
3 D 8 8
4 E 9 5
5 F 5 11

#export DataFrame to CSV file
df1. to_csv (' my_data.csv ')

Wanneer we nu proberen het bestand in een Panda DataFrame te lezen, heet de eerste kolom Naamloze: 0

 #import CSV file
df2 = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df2)

   Unnamed: 0 team points rebounds
0 0 A 4 12
1 1 B 4 7
2 2 C 6 8
3 3 D 8 8
4 4 E 9 5
5 5 F 5 11

Om dit te voorkomen, kunnen we index_col=0 specificeren om panda’s te vertellen dat de eerste kolom feitelijk de indexkolom is:

 #import CSV file
df2 = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df2)

  team points rebounds
0 to 4 12
1 B 4 7
2 C 6 8
3 D 8 8
4 E 9 5
5 F 5 11

Voorbeeld 2: Naamloze kolom verwijderen na het importeren van gegevens

Laten we zeggen dat we een eenvoudig panda’s DataFrame maken en dit exporteren naar een CSV-bestand:

 import pandas as pd

#createDataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [4, 4, 6, 8, 9, 5],
                    ' rebounds ': [12, 7, 8, 8, 5, 11]})

#export DataFrame to CSV file
df1. to_csv (' my_data.csv ')

Stel nu dat we dit bestand importeren in een Panda DataFrame:

 #import CSV file
df2 = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df2)

   Unnamed: 0 team points rebounds
0 0 A 4 12
1 1 B 4 7
2 2 C 6 8
3 3 D 8 8
4 4 E 9 5
5 5 F 5 11

Om de kolom te verwijderen die ‚Onbenoemd‘ in de naam bevat, kunnen we de volgende syntaxis gebruiken:

 #drop any column that contains "Unnamed" in column name
df2 = df2. loc [:, ~df2. columns . str . contains (' ^Unnamed ')]

#view updated DataFrame
print (df2)

  team points rebounds
0 to 4 12
1 B 4 7
2 C 6 8
3 D 8 8
4 E 9 5
5 F 5 11

Houd er rekening mee dat de kolom ‚Onbenoemd: 0‘ is verwijderd uit het DataFrame.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe de eerste rij in Pandas DataFrame te verwijderen
Hoe de eerste kolom in Pandas DataFrame te verwijderen
Hoe dubbele kolommen in Pandas te verwijderen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert