Jak usunąć kolumny według indeksu w pandach
Możesz użyć następującej składni, aby usunąć kolumnę z ramki DataFrame pandy według numeru indeksu:
#drop first column from DataFrame df. drop ( df.columns [0], axis= 1 , inplace= True )
Możesz także użyć następującej składni, aby usunąć wiele kolumn z ramki DataFrame pand według numerów indeksów:
#drop first, second, and fourth column from DataFrame cols = [0, 1, 3] df. drop (df. columns [cols], axis= 1 , inplace= True )
Jeśli ramka DataFrame ma zduplikowane nazwy kolumn, możesz użyć następującej składni, aby usunąć kolumnę według numeru indeksu:
#define list of columns cols = [x for x in range( df.shape [1])] #drop second column collars. remove (1) #view resulting DataFrame df. iloc [:, cols]
Poniższe przykłady pokazują, jak w praktyce usuwać kolumny według indeksu.
Przykład 1: usuń kolumnę według indeksu
Poniższy kod pokazuje, jak usunąć pierwszą kolumnę z ramki DataFrame pandy:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'], ' first ': ['Dirk', 'Kobe', 'Tim', 'Lebron'], ' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'], ' points ': [26, 31, 22, 29]}) #drop first column from DataFrame df. drop ( df.columns [0], axis= 1 , inplace= True ) #view resulting dataFrame df first last points 0 Dirk Nowitzki 26 1 Kobe Bryant 31 2 Tim Duncan 22 3 LeBron James 29
Przykład 2: Usuń wiele kolumn według indeksu
Poniższy kod pokazuje, jak upuścić wiele kolumn w ramce danych pand według indeksu:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'], ' first ': ['Dirk', 'Kobe', 'Tim', 'Lebron'], ' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'], ' points ': [26, 31, 22, 29]}) #drop first, second and fourth columns from DataFrame cols = [0, 1, 3] df. drop (df. columns [cols], axis= 1 , inplace= True ) #view resulting dataFrame df last 0 Nowitzki 1 Bryant 2 Duncan 3 James
Przykład 3: Usuń kolumnę według indeksu z duplikatami
Poniższy kod pokazuje, jak usunąć kolumnę według numeru indeksu w ramce DataFrame pandy, gdy istnieją zduplikowane nazwy kolumn:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'],
' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'],
' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'],
' points ': [26, 31, 22, 29]},
columns=[' team ', ' last ', ' last ', ' points '])
#define list of columns range
cols = [x for x in range( df.shape [1])]
#remove second column in DataFrame
collars. remove (1)
#view resulting DataFrame
df. iloc [:, cols]
team last points
0 Mavs Nowitzki 26
1 Lakers Bryant 31
2 Spurs Duncan 22
3 Cavs James 29
Dodatkowe zasoby
Jak połączyć dwie kolumny w Pandach
Pandy: jak sortować kolumny według nazwy
Pandy: jak znaleźć różnicę między dwiema kolumnami
Pandy: jak dodawać kolumny na podstawie warunku