Panda: come rimuovere le colonne non presenti nell'elenco


È possibile utilizzare la seguente sintassi di base per rimuovere colonne da un DataFrame panda che non si trovano in un elenco specifico:

 #define columns to keep
keep_cols = [' col1 ', ' col2 ', ' col3 ']

#create new dataframe by dropping columns not in list
new_df = df[df. columns . intersection (keep_cols)]

Questo particolare esempio rimuoverà tutte le colonne dal DataFrame che non sono uguali a col1 , col2 o col3 .

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: rimuovere le colonne non presenti nell’elenco in Pandas

Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' steals ': [4, 4, 10, 12, 8, 5, 5, 2]})

#view DataFrame
print (df)

  team points assists rebounds steals
0 A 18 5 11 4
1 B 22 7 8 4
2 C 19 7 10 10
3 D 14 9 6 12
4 E 14 12 6 8
5 F 11 9 5 5
6 G 20 9 9 5
7:28 4 12 2

Supponiamo ora di voler creare un nuovo DataFrame che rimuova tutte le colonne che non sono presenti nel seguente elenco di colonne: team , points e Steles .

Possiamo usare la seguente sintassi per fare questo:

 #define columns to keep
keep_cols = [' team ', ' points ', ' steals ']

#create new dataframe by dropping columns not in list
new_df = df[df. columns . intersection (keep_cols)]

#view new dataframe
print (new_df)

  team points steals
0 to 18 4
1 B 22 4
2 C 19 10
3 D 14 12
4 E 14 8
5 F 11 5
6 G 20 5
7:28 a.m. 2

Tieni presente che ciascuna delle colonne nel DataFrame originale che non sono nell’elenco keep_cols sono state rimosse dal nuovo DataFrame.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni dei panda:

Come rimuovere la prima fila in Panda
Come rimuovere la prima colonna in Pandas
Come rimuovere le colonne duplicate in Pandas
Come eliminare tutte le colonne tranne alcune in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *