Come preservare alcune colonne in panda (con esempi)


È possibile utilizzare i seguenti metodi per rendere persistenti solo determinate colonne in un DataFrame panda:

Metodo 1: specificare quali colonne mantenere

 #only keep columns 'col1' and 'col2'
df[[' col1 ', ' col2 ']]

Metodo 2: specificare le colonne da eliminare

 #drop columns 'col3' and 'col4'
df[df. columns [~df. columns . isin ([' col3 ',' col4 '])]]

Gli esempi seguenti mostrano come utilizzare ciascun metodo con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [11, 7, 8, 10, 13, 13],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team points assists rebounds
0 A 11 5 11
1 To 7 7 8
2 to 8 7 10
3 B 10 9 6
4 B 13 12 6
5 B 13 9 5

Metodo 1: specificare quali colonne mantenere

Il codice seguente mostra come definire un nuovo DataFrame che conserva solo le colonne “team” e “points”:

 #create new DataFrame and only keep 'team' and 'points' columns
df2 = df[[' team ', ' points ']]

#view new DataFrame
df2

        team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13

Tieni presente che il DataFrame risultante conserva solo le due colonne che abbiamo specificato.

Metodo 2: specificare le colonne da eliminare

Il codice seguente mostra come definire un nuovo DataFrame che rimuove le colonne “attends” e “bounce” dal DataFrame originale:

 #create new DataFrame and that drops 'assists' and 'rebounds'
df2 = df[df. columns [~df. columns . isin ([' assists ', ' rebounds '])]]

#view new DataFrame
df2

        team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13

Tieni presente che il DataFrame risultante rimuove le colonne “assist” e “rimbalzi” dal DataFrame originale e conserva le colonne rimanenti.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:

Come rimuovere la prima colonna in Pandas DataFrame
Come rimuovere le colonne duplicate in Pandas
Come eliminare le colonne per indice in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *