Come preservare alcune colonne in panda (con esempi)
È possibile utilizzare i seguenti metodi per rendere persistenti solo determinate colonne in un DataFrame panda:
Metodo 1: specificare quali colonne mantenere
#only keep columns 'col1' and 'col2' df[[' col1 ', ' col2 ']]
Metodo 2: specificare le colonne da eliminare
#drop columns 'col3' and 'col4' df[df. columns [~df. columns . isin ([' col3 ',' col4 '])]]
Gli esempi seguenti mostrano come utilizzare ciascun metodo con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'], ' points ': [11, 7, 8, 10, 13, 13], ' assists ': [5, 7, 7, 9, 12, 9], ' rebounds ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team points assists rebounds 0 A 11 5 11 1 To 7 7 8 2 to 8 7 10 3 B 10 9 6 4 B 13 12 6 5 B 13 9 5
Metodo 1: specificare quali colonne mantenere
Il codice seguente mostra come definire un nuovo DataFrame che conserva solo le colonne “team” e “points”:
#create new DataFrame and only keep 'team' and 'points' columns
df2 = df[[' team ', ' points ']]
#view new DataFrame
df2
team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13
Tieni presente che il DataFrame risultante conserva solo le due colonne che abbiamo specificato.
Metodo 2: specificare le colonne da eliminare
Il codice seguente mostra come definire un nuovo DataFrame che rimuove le colonne “attends” e “bounce” dal DataFrame originale:
#create new DataFrame and that drops 'assists' and 'rebounds'
df2 = df[df. columns [~df. columns . isin ([' assists ', ' rebounds '])]]
#view new DataFrame
df2
team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13
Tieni presente che il DataFrame risultante rimuove le colonne “assist” e “rimbalzi” dal DataFrame originale e conserva le colonne rimanenti.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:
Come rimuovere la prima colonna in Pandas DataFrame
Come rimuovere le colonne duplicate in Pandas
Come eliminare le colonne per indice in Pandas