Panda: come rimodellare il dataframe da largo a lungo


È possibile utilizzare la seguente sintassi di base per convertire un DataFrame panda da un formato ampio a un formato lungo:

 df = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])

In questo scenario, col1 è la colonna che utilizziamo come identificatore e col2 , col3 , ecc. sono le colonne di cui annulliamo il perno.

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: rimodella il Pandas DataFrame da largo a lungo

Supponiamo di avere i seguenti panda DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'],
                   ' points ': [88, 91, 99, 94],
                   ' assists ': [12, 17, 24, 28],
                   ' rebounds ': [22, 28, 30, 31]})

#view DataFrame
df

	team points assists rebounds
0 A 88 12 22
1 B 91 17 28
2 C 99 24 30
3 D 94 28 31

Possiamo utilizzare la seguente sintassi per rimodellare questo DataFrame da un formato ampio a un formato lungo:

 #reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])

#view updated DataFrame
df

	team variable value
0 A points 88
1 B points 91
2 C dots 9 9
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31

Il DataFrame è ora in un formato lungo.

Abbiamo utilizzato la colonna “squadra” come colonna di identificazione e abbiamo disattivato le colonne “punti”, “assist” e “rimbalzi”.

Tieni presente che possiamo anche utilizzare gli argomenti var_name e value_name per specificare i nomi delle colonne nel nuovo DataFrame lungo:

 #reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
             var_name=' metric ', value_name=' amount ')

#view updated DataFrame
df

	team metric amount
0 A points 88
1 B points 91
2 C points 99
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31

Nota : puoi trovare la documentazione completa della funzione pandas melt() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in Python:

Come aggiungere righe a un DataFrame Pandas
Come aggiungere colonne a un DataFrame Pandas
Come contare le occorrenze di valori specifici in Pandas DataFrame

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *