Come inserire una colonna in un dataframe pandas


Spesso potresti voler inserire una nuova colonna in un DataFrame panda. Fortunatamente, questo è facile da fare utilizzando la funzione pandas insert() , che utilizza la seguente sintassi:

insert(loc, colonna, valore,allow_duplicates=False)

Oro:

  • loc: indice in cui inserire la colonna. La prima colonna è 0.
  • colonna: Nome da dare alla nuova colonna.
  • valore: matrice di valori per la nuova colonna.
  • consent_duplicates: se consentire o meno che il nome della nuova colonna corrisponda al nome della colonna esistente. Il valore predefinito è Falso.

Questo tutorial mostra diversi esempi di utilizzo pratico di questa funzione.

Esempio 1: inserire una nuova colonna come prima colonna

Il codice seguente mostra come inserire una nuova colonna come prima colonna di un DataFrame esistente:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#view DataFrame
df
        points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

#insert new column 'player' as first column
player_vals = ['A', 'B', 'C', 'D', 'E']
df. insert (loc= 0 , column='player', value=player_vals)
df

        player points assists rebounds
0 to 25 5 11
1 B 12 7 8
2 C 15 7 10
3 D 14 9 6
4 E 19 12 6

Esempio 2: inserisci una nuova colonna come colonna centrale

Il codice seguente mostra come inserire una nuova colonna come terza colonna di un DataFrame esistente:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#insert new column 'player' as third column
player_vals = ['A', 'B', 'C', 'D', 'E']
df. insert (loc= 2 , column='player', value=player_vals)
df

        points assists player rebounds
0 25 5 A 11
1 12 7 B 8
2 15 7 C 10
3 14 9 D 6
4 19 12 E 6

Esempio 3: inserire una nuova colonna come ultima colonna

Il codice seguente mostra come inserire una nuova colonna come ultima colonna di un DataFrame esistente:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#insert new column 'player' as last column
player_vals = ['A', 'B', 'C', 'D', 'E']
df. insert (loc= len (df.columns) , column='player', value=player_vals)
df

        points assists player rebounds
0 25 5 A 11
1 12 7 B 8
2 15 7 C 10
3 14 9 D 6
4 19 12 E 6

Tieni presente che l’utilizzo di len(df.columns) ti consente di inserire una nuova colonna come ultima colonna di qualsiasi dataFrame, indipendentemente dal numero di colonne che può contenere.

Puoi trovare la documentazione completa della funzione insert() qui .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *