Come inserire una colonna in un dataframe pandas
Spesso potresti voler inserire una nuova colonna in un DataFrame panda. Fortunatamente, questo è facile da fare utilizzando la funzione pandas insert() , che utilizza la seguente sintassi:
insert(loc, colonna, valore,allow_duplicates=False)
Oro:
- loc: indice in cui inserire la colonna. La prima colonna è 0.
- colonna: Nome da dare alla nuova colonna.
- valore: matrice di valori per la nuova colonna.
- consent_duplicates: se consentire o meno che il nome della nuova colonna corrisponda al nome della colonna esistente. Il valore predefinito è Falso.
Questo tutorial mostra diversi esempi di utilizzo pratico di questa funzione.
Esempio 1: inserire una nuova colonna come prima colonna
Il codice seguente mostra come inserire una nuova colonna come prima colonna di un DataFrame esistente:
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #view DataFrame df points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 #insert new column 'player' as first column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= 0 , column='player', value=player_vals) df player points assists rebounds 0 to 25 5 11 1 B 12 7 8 2 C 15 7 10 3 D 14 9 6 4 E 19 12 6
Esempio 2: inserisci una nuova colonna come colonna centrale
Il codice seguente mostra come inserire una nuova colonna come terza colonna di un DataFrame esistente:
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #insert new column 'player' as third column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= 2 , column='player', value=player_vals) df points assists player rebounds 0 25 5 A 11 1 12 7 B 8 2 15 7 C 10 3 14 9 D 6 4 19 12 E 6
Esempio 3: inserire una nuova colonna come ultima colonna
Il codice seguente mostra come inserire una nuova colonna come ultima colonna di un DataFrame esistente:
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #insert new column 'player' as last column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= len (df.columns) , column='player', value=player_vals) df points assists player rebounds 0 25 5 A 11 1 12 7 B 8 2 15 7 C 10 3 14 9 D 6 4 19 12 E 6
Tieni presente che l’utilizzo di len(df.columns) ti consente di inserire una nuova colonna come ultima colonna di qualsiasi dataFrame, indipendentemente dal numero di colonne che può contenere.
Puoi trovare la documentazione completa della funzione insert() qui .