Panda: come utilizzare la prima colonna come indice
È possibile utilizzare i seguenti metodi per utilizzare la prima colonna come colonna di indice in un DataFrame panda:
Metodo 1: utilizzare la prima colonna come indice durante l’importazione di DataFrame
df = pd. read_csv (' my_data.csv ', index_col= 0 )
Metodo 2: utilizzare la prima colonna come indice con un DataFrame esistente
df = df. set_index ([' column1 '])
Gli esempi seguenti mostrano come utilizzare ciascun metodo nella pratica.
Esempio 1: utilizzare la prima colonna come indice durante l’importazione di DataFrame
Supponiamo di avere il seguente file CSV chiamato my_data.csv :
Se importiamo il file CSV senza specificare una colonna indice, panda creerà semplicemente una colonna indice con valori numerici a partire da 0:
#import CSV file without specifying index column df = pd. read_csv (' my_data.csv ') #view DataFrame print (df) team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
Tuttavia, possiamo utilizzare l’argomento index_col per specificare che la prima colonna del file CSV deve essere utilizzata come colonna dell’indice:
#import CSV file and specify index column df = pd. read_csv (' my_data.csv ', index_col= 0 ) #view DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Tieni presente che la colonna del team viene ora utilizzata come colonna dell’indice.
Esempio 2: utilizzare la prima colonna come indice con un DataFrame esistente
Supponiamo di avere i seguenti DataFrame panda esistenti:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]}) #view DataFrame df team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
Possiamo usare la funzione set_index() per impostare la colonna del team come colonna dell’indice:
#set 'team' column as index column df = df. set_index ([' team ']) #view updated DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Tieni presente che la colonna del team viene ora utilizzata come colonna dell’indice.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Come selezionare le colonne per indice in un Pandas DataFrame
Come rinominare l’indice in Pandas DataFrame
Come eliminare le colonne per indice in Pandas