Panda: come utilizzare la prima colonna come indice


È possibile utilizzare i seguenti metodi per utilizzare la prima colonna come colonna di indice in un DataFrame panda:

Metodo 1: utilizzare la prima colonna come indice durante l’importazione di DataFrame

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

Metodo 2: utilizzare la prima colonna come indice con un DataFrame esistente

 df = df. set_index ([' column1 '])

Gli esempi seguenti mostrano come utilizzare ciascun metodo nella pratica.

Esempio 1: utilizzare la prima colonna come indice durante l’importazione di DataFrame

Supponiamo di avere il seguente file CSV chiamato my_data.csv :

Se importiamo il file CSV senza specificare una colonna indice, panda creerà semplicemente una colonna indice con valori numerici a partire da 0:

 #import CSV file without specifying index column
df = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Tuttavia, possiamo utilizzare l’argomento index_col per specificare che la prima colonna del file CSV deve essere utilizzata come colonna dell’indice:

 #import CSV file and specify index column
df = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Tieni presente che la colonna del team viene ora utilizzata come colonna dell’indice.

Esempio 2: utilizzare la prima colonna come indice con un DataFrame esistente

Supponiamo di avere i seguenti DataFrame panda esistenti:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Possiamo usare la funzione set_index() per impostare la colonna del team come colonna dell’indice:

 #set 'team' column as index column
df = df. set_index ([' team '])

#view updated DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Tieni presente che la colonna del team viene ora utilizzata come colonna dell’indice.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come selezionare le colonne per indice in un Pandas DataFrame
Come rinominare l’indice in Pandas DataFrame
Come eliminare le colonne per indice in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *