Pandas: so verwenden sie die erste spalte als index


Sie können die folgenden Methoden verwenden, um die erste Spalte als Indexspalte in einem Pandas-DataFrame zu verwenden:

Methode 1: Beim Importieren von DataFrame die erste Spalte als Index verwenden

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

Methode 2: Verwenden Sie die erste Spalte als Index mit einem vorhandenen DataFrame

 df = df. set_index ([' column1 '])

Die folgenden Beispiele zeigen, wie die einzelnen Methoden in der Praxis angewendet werden.

Beispiel 1: Beim Importieren von DataFrame die erste Spalte als Index verwenden

Nehmen wir an, wir haben die folgende CSV-Datei mit dem Namen my_data.csv :

Wenn wir die CSV-Datei importieren, ohne eine Indexspalte anzugeben, erstellt Pandas einfach eine Indexspalte mit numerischen Werten beginnend bei 0:

 #import CSV file without specifying index column
df = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Wir können jedoch das Argument index_col verwenden, um anzugeben, dass die erste Spalte der CSV-Datei als Indexspalte verwendet werden soll:

 #import CSV file and specify index column
df = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Beachten Sie, dass die Teamspalte jetzt als Indexspalte verwendet wird.

Beispiel 2: Verwenden Sie die erste Spalte als Index mit einem vorhandenen DataFrame

Nehmen wir an, wir haben den folgenden vorhandenen Pandas-DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Wir können die Funktion set_index() verwenden, um die Teamspalte als Indexspalte festzulegen:

 #set 'team' column as index column
df = df. set_index ([' team '])

#view updated DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Beachten Sie, dass die Teamspalte jetzt als Indexspalte verwendet wird.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So wählen Sie Spalten nach Index in einem Pandas DataFrame aus
So benennen Sie den Index in Pandas DataFrame um
So löschen Sie Spalten nach Index in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert