So wählen sie spalten nach index in einem pandas dataframe aus


Häufig möchten Sie möglicherweise Spalten in einem Pandas-DataFrame basierend auf ihrem Indexwert auswählen.

Wenn Sie Spalten basierend auf der Ganzzahlindizierung auswählen möchten, können Sie die Funktion .iloc verwenden.

Wenn Sie Spalten basierend auf der Label-Indizierung auswählen möchten, können Sie die Funktion .loc verwenden.

Dieses Tutorial bietet ein Beispiel für die praktische Verwendung jeder dieser Funktionen.

Beispiel 1: Wählen Sie Spalten basierend auf der Ganzzahlindizierung aus

Der folgende Code zeigt, wie man einen Pandas-DataFrame erstellt und mit .iloc die Spalte mit einem ganzzahligen Indexwert von 3 auswählt:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [11, 7, 8, 10, 13, 13],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team points assists rebounds
0 A 11 5 11
1 To 7 7 8
2 to 8 7 10
3 B 10 9 6
4 B 13 12 6
5 B 13 9 5

#select column with index position 3
df. iloc [:, 3]

0 11
1 8
2 10
3 6
4 6
5 5
Name: rebounds, dtype: int64

Wir können eine ähnliche Syntax verwenden, um mehrere Spalten auszuwählen:

 #select columns with index positions 1 and 3
df. iloc [:, [1, 3]]


        rebound points
0 11 11
1 7 8
2 8 10
3 10 6
4 13 6
5 13 5

Oder wir könnten alle Spalten in einem Bereich auswählen:

 #select columns with index positions in range 0 through 3
df. iloc [:, 0:3]

        team points assists
0 to 11 5
1 To 7 7
2 to 8 7
3 B 10 9
4 B 13 12
5 B 13 9

Beispiel 2: Wählen Sie Spalten basierend auf der Etikettenindizierung aus

Der folgende Code zeigt, wie man einen Pandas-DataFrame erstellt und mit .loc die Spalte mit der Indexbezeichnung „bounces“ auswählt:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [11, 7, 8, 10, 13, 13],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team points assists rebounds
0 A 11 5 11
1 To 7 7 8
2 to 8 7 10
3 B 10 9 6
4 B 13 12 6
5 B 13 9 5

#select column with index label 'rebounds'
df. loc [:, ' rebounds ']

0 11
1 8
2 10
3 6
4 6
5 5
Name: rebounds, dtype: int64

Wir können eine ähnliche Syntax verwenden, um mehrere Spalten mit unterschiedlichen Indexbezeichnungen auszuwählen:

 #select the columns with index labels 'points' and 'rebounds'
df. loc [:,[' points ',' rebounds ']]

	rebound points
0 11 11
1 7 8
2 8 10
3 10 6
4 13 6
5 13 5

Oder wir könnten alle Spalten in einem Bereich auswählen:

 #select columns with index labels between 'team' and 'assists'
df. loc [:, ' team ':' assists ']

	team points assists
0 to 11 5
1 To 7 7
2 to 8 7
3 B 10 9
4 B 13 12
5 B 13 9

Verwandte Themen: Pandas loc vs. iloc: Was ist der Unterschied?

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So gruppieren Sie nach Index in einem Pandas DataFrame
So wählen Sie Zeilen nach Index in einem Pandas DataFrame aus
So erhalten Sie Zeilennummern in einem Pandas DataFrame
So entfernen Sie eine Indexspalte in einem Pandas DataFrame

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert