Pandas: so verwenden sie loc, um mehrere spalten auszuwählen


Sie können die Loc- Funktion in Pandas verwenden, um mehrere Spalten in einem DataFrame nach Beschriftung auszuwählen.

Hier sind die häufigsten Methoden, dies zu tun:

Methode 1: Wählen Sie mehrere Spalten nach Namen aus

 df. loc [:,[' col2 ',' col4 ']]

Methode 2: Wählen Sie alle Spalten im Bereich aus

 df. loc [:, ' col2 ':' col4 ']

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Beispiel 1: Wählen Sie mehrere Spalten nach Namen aus

Der folgende Code zeigt, wie Sie mit der Loc- Funktion die Spalten „points“ und „bounces“ des DataFrame auswählen:

 #select points and rebounds columns
df. loc [:,[' points ',' rebounds ']]

        rebound points
0 5 6
1 7 7
2 7 7
3 9 6
4 12 10
5 9 12
6 9 10
7 4 9

Beachten Sie, dass jede Zeile in den Spalten „Punkte“ und „Rebounds“ zurückgegeben wird.

Beachten Sie außerdem, dass die Reihenfolge, in der Sie die Spalten in der Funktion loc angeben, auch die Reihenfolge ist, in der sie zurückgegeben werden.

Beispielsweise könnten wir zuerst die Spalte „Rebounds“ und dann die Spalte „Points“ zurückgeben:

 #select rebounds and points columns
df. loc [:, [' rebounds ', ' points ']]

	rebound points
0 6 5
1 7 7
2 7 7
3 6 9
4 10 12
5 12 9
6 10 9
7 9 4

Beispiel 2: Wählen Sie alle Spalten im Bereich aus

Der folgende Code zeigt, wie Sie mit der Loc- Funktion alle Spalten zwischen den Spalten „points“ und „bounces“ im DataFrame auswählen:

 #select all columns between points and rebounds columns
df. loc [:, ' points ': ' rebounds ']

	points assists rebounds
0 5 11 6
1 7 8 7
2 7 10 7
3 9 6 6
4 12 6 10
5 9 5 12
6 9 9 10
7 4 12 9

Beachten Sie, dass alle Spalten zwischen den Spalten „points“ und „bounces“ im DataFrame zurückgegeben werden.

Hinweis : Um Spalten nach Indexposition auszuwählen, verwenden Sie stattdessen die iloc- Funktion.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So wählen Sie mit Pandas Loc Zeilen basierend auf mehreren Bedingungen aus
So wählen Sie Zeilen basierend auf Spaltenwerten in Pandas aus
So wählen Sie Zeilen nach Index in Pandas aus

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert