Panda's: loc gebruiken om meerdere kolommen te selecteren


U kunt de loc- functie in panda’s gebruiken om meerdere kolommen in een DataFrame op label te selecteren.

Hier zijn de meest gebruikelijke manieren om dit te doen:

Methode 1: Selecteer meerdere kolommen op naam

 df. loc [:,[' col2 ',' col4 ']]

Methode 2: Selecteer alle kolommen in het bereik

 df. loc [:, ' col2 ':' col4 ']

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Voorbeeld 1: selecteer meerdere kolommen op naam

De volgende code laat zien hoe u de loc- functie gebruikt om de kolommen „points“ en „bounces“ van het DataFrame te selecteren:

 #select points and rebounds columns
df. loc [:,[' points ',' rebounds ']]

        rebound points
0 5 6
1 7 7
2 7 7
3 9 6
4 12 10
5 9 12
6 9 10
7 4 9

Houd er rekening mee dat elke rij in de kolommen “punten” en “rebounds” wordt geretourneerd.

Houd er ook rekening mee dat de volgorde waarin u de kolommen in de loc -functie opgeeft, de volgorde is waarin ze worden geretourneerd.

We kunnen bijvoorbeeld eerst de kolom ‘rebounds’ retourneren en vervolgens de kolom ‘punten’:

 #select rebounds and points columns
df. loc [:, [' rebounds ', ' points ']]

	rebound points
0 6 5
1 7 7
2 7 7
3 6 9
4 10 12
5 12 9
6 10 9
7 9 4

Voorbeeld 2: Selecteer alle kolommen in het bereik

De volgende code laat zien hoe u de loc- functie gebruikt om alle kolommen tussen de kolommen ‚points‘ en ‚bounces‘ in het DataFrame te selecteren:

 #select all columns between points and rebounds columns
df. loc [:, ' points ': ' rebounds ']

	points assists rebounds
0 5 11 6
1 7 8 7
2 7 10 7
3 9 6 6
4 12 6 10
5 9 5 12
6 9 9 10
7 4 12 9

Houd er rekening mee dat alle kolommen tussen de kolommen ‚punten‘ en ‚bounces‘ in het DataFrame worden geretourneerd.

Opmerking : om kolommen op indexpositie te selecteren, gebruikt u in plaats daarvan de iloc- functie.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe u rijen selecteert op basis van meerdere voorwaarden met behulp van Pandas Loc
Hoe u rijen selecteert op basis van kolomwaarden in Pandas
Hoe rijen op index te selecteren in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert