Panda's: kolommen selecteren op gegevenstype


U kunt de volgende methoden gebruiken om kolommen in een Panda DataFrame te selecteren die gelijk zijn aan een specifiek gegevenstype:

Methode 1: Selecteer kolommen die gelijk zijn aan een specifiek gegevenstype

 #select all columns that have an int or float data type
df. select_dtypes (include=[' int ', ' float '])

Methode 2: Selecteer verschillende kolommen van een specifiek gegevenstype

 #select all columns that don't have a bool or object data type
df. select_dtypes (exclude=[' bool ', ' object '])

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' points ': [18, 22, 19, 14, 14, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' minutes ': [10.1, 12.0, 9.0, 8.0, 8.4, 7.5],
                   ' all_star ': [True, False, False, True, True, True]})

#view DataFrame
print (df)

  team points assists minutes all_star
0 A 18 5 10.1 True
1 B 22 7 12.0 False
2 C 19 7 9.0 False
3 D 14 9 8.0 True
4 E 14 12 8.4 True
5 F 11 9 7.5 True

Voorbeeld 1: Selecteer kolommen die gelijk zijn aan een specifiek gegevenstype

We kunnen de volgende code gebruiken om alle kolommen in het DataFrame te selecteren die een gegevenstype hebben dat gelijk is aan int of float :

 #select all columns that have an int or float data type
df. select_dtypes (include=[' int ', ' float '])

	minute assist points
0 18 5 10.1
1 22 7 12.0
2 19 7 9.0
3 14 9 8.0
4 14 12 8.4
5 11 9 7.5

Houd er rekening mee dat alleen kolommen met een gegevenstype gelijk aan int of float worden geselecteerd.

Voorbeeld 2: Selecteer verschillende kolommen van een specifiek gegevenstype

We kunnen de volgende code gebruiken om alle kolommen in het DataFrame te selecteren die geen gegevenstype hebben dat gelijk is aan bool of object :

 #select all columns that don't have a bool or object data type
df. select_dtypes (exclude=[' bool ', ' object '])

minute assist points
0 18 5 10.1
1 22 7 12.0
2 19 7 9.0
3 14 9 8.0
4 14 12 8.4
5 11 9 7.5

Houd er rekening mee dat alleen kolommen worden geselecteerd die geen gegevenstype hebben dat gelijk is aan bool of object .

Houd er ook rekening mee dat u de volgende syntaxis kunt gebruiken om het gegevenstype van elke kolom in het DataFrame weer te geven:

 #display data type of all columns
df. dtypes

team object
int64 dots
assists int64
minutes float64
all_star bool
dtype:object

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Panda’s: hoe u het type van alle kolommen in DataFrame kunt controleren
Panda’s: haal de index op van rijen waarvan de kolom overeenkomt met de waarde
Panda’s: een kolom instellen als index

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert