Hoe u een aantal.als-functie uitvoert in python
Vaak wilt u misschien alleen het aantal rijen tellen in een Panda DataFrame dat aan bepaalde criteria voldoet.
Gelukkig is dit eenvoudig te doen met behulp van de volgende basissyntaxis:
sum(df. column_name == some_value )
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken op het volgende dataframe:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})
#view head of DataFrame
df. head ()
x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9
Voorbeeld 1: Tel rijen die gelijk zijn aan een bepaalde waarde
De volgende code laat zien hoe je het aantal rijen telt waarin de variabele x gelijk is aan 10:
sum( df.x == 10 ) 2
De volgende code laat zien hoe u het aantal rijen telt waarin variabele x gelijk is aan 10 of variabele y gelijk is aan 5:
sum((df. x == 10 ) | (df. y == 5 )) 3
De volgende code laat zien hoe je het aantal rijen telt waarin de variabele x niet gelijk is aan 10:
sum( df.x != 10 ) 9
Voorbeeld 2: rijen tellen groter dan of gelijk aan een bepaalde waarde
De volgende code laat zien hoe u het aantal rijen telt waarin x groter is dan 10:
sum( df.x > 10 ) 2
De volgende code laat zien hoe u het aantal rijen telt waarin x kleiner is dan of gelijk is aan 7:
sum(df. x <= 7 ) 5
Voorbeeld 3: Tel lijnen tussen twee waarden
De volgende code laat zien hoe u het aantal rijen telt waarbij x tussen 10 en 20 ligt:
sum((df. x >= 5 ) & (df. x <= 10 )) 7
Aanvullende bronnen
Panda’s: hoe je het verschil tussen twee lijnen kunt vinden
Panda’s: regels verwijderen die een specifieke string bevatten
Panda’s: dubbele rijen in een DataFrame verwijderen