Panda's: hoe u de maximale waarde in elke rij kunt vinden
U kunt de volgende basissyntaxis gebruiken om de maximale waarde in elke rij van een panda’s DataFrame te vinden:
df[' max '] = df. max (axis= 1 )
Deze specifieke syntaxis creëert een nieuwe kolom met de naam max , die de maximale waarde in elke rij van het DataFrame bevat.
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Zoek de maximale waarde in elke rij in Panda’s
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd
import numpy as np
#createDataFrame
df = pd. DataFrame ({' points ': [4, np.nan, 10, 2, 15, np.nan, 7, 22],
' rebounds ': [np.nan, 3, 9, 7, 6, 8, 14, 10],
' assists ': [10, 9, 4, 4, 3, 7, 10, 11]})
#view DataFrame
print (df)
points rebound assists
0 4.0 NaN 10
1 NaN 3.0 9
2 10.0 9.0 4
3 2.0 7.0 4
4 15.0 6.0 3
5 NaN 8.0 7
6 7.0 14.0 10
7 22.0 10.0 11
We kunnen de volgende syntaxis gebruiken om een nieuwe kolom te maken met de naam max , die de maximale waarde in elke rij bevat:
#create new column that contains max value of each row
df[' max '] = df. max (axis= 1 )
#view updated DataFrame
print (df)
points rebounds assists max
0 4.0 NaN 10 10.0
1 NaN 3.0 9 9.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0
De nieuwe kolom genaamd max bevat de maximale waarde in elke rij.
We kunnen bijvoorbeeld zien:
- De maximale waarde in de eerste regel is 10 .
- De maximale waarde in de tweede regel is 9 .
- De maximale waarde in de derde rij is 10 .
Enzovoort.
Merk ook op dat de functie max() automatisch NaN-waarden negeert bij het bepalen van de maximale waarde in elke rij.
U kunt de maximale waarde in elke rij ook alleen voor specifieke kolommen vinden.
U kunt bijvoorbeeld de volgende syntaxis gebruiken om de maximale waarde in elke rij te vinden en alleen de kolommen punten en rebounds in aanmerking te nemen:
#add new column that contains max value of each row for points and rebounds columns
df[' max '] = df[[' points ', ' rebounds ']]. max (axis= 1 )
#view updated DataFrame
print (df)
points rebounds assists max
0 4.0 NaN 10 4.0
1 NaN 3.0 9 3.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0
De kolom met de naam max bevat nu alleen de maximale waarde in elke rij voor de kolommen punten en rebounds .
Opmerking : u kunt hier de volledige documentatie voor de pandas max()- functie vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Panda’s: hoe u de maximale waarde voor meerdere kolommen kunt vinden
Panda’s: retourneer een rij met maximale waarde in een bepaalde kolom
Panda’s: inf vervangen door Max Value