Panda's: hoe u de maximale waarde in elke rij kunt vinden


U kunt de volgende basissyntaxis gebruiken om de maximale waarde in elke rij van een panda’s DataFrame te vinden:

 df[' max '] = df. max (axis= 1 )

Deze specifieke syntaxis creëert een nieuwe kolom met de naam max , die de maximale waarde in elke rij van het DataFrame bevat.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Zoek de maximale waarde in elke rij in Panda’s

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' points ': [4, np.nan, 10, 2, 15, np.nan, 7, 22],
                   ' rebounds ': [np.nan, 3, 9, 7, 6, 8, 14, 10],
                   ' assists ': [10, 9, 4, 4, 3, 7, 10, 11]})
    
#view DataFrame
print (df)

   points rebound assists
0 4.0 NaN 10
1 NaN 3.0 9
2 10.0 9.0 4
3 2.0 7.0 4
4 15.0 6.0 3
5 NaN 8.0 7
6 7.0 14.0 10
7 22.0 10.0 11

We kunnen de volgende syntaxis gebruiken om een nieuwe kolom te maken met de naam max , die de maximale waarde in elke rij bevat:

 #create new column that contains max value of each row
df[' max '] = df. max (axis= 1 )

#view updated DataFrame
print (df)

   points rebounds assists max
0 4.0 NaN 10 10.0
1 NaN 3.0 9 9.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0

De nieuwe kolom genaamd max bevat de maximale waarde in elke rij.

We kunnen bijvoorbeeld zien:

  • De maximale waarde in de eerste regel is 10 .
  • De maximale waarde in de tweede regel is 9 .
  • De maximale waarde in de derde rij is 10 .

Enzovoort.

Merk ook op dat de functie max() automatisch NaN-waarden negeert bij het bepalen van de maximale waarde in elke rij.

U kunt de maximale waarde in elke rij ook alleen voor specifieke kolommen vinden.

U kunt bijvoorbeeld de volgende syntaxis gebruiken om de maximale waarde in elke rij te vinden en alleen de kolommen punten en rebounds in aanmerking te nemen:

 #add new column that contains max value of each row for points and rebounds columns
df[' max '] = df[[' points ', ' rebounds ']]. max (axis= 1 )

#view updated DataFrame
print (df)

   points rebounds assists max
0 4.0 NaN 10 4.0
1 NaN 3.0 9 3.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0

De kolom met de naam max bevat nu alleen de maximale waarde in elke rij voor de kolommen punten en rebounds .

Opmerking : u kunt hier de volledige documentatie voor de pandas max()- functie vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Panda’s: hoe u de maximale waarde voor meerdere kolommen kunt vinden
Panda’s: retourneer een rij met maximale waarde in een bepaalde kolom
Panda’s: inf vervangen door Max Value

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert