Pandas: so finden sie den maximalwert in jeder zeile


Sie können die folgende grundlegende Syntax verwenden, um den Maximalwert in jeder Zeile eines Pandas-DataFrames zu ermitteln:

 df[' max '] = df. max (axis= 1 )

Diese spezielle Syntax erstellt eine neue Spalte mit dem Namen „max“ , die den Maximalwert in jeder Zeile des DataFrame enthält.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Finden Sie den Maximalwert in jeder Zeile in Pandas

Angenommen, wir haben den folgenden Pandas-DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' points ': [4, np.nan, 10, 2, 15, np.nan, 7, 22],
                   ' rebounds ': [np.nan, 3, 9, 7, 6, 8, 14, 10],
                   ' assists ': [10, 9, 4, 4, 3, 7, 10, 11]})
    
#view DataFrame
print (df)

   points rebound assists
0 4.0 NaN 10
1 NaN 3.0 9
2 10.0 9.0 4
3 2.0 7.0 4
4 15.0 6.0 3
5 NaN 8.0 7
6 7.0 14.0 10
7 22.0 10.0 11

Mit der folgenden Syntax können wir eine neue Spalte namens „max“ erstellen, die den Maximalwert in jeder Zeile enthält:

 #create new column that contains max value of each row
df[' max '] = df. max (axis= 1 )

#view updated DataFrame
print (df)

   points rebounds assists max
0 4.0 NaN 10 10.0
1 NaN 3.0 9 9.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0

Die neue Spalte mit dem Namen „max“ enthält den Maximalwert in jeder Zeile.

Wir können zum Beispiel sehen:

  • Der Maximalwert in der ersten Zeile beträgt 10 .
  • Der Maximalwert in der zweiten Zeile beträgt 9 .
  • Der Maximalwert in der dritten Zeile beträgt 10 .

Und so weiter.

Beachten Sie außerdem, dass die Funktion max() automatisch NaN-Werte ignoriert, wenn sie den Maximalwert in jeder Zeile ermittelt.

Sie können den Maximalwert in jeder Zeile auch nur für bestimmte Spalten finden.

Sie können beispielsweise die folgende Syntax verwenden, um den Maximalwert in jeder Zeile zu ermitteln und nur die Spalten „Punkte “ und „Rebounds“ zu berücksichtigen:

 #add new column that contains max value of each row for points and rebounds columns
df[' max '] = df[[' points ', ' rebounds ']]. max (axis= 1 )

#view updated DataFrame
print (df)

   points rebounds assists max
0 4.0 NaN 10 4.0
1 NaN 3.0 9 3.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0

Die Spalte „ max“ enthält jetzt den Maximalwert in jeder Zeile nur für die Spalten „Punkte “ und „ Rebounds “.

Hinweis : Die vollständige Dokumentation für die Funktion pandas max() finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

Pandas: So ermitteln Sie den Maximalwert für mehrere Spalten
Pandas: Gibt eine Zeile mit dem Maximalwert in einer bestimmten Spalte zurück
Pandas: So ersetzen Sie inf durch Max Value

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert