So zählen sie eindeutige werte in pandas: mit beispielen
Sie können die Funktion nunique() verwenden, um die Anzahl der eindeutigen Werte in einem Pandas-DataFrame zu zählen.
Diese Funktion verwendet die folgende grundlegende Syntax:
#count unique values in each column df. nunique () #count unique values in each row df. nunique (axis= 1 )
Die folgenden Beispiele zeigen, wie diese Funktion in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [8, 8, 13, 13, 22, 22, 25, 29],
' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})
#view DataFrame
df
team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12
Beispiel 1: Zählen Sie eindeutige Werte in jeder Spalte
Der folgende Code zeigt, wie die Anzahl der eindeutigen Werte in jeder Spalte eines DataFrame gezählt wird:
#count unique values in each column
df. nunique ()
team 2
points 5
assists 5
rebounds 6
dtype: int64
Aus dem Ergebnis können wir sehen:
- Die Spalte „Team“ enthält zwei eindeutige Werte
- Die Spalte „Punkte“ enthält 5 eindeutige Werte
- Die Spalte „Unterstützung“ enthält 5 eindeutige Werte
- Die Spalte „Rebounds“ enthält 6 eindeutige Werte
Beispiel 2: Zählen Sie eindeutige Werte in jeder Zeile
Der folgende Code zeigt, wie die Anzahl der eindeutigen Werte in jeder Zeile eines DataFrame gezählt wird:
#count unique values in each row
df. nunique (axis= 1 )
0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64
Aus dem Ergebnis können wir sehen:
- Die erste Zeile enthält 4 eindeutige Werte
- Die zweite Zeile enthält zwei eindeutige Werte
- Die dritte Zeile enthält 4 eindeutige Werte
Und so weiter.
Beispiel 3: Zählen Sie eindeutige Werte pro Gruppe
Der folgende Code zeigt, wie die Anzahl der eindeutigen Werte pro Gruppe in einem DataFrame gezählt wird:
#count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()
team
At 2
B 3
Name: points, dtype: int64
Aus dem Ergebnis können wir sehen:
- Team „A“ hat 2 eindeutige „Punkt“-Werte
- Team „B“ hat 3 einzigartige „Punkt“-Werte
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So zählen Sie Gruppensichtungen bei Pandas
So zählen Sie fehlende Werte in Pandas
So verwenden Sie die Funktion value_counts() von Pandas