So zählen sie eindeutige werte in pandas: mit beispielen


Sie können die Funktion nunique() verwenden, um die Anzahl der eindeutigen Werte in einem Pandas-DataFrame zu zählen.

Diese Funktion verwendet die folgende grundlegende Syntax:

 #count unique values in each column
df. nunique ()

#count unique values in each row
df. nunique (axis= 1 )

Die folgenden Beispiele zeigen, wie diese Funktion in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 8, 13, 13, 22, 22, 25, 29],
                   ' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12

Beispiel 1: Zählen Sie eindeutige Werte in jeder Spalte

Der folgende Code zeigt, wie die Anzahl der eindeutigen Werte in jeder Spalte eines DataFrame gezählt wird:

 #count unique values in each column
df. nunique ()

team 2
points 5
assists 5
rebounds 6
dtype: int64

Aus dem Ergebnis können wir sehen:

  • Die Spalte „Team“ enthält zwei eindeutige Werte
  • Die Spalte „Punkte“ enthält 5 eindeutige Werte
  • Die Spalte „Unterstützung“ enthält 5 eindeutige Werte
  • Die Spalte „Rebounds“ enthält 6 eindeutige Werte

Beispiel 2: Zählen Sie eindeutige Werte in jeder Zeile

Der folgende Code zeigt, wie die Anzahl der eindeutigen Werte in jeder Zeile eines DataFrame gezählt wird:

 #count unique values in each row
df. nunique (axis= 1 )

0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64

Aus dem Ergebnis können wir sehen:

  • Die erste Zeile enthält 4 eindeutige Werte
  • Die zweite Zeile enthält zwei eindeutige Werte
  • Die dritte Zeile enthält 4 eindeutige Werte

Und so weiter.

Beispiel 3: Zählen Sie eindeutige Werte pro Gruppe

Der folgende Code zeigt, wie die Anzahl der eindeutigen Werte pro Gruppe in einem DataFrame gezählt wird:

 #count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()

team
At 2
B 3
Name: points, dtype: int64

Aus dem Ergebnis können wir sehen:

  • Team „A“ hat 2 eindeutige „Punkt“-Werte
  • Team „B“ hat 3 einzigartige „Punkt“-Werte

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So zählen Sie Gruppensichtungen bei Pandas
So zählen Sie fehlende Werte in Pandas
So verwenden Sie die Funktion value_counts() von Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert