Jak liczyć unikalne wartości w pandach: z przykładami


Możesz użyć funkcji nunique() do zliczenia liczby unikalnych wartości w ramce DataFrame pandy.

Ta funkcja wykorzystuje następującą podstawową składnię:

 #count unique values in each column
df. nunique ()

#count unique values in each row
df. nunique (axis= 1 )

Poniższe przykłady pokazują, jak w praktyce używać tej funkcji z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 8, 13, 13, 22, 22, 25, 29],
                   ' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12

Przykład 1: Policz unikalne wartości w każdej kolumnie

Poniższy kod pokazuje, jak policzyć liczbę unikalnych wartości w każdej kolumnie DataFrame:

 #count unique values in each column
df. nunique ()

team 2
points 5
assists 5
rebounds 6
dtype: int64

Z wyniku możemy zobaczyć:

  • Kolumna „zespół” ma 2 unikalne wartości
  • Kolumna „punkty” ma 5 unikalnych wartości
  • Kolumna „pomoc” ma 5 unikalnych wartości
  • Kolumna „odbicia” ma 6 unikalnych wartości

Przykład 2: Policz unikalne wartości w każdym wierszu

Poniższy kod pokazuje, jak policzyć liczbę unikalnych wartości w każdym wierszu DataFrame:

 #count unique values in each row
df. nunique (axis= 1 )

0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64

Z wyniku możemy zobaczyć:

  • Pierwsza linia zawiera 4 unikalne wartości
  • Druga linia ma 2 unikalne wartości
  • Trzeci wiersz zawiera 4 unikalne wartości

I tak dalej.

Przykład 3: Policz unikalne wartości na grupę

Poniższy kod pokazuje, jak policzyć liczbę unikalnych wartości na grupę w DataFrame:

 #count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()

team
At 2
B 3
Name: points, dtype: int64

Z wyniku możemy zobaczyć:

  • Zespół „A” ma 2 unikalne wartości „punktowe”.
  • Zespół „B” ma 3 unikalne wartości „punktowe”.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Jak liczyć obserwacje grupowe u pand
Jak policzyć brakujące wartości w pandach
Jak korzystać z funkcji Pandy value_counts().

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *