Pandy: jak uzyskać liczbę częstotliwości wartości w kolumnie


Możesz użyć następujących metod, aby uzyskać częstotliwość wartości w kolumnie pandy DataFrame:

Metoda 1: Uzyskaj liczbę częstotliwości wartości w formie tabelarycznej

 df[' my_column ']. value_counts ()

Metoda 2: Uzyskaj liczbę częstotliwości wartości w formacie słownikowym

 df[' my_column ']. value_counts (). to_dict ()

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'],
                   ' points ': [12, 20, 25, 8, 12, 19, 27, 35]})

#view DataFrame
print (df)

  team points
0 to 12
1 to 20
2 to 25
3 to 8
4 B 12
5 B 19
6 B 27
7 C 35

Przykład 1: Uzyskaj liczbę częstotliwości wartości w formie tabelarycznej

Możemy użyć funkcji value_counts() , aby uzyskać liczbę częstotliwości każdej unikalnej wartości w kolumnie zespołu ramki DataFrame i wyświetlić wyniki w formie tabelarycznej:

 #get frequency count of values in 'team' column
df[' team ']. value_counts ()

At 4
B 3
C 1
Name: team, dtype: int64

Z wyników możemy zobaczyć:

  • Wartość „A” pojawia się 4 razy w kolumnie zespołu.
  • Wartość „B” pojawia się 3 razy w kolumnie zespołu.
  • Wartość „C” pojawia się 1 raz w kolumnie zespołu.

Należy pamiętać, że wyniki są wyświetlane w formie tabelarycznej.

Przykład 2: Uzyskaj liczbę częstotliwości wartości w formacie słownikowym

Możemy użyć funkcji value_counts() i funkcji to_dict() , aby uzyskać liczbę częstotliwości każdej unikalnej wartości w kolumnie zespołu ramki DataFrame i wyświetlić wyniki w formacie słownikowym:

 #get frequency count of values in 'team' column and display in dictionary
df[' team ']. value_counts (). to_dict ()

{'A': 4, 'B': 3, 'C': 1}

Liczniki częstotliwości każdej unikalnej wartości w kolumnie zespołu są wyświetlane w formie słownika.

Na przykład możemy zobaczyć:

  • Wartość „A” pojawia się 4 razy w kolumnie zespołu.
  • Wartość „B” pojawia się 3 razy w kolumnie zespołu.
  • Wartość „C” pojawia się 1 raz w kolumnie zespołu.

Odpowiada to liczbie częstotliwości z poprzedniej metody.

Wyniki są po prostu wyświetlane w innym formacie.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: jak korzystać z GroupBy i liczenia wartości
Pandy: Jak korzystać z GroupBy z liczbą pojemników
Pandy: Jak liczyć wartości w kolumnie z warunkiem

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *