So verwenden sie die funktion value_counts() von pandas (mit beispielen)


Sie können die Funktion value_counts() verwenden, um die Häufigkeit eindeutiger Werte in einer Pandas-Reihe zu zählen.

Diese Funktion verwendet die folgende grundlegende Syntax:

 my_series. value_counts ()

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Häufigkeit eindeutiger Werte zählen

Der folgende Code zeigt, wie das Vorkommen eindeutiger Werte in einer Pandas-Reihe gezählt wird:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

Das sagt uns:

  • Der Wert 3 erscheint 4 Mal.
  • Der Wert 4 erscheint zweimal .
  • Der Wert 7 erscheint zweimal .

Und so weiter.

Beispiel 2: Häufigkeit eindeutiger Werte zählen (einschließlich NaN)

Standardmäßig zeigt die Funktion value_counts() nicht die Häufigkeit von NaN-Werten an.

Sie können jedoch das Argument dropna verwenden, um die Häufigkeit von NaN-Werten anzuzeigen:

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

Beispiel 3: Zählen Sie die relative Häufigkeit eindeutiger Werte

Der folgende Code zeigt, wie das Argument normalize verwendet wird, um die relative Häufigkeit eindeutiger Werte in einer Pandas-Reihe zu zählen:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

Das sagt uns:

  • Der Wert 3 repräsentiert 40 % aller Werte der Reihe.
  • Der Wert 4 repräsentiert 20 % aller Werte in der Reihe.
  • Der Wert 7 repräsentiert 20 % aller Werte in der Reihe.

Und so weiter.

Beispiel 4: Zählhäufigkeit in Bins

Der folgende Code zeigt, wie das Argument „bins“ verwendet wird, um die Häufigkeit von Werten in einer Pandas-Reihe zu zählen, die in gleich große Bins fallen:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

Das sagt uns:

  • Es gibt 6 Werte zwischen 3 und 5.
  • Es gibt 2 Werte zwischen 5 und 7.
  • Es gibt 2 Werte zwischen 7 und 9.

Beispiel 5: Zählen Sie die Häufigkeit von Werten im Pandas DataFrame

Wir können auch die Funktion value_counts() verwenden, um die Häufigkeit eindeutiger Werte in einer bestimmten Spalte eines Pandas-DataFrames zu berechnen:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere allgemeine Funktionen in Pandas verwenden:

So verwenden Sie die Funktion „beschreiben()“ in Pandas
So zählen Sie die Anzahl der Zeilen in Pandas
So zählen Sie Gruppensichtungen bei Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert