So berechnen sie die relative häufigkeit in python
Die relative Häufigkeit misst, wie oft ein bestimmter Wert in einem Datensatz im Verhältnis zur Gesamtzahl der Werte in einem Datensatz vorkommt.
Sie können die folgende Funktion in Python verwenden, um relative Häufigkeiten zu berechnen:
def rel_freq (x): freqs = [(value, x.count(value) / len(x)) for value in set(x)] return freqs
Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel 1: Relative Häufigkeiten für eine Liste von Zahlen
Der folgende Code zeigt, wie diese Funktion verwendet wird, um die relativen Häufigkeiten einer Liste von Zahlen zu berechnen:
#define data data = [1, 1, 1, 2, 3, 4, 4] #calculate relative frequencies for each value in list rel_freq(data) [(1, 0.42857142857142855), (2, 0.14285714285714285), (3, 0.14285714285714285), (4, 0.2857142857142857)]
Die Art und Weise, diese Ausgabe zu interpretieren, ist:
- Der Wert „1“ hat im Datensatz eine relative Häufigkeit von 0,42857 .
- Der Wert „2“ hat im Datensatz eine relative Häufigkeit von 0,142857 .
- Der Wert „3“ hat im Datensatz eine relative Häufigkeit von 0,142857 .
- Der Wert „4“ hat im Datensatz eine relative Häufigkeit von 0,28571 .
Sie werden feststellen, dass sich alle relativen Häufigkeiten zu 1 addieren.
Beispiel 2: Relative Häufigkeiten für eine Liste von Zeichen
Der folgende Code zeigt, wie diese Funktion verwendet wird, um die relativen Häufigkeiten einer Liste von Zeichen zu berechnen:
#define data data = ['a', 'a', 'b', 'b', 'c'] #calculate relative frequencies for each value in list rel_freq(data) [('a', 0.4), ('b', 0.4), ('c', 0.2)]
Die Art und Weise, diese Ausgabe zu interpretieren, ist:
- Der Wert „a“ hat im Datensatz eine relative Häufigkeit von 0,4 .
- Der Wert „b“ hat im Datensatz eine relative Häufigkeit von 0,4 .
- Der Wert „c“ hat im Datensatz eine relative Häufigkeit von 0,2 .
Auch hier ergeben alle relativen Häufigkeiten zusammen 1.
Beispiel 3: Relative Häufigkeiten für eine Spalte in einem Pandas-DataFrame
Der folgende Code zeigt, wie diese Funktion verwendet wird, um relative Häufigkeiten für eine bestimmte Spalte in einem Pandas-DataFrame zu berechnen:
import pandas as pd #define data data = pd.DataFrame({'A': [25, 15, 15, 14, 19], 'B': [5, 7, 7, 9, 12], 'C': [11, 8, 10, 6, 6]}) #calculate relative frequencies of values in column 'A' rel_freq( list (data['A'])) [(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]
Die Art und Weise, diese Ausgabe zu interpretieren, ist:
- Der Wert „25“ hat in der Spalte eine relative Häufigkeit von 0,2 .
- Der Wert „19“ hat in der Spalte eine relative Häufigkeit von 0,2 .
- Der Wert „14“ hat in der Spalte eine relative Häufigkeit von 0,2 .
- Der Wert „15“ hat in der Spalte eine relative Häufigkeit von 0,4 .
Auch hier ergeben alle relativen Häufigkeiten zusammen 1.
Zusätzliche Ressourcen
Relativer Frequenzrechner
Histogramm der relativen Häufigkeit: Definition + Beispiel
So berechnen Sie die relative Häufigkeit in Excel