So berechnen sie die relative häufigkeit in python


Die relative Häufigkeit misst, wie oft ein bestimmter Wert in einem Datensatz im Verhältnis zur Gesamtzahl der Werte in einem Datensatz vorkommt.

Sie können die folgende Funktion in Python verwenden, um relative Häufigkeiten zu berechnen:

 def rel_freq (x):
freqs = [(value, x.count(value) / len(x)) for value in set(x)]
return freqs

Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel 1: Relative Häufigkeiten für eine Liste von Zahlen

Der folgende Code zeigt, wie diese Funktion verwendet wird, um die relativen Häufigkeiten einer Liste von Zahlen zu berechnen:

 #define data
data = [1, 1, 1, 2, 3, 4, 4]

#calculate relative frequencies for each value in list
rel_freq(data)

[(1, 0.42857142857142855),
 (2, 0.14285714285714285),
 (3, 0.14285714285714285),
 (4, 0.2857142857142857)]

Die Art und Weise, diese Ausgabe zu interpretieren, ist:

  • Der Wert „1“ hat im Datensatz eine relative Häufigkeit von 0,42857 .
  • Der Wert „2“ hat im Datensatz eine relative Häufigkeit von 0,142857 .
  • Der Wert „3“ hat im Datensatz eine relative Häufigkeit von 0,142857 .
  • Der Wert „4“ hat im Datensatz eine relative Häufigkeit von 0,28571 .

Sie werden feststellen, dass sich alle relativen Häufigkeiten zu 1 addieren.

Beispiel 2: Relative Häufigkeiten für eine Liste von Zeichen

Der folgende Code zeigt, wie diese Funktion verwendet wird, um die relativen Häufigkeiten einer Liste von Zeichen zu berechnen:

 #define data
data = ['a', 'a', 'b', 'b', 'c']

#calculate relative frequencies for each value in list
rel_freq(data)

[('a', 0.4), ('b', 0.4), ('c', 0.2)]

Die Art und Weise, diese Ausgabe zu interpretieren, ist:

  • Der Wert „a“ hat im Datensatz eine relative Häufigkeit von 0,4 .
  • Der Wert „b“ hat im Datensatz eine relative Häufigkeit von 0,4 .
  • Der Wert „c“ hat im Datensatz eine relative Häufigkeit von 0,2 .

Auch hier ergeben alle relativen Häufigkeiten zusammen 1.

Beispiel 3: Relative Häufigkeiten für eine Spalte in einem Pandas-DataFrame

Der folgende Code zeigt, wie diese Funktion verwendet wird, um relative Häufigkeiten für eine bestimmte Spalte in einem Pandas-DataFrame zu berechnen:

 import pandas as pd

#define data
data = pd.DataFrame({'A': [25, 15, 15, 14, 19],
                     'B': [5, 7, 7, 9, 12],
                     'C': [11, 8, 10, 6, 6]})

#calculate relative frequencies of values in column 'A'
rel_freq( list (data['A']))

[(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]

Die Art und Weise, diese Ausgabe zu interpretieren, ist:

  • Der Wert „25“ hat in der Spalte eine relative Häufigkeit von 0,2 .
  • Der Wert „19“ hat in der Spalte eine relative Häufigkeit von 0,2 .
  • Der Wert „14“ hat in der Spalte eine relative Häufigkeit von 0,2 .
  • Der Wert „15“ hat in der Spalte eine relative Häufigkeit von 0,4 .

Auch hier ergeben alle relativen Häufigkeiten zusammen 1.

Zusätzliche Ressourcen

Relativer Frequenzrechner
Histogramm der relativen Häufigkeit: Definition + Beispiel
So berechnen Sie die relative Häufigkeit in Excel

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert