Hoe de relatieve frequentie in python te berekenen


Relatieve frequentie meet hoe vaak een bepaalde waarde in een dataset voorkomt ten opzichte van het totale aantal waarden in een dataset.

Je kunt de volgende functie in Python gebruiken om relatieve frequenties te berekenen:

 def rel_freq (x):
freqs = [(value, x.count(value) / len(x)) for value in set(x)]
return freqs

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Relatieve frequenties voor een lijst met getallen

De volgende code laat zien hoe u deze functie kunt gebruiken om de relatieve frequenties van een lijst met getallen te berekenen:

 #define data
data = [1, 1, 1, 2, 3, 4, 4]

#calculate relative frequencies for each value in list
rel_freq(data)

[(1, 0.42857142857142855),
 (2, 0.14285714285714285),
 (3, 0.14285714285714285),
 (4, 0.2857142857142857)]

De manier om deze uitvoer te interpreteren is:

  • De waarde “1” heeft een relatieve frequentie van 0,42857 in de dataset.
  • De waarde “2” heeft een relatieve frequentie van 0,142857 in de dataset.
  • De waarde “3” heeft een relatieve frequentie van 0,142857 in de dataset.
  • De waarde “4” heeft een relatieve frequentie van 0,28571 in de dataset.

Je zult merken dat alle relatieve frequenties opgeteld 1 zijn.

Voorbeeld 2: Relatieve frequenties voor een lijst met tekens

De volgende code laat zien hoe u deze functie kunt gebruiken om de relatieve frequenties van een lijst met tekens te berekenen:

 #define data
data = ['a', 'a', 'b', 'b', 'c']

#calculate relative frequencies for each value in list
rel_freq(data)

[('a', 0.4), ('b', 0.4), ('c', 0.2)]

De manier om deze uitvoer te interpreteren is:

  • De waarde “a” heeft een relatieve frequentie van 0,4 in de dataset.
  • De waarde “b” heeft een relatieve frequentie van 0,4 in de dataset.
  • De waarde “c” heeft een relatieve frequentie van 0,2 in de dataset.

Nogmaals, alle relatieve frequenties zijn opgeteld 1.

Voorbeeld 3: Relatieve frequenties voor een kolom in een Panda DataFrame

De volgende code laat zien hoe u deze functie kunt gebruiken om relatieve frequenties te berekenen voor een specifieke kolom in een Panda DataFrame:

 import pandas as pd

#define data
data = pd.DataFrame({'A': [25, 15, 15, 14, 19],
                     'B': [5, 7, 7, 9, 12],
                     'C': [11, 8, 10, 6, 6]})

#calculate relative frequencies of values in column 'A'
rel_freq( list (data['A']))

[(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]

De manier om deze uitvoer te interpreteren is:

  • De waarde „25“ heeft een relatieve frequentie van 0,2 in de kolom.
  • De waarde “19” heeft een relatieve frequentie van 0,2 in de kolom.
  • De waarde “14” heeft een relatieve frequentie van 0,2 in de kolom.
  • De waarde “15” heeft een relatieve frequentie van 0,4 in de kolom.

Nogmaals, alle relatieve frequenties zijn opgeteld 1.

Aanvullende bronnen

Relatieve frequentiecalculator
Relatief frequentiehistogram: definitie + voorbeeld
Hoe de relatieve frequentie in Excel te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert