Hoe de relatieve frequentie in python te berekenen
Relatieve frequentie meet hoe vaak een bepaalde waarde in een dataset voorkomt ten opzichte van het totale aantal waarden in een dataset.
Je kunt de volgende functie in Python gebruiken om relatieve frequenties te berekenen:
def rel_freq (x): freqs = [(value, x.count(value) / len(x)) for value in set(x)] return freqs
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Relatieve frequenties voor een lijst met getallen
De volgende code laat zien hoe u deze functie kunt gebruiken om de relatieve frequenties van een lijst met getallen te berekenen:
#define data data = [1, 1, 1, 2, 3, 4, 4] #calculate relative frequencies for each value in list rel_freq(data) [(1, 0.42857142857142855), (2, 0.14285714285714285), (3, 0.14285714285714285), (4, 0.2857142857142857)]
De manier om deze uitvoer te interpreteren is:
- De waarde “1” heeft een relatieve frequentie van 0,42857 in de dataset.
- De waarde “2” heeft een relatieve frequentie van 0,142857 in de dataset.
- De waarde “3” heeft een relatieve frequentie van 0,142857 in de dataset.
- De waarde “4” heeft een relatieve frequentie van 0,28571 in de dataset.
Je zult merken dat alle relatieve frequenties opgeteld 1 zijn.
Voorbeeld 2: Relatieve frequenties voor een lijst met tekens
De volgende code laat zien hoe u deze functie kunt gebruiken om de relatieve frequenties van een lijst met tekens te berekenen:
#define data data = ['a', 'a', 'b', 'b', 'c'] #calculate relative frequencies for each value in list rel_freq(data) [('a', 0.4), ('b', 0.4), ('c', 0.2)]
De manier om deze uitvoer te interpreteren is:
- De waarde “a” heeft een relatieve frequentie van 0,4 in de dataset.
- De waarde “b” heeft een relatieve frequentie van 0,4 in de dataset.
- De waarde “c” heeft een relatieve frequentie van 0,2 in de dataset.
Nogmaals, alle relatieve frequenties zijn opgeteld 1.
Voorbeeld 3: Relatieve frequenties voor een kolom in een Panda DataFrame
De volgende code laat zien hoe u deze functie kunt gebruiken om relatieve frequenties te berekenen voor een specifieke kolom in een Panda DataFrame:
import pandas as pd #define data data = pd.DataFrame({'A': [25, 15, 15, 14, 19], 'B': [5, 7, 7, 9, 12], 'C': [11, 8, 10, 6, 6]}) #calculate relative frequencies of values in column 'A' rel_freq( list (data['A'])) [(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]
De manier om deze uitvoer te interpreteren is:
- De waarde „25“ heeft een relatieve frequentie van 0,2 in de kolom.
- De waarde “19” heeft een relatieve frequentie van 0,2 in de kolom.
- De waarde “14” heeft een relatieve frequentie van 0,2 in de kolom.
- De waarde “15” heeft een relatieve frequentie van 0,4 in de kolom.
Nogmaals, alle relatieve frequenties zijn opgeteld 1.
Aanvullende bronnen
Relatieve frequentiecalculator
Relatief frequentiehistogram: definitie + voorbeeld
Hoe de relatieve frequentie in Excel te berekenen