Wat is een relatieve frequentieverdeling?
Een frequentieverdeling beschrijft hoe vaak verschillende waarden in een dataset voorkomen.
Stel dat we bijvoorbeeld een eenvoudige willekeurige steekproef van 400 huishoudens in een stad nemen en het aantal huisdieren in elk huishouden registreren. De volgende tabel toont de resultaten:
Deze tabel vertegenwoordigt een frequentieverdeling.
Een gerelateerde verdeling staat bekend als de relatieve frequentieverdeling , die de relatieve frequentie van elke waarde in een dataset weergeeft als percentage van alle frequenties.
In de vorige tabel zagen we bijvoorbeeld dat er in totaal 400 huishoudens waren. Om de relatieve frequentie van elke waarde in de verdeling te vinden, delen we eenvoudigweg elke individuele frequentie door 400:
Merk op dat relatieve frequentieverdelingen de volgende eigenschappen hebben:
- Elke individuele relatieve frequentie varieert van 0% tot 100%.
- De som van alle individuele relatieve frequenties bedraagt 100%.
Als niet aan deze voorwaarden wordt voldaan, is de relatieve frequentieverdeling ongeldig.
Waarom relatieve frequentieverdelingen nuttig zijn
Relatieve frequentieverdelingen zijn nuttig omdat ze ons in staat stellen te begrijpen hoe vaak een waarde in een dataset voorkomt in vergelijking met alle andere waarden.
In het vorige voorbeeld zagen we dat 150 huishoudens slechts één huisdier hadden. Maar dit aantal is op zichzelf niet bijzonder nuttig.
In plaats daarvan is het nuttiger om te weten dat 37,5% van alle huishoudens in de steekproef slechts één huisdier had. Dit helpt ons te begrijpen dat iets meer dan één op de drie huishoudens slechts één huisdier had, wat ons een idee geeft van hoe ‘gewoon’ het is om één huisdier te bezitten.
Visualisatie van een relatieve frequentieverdeling
De meest gebruikelijke manier om een relatieve frequentieverdeling te visualiseren is door een relatief frequentiehistogram te maken, dat individuele gegevenswaarden langs de x-as van een grafiek weergeeft en balken gebruikt om de relatieve frequenties van elke klasse langs de y-as weer te geven.
Hier ziet u bijvoorbeeld hoe een relatief frequentiehistogram eruit zou zien voor de gegevens uit ons vorige voorbeeld:
Op de x-as wordt het aantal huisdieren in het huishouden weergegeven en op de y-as wordt de relatieve frequentie weergegeven van huishoudens die dat aantal huisdieren bezitten.
Dit histogram is een handige manier om de relatieve frequentieverdeling te visualiseren.
Aanvullende bronnen
Relatieve frequentiecalculator
Hoe de relatieve frequentie in Excel te berekenen
Hoe de relatieve frequentie in Python te berekenen
Hoe maak je een relatief frequentiehistogram in R