Cos'è una distribuzione di frequenza relativa?
Una distribuzione di frequenza descrive la frequenza con cui compaiono valori diversi in un set di dati.
Ad esempio, supponiamo di raccogliere un semplice campione casuale di 400 famiglie in una città e di registrare il numero di animali domestici in ciascuna famiglia. La tabella seguente mostra i risultati:
Questa tabella rappresenta una distribuzione di frequenza.
Una distribuzione correlata è nota come distribuzione di frequenza relativa , che mostra la frequenza relativa di ciascun valore in un set di dati come percentuale di tutte le frequenze.
Ad esempio, nella tabella precedente abbiamo visto che i nuclei familiari erano complessivamente 400. Per trovare la frequenza relativa di ciascun valore nella distribuzione, dividiamo semplicemente ogni singola frequenza per 400:
Si noti che le distribuzioni di frequenza relative hanno le seguenti proprietà:
- Ogni singola frequenza relativa varia dallo 0% al 100%.
- La somma di tutte le frequenze relative individuali dà come risultato il 100%.
Se queste condizioni non sono soddisfatte, la relativa distribuzione di frequenza non è valida.
Perché le distribuzioni di frequenza relativa sono utili
Le distribuzioni di frequenza relative sono utili perché ci consentono di comprendere quanto sia comune un valore in un set di dati rispetto a tutti gli altri valori.
Nell’esempio precedente abbiamo visto che 150 famiglie avevano un solo animale domestico. Ma questo numero di per sé non è particolarmente utile.
È invece più utile sapere che il 37,5% di tutte le famiglie del campione possiede un solo animale domestico. Questo ci aiuta a capire che poco più di una famiglia su tre aveva un solo animale domestico, il che ci dà un’idea di quanto sia “comune” possedere un solo animale domestico.
Visualizzazione di una distribuzione di frequenza relativa
Il modo più comune per visualizzare una distribuzione di frequenza relativa è creare un istogramma di frequenza relativa , che mostra i singoli valori dei dati lungo l’asse x di un grafico e utilizza barre per rappresentare le frequenze relative di ciascuna classe lungo l’asse y.
Ad esempio, ecco come apparirebbe un istogramma di frequenza relativa per i dati del nostro esempio precedente:
L’asse x mostra il numero di animali domestici presenti nella famiglia mentre l’asse y mostra la frequenza relativa delle famiglie che possiedono quel numero di animali domestici.
Questo istogramma è un modo utile per visualizzare la distribuzione relativa della frequenza.
Risorse addizionali
Calcolatore della frequenza relativa
Come calcolare la frequenza relativa in Excel
Come calcolare la frequenza relativa in Python
Come creare un istogramma di frequenza relativo in R