Cos'è una distribuzione bimodale?


Una distribuzione bimodale è una distribuzione di probabilità con due modalità.

Usiamo spesso il termine “modalità” nelle statistiche descrittive per fare riferimento al valore più comune in un set di dati, ma in questo caso il termine “modalità” si riferisce a un massimo locale in un grafico.

Quando visualizzi una distribuzione bimodale, noterai due “picchi” distinti che rappresentano queste due modalità.

Distribuzione bimodale

Ciò è diverso da una distribuzione unimodale che ha un solo picco:

Distribuzione unimodale

Puoi ricordare la differenza tra i due ricordando:

  • “bi” = due
  • “unito” = uno

Sebbene la maggior parte dei corsi di statistica utilizzi distribuzioni unimodali come la distribuzione normale per spiegare diversi argomenti, le distribuzioni bimodali compaiono abbastanza spesso nella pratica, quindi è utile sapere come riconoscerle e interpretarle.

Nota: una distribuzione bimodale è un tipo specifico di distribuzione multimodale .

Esempi di distribuzioni bimodali

Ecco alcuni esempi di distribuzioni bimodali:

Esempio n. 1: ore di punta del ristorante

Se creassi un grafico per visualizzare la distribuzione oraria dei clienti in un determinato ristorante, probabilmente scoprirai che segue una distribuzione bimodale con un picco durante l’ora del pranzo e un altro picco durante l’ora della cena:

Esempio di distribuzione bimodale

Esempio n. 2: Altezza media di due specie di piante

Supponiamo di camminare in un campo e misurare l’altezza di diverse piante. Senza rendervene conto, state misurando le dimensioni di due specie diverse: una piuttosto grande e l’altra piuttosto piccola. Se creassi un grafico per visualizzare la distribuzione delle altezze, seguirebbe una distribuzione bimodale:

Esempio di distribuzione bimodale

Esempio n.3: risultati dell’esame

Supponiamo che un insegnante dia un esame alla sua classe di studenti. Alcuni studenti hanno studiato per l’esame, altri no. Quando l’insegnante crea un grafico dei risultati degli esami, segue una distribuzione bimodale con un picco attorno ai punteggi bassi per gli studenti che non hanno studiato e un altro picco attorno ai punteggi alti per gli studenti che hanno studiato:

Esempio di distribuzione bimodale con risultati del test

Cosa causa le distribuzioni bimodali?

Generalmente ci sono due cose che causano distribuzioni bimodali:

1. Alcuni fenomeni di fondo.

Le distribuzioni bimodali si verificano spesso a causa di alcuni fenomeni sottostanti.

Ad esempio, il numero di clienti che visitano un ristorante ogni ora segue una distribuzione bimodale poiché le persone tendono a mangiare al ristorante in due orari distinti: pranzo e cena. Questo comportamento umano sottostante è l’origine della distribuzione bimodale.

2. Due gruppi diversi raggruppati insieme.

Le distribuzioni bimodali possono verificarsi anche quando si analizzano semplicemente due diversi gruppi di cose senza rendersene conto.

Ad esempio, se misuri l’altezza delle piante in un determinato campo senza renderti conto che due specie diverse crescono nello stesso campo, vedrai una distribuzione bimodale quando crei un grafico.

Come analizzare le distribuzioni bimodali

Spesso descriviamo le distribuzioni utilizzando la media o la mediana perché questo ci dà un’idea di dove si trova il “centro” della distribuzione.

Sfortunatamente, la media e la mediana non sono utili da conoscere per una distribuzione bimodale. Ad esempio, il punteggio medio dell’esame degli studenti nell’esempio sopra è 81:

Tuttavia, pochissimi studenti hanno ottenuto un punteggio vicino a 81. In questo caso, la media è fuorviante. La maggior parte degli studenti in realtà ha ottenuto un punteggio di circa 74 o 88.

Un modo migliore per analizzare e interpretare le distribuzioni bimodali è semplicemente dividere i dati in due gruppi distinti e quindi analizzare il centro e la distribuzione per ciascun gruppo.

Ad esempio, possiamo dividere i risultati dell’esame in “punteggi bassi” e “punteggi alti” e quindi trovare la media e la deviazione standard per ciascun gruppo.

Se stai condividendo i risultati di un’analisi e i tuoi dati seguono una distribuzione bimodale, è utile creare un istogramma come quelli mostrati sopra in modo che il tuo pubblico possa vedere chiaramente che la distribuzione ha due “picchi” distinti e che fa solo senso analizzare ogni picco separatamente piuttosto che come un unico grande set di dati.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *