Cos’è una distribuzione multimodale?


Una distribuzione multimodale è una distribuzione di probabilità con due o più modalità.

Se crei un istogramma per visualizzare una distribuzione multimodale, noterai che presenta diversi picchi:

Distribuzione multimodale

Se una distribuzione ha esattamente due picchi, allora è considerata una distribuzione bimodale , che è un tipo specifico di distribuzione multimodale.

Ciò contrasta con una distribuzione unimodale, che ha un solo picco:

Sebbene le distribuzioni unimodali come la distribuzione normale siano spesso utilizzate per spiegare argomenti di statistica, le distribuzioni multimodali in realtà appaiono abbastanza spesso nella pratica, quindi è utile sapere come riconoscerle e analizzarle.

Esempi di distribuzioni multimodali

Ecco alcuni esempi di distribuzioni multimodali.

Esempio 1: distribuzione dei risultati degli esami

Supponiamo che un professore dia un esame alla sua classe. Alcuni studenti hanno studiato, altri no. Quando il professore crea un istogramma dei punteggi degli esami, segue una distribuzione multimodale con un picco attorno ai punteggi bassi per gli studenti che non hanno studiato e un altro picco attorno ai punteggi alti per gli studenti che hanno studiato:

Esempio di distribuzione multimodale

Esempio 2: altezza di diverse specie vegetali

Supponiamo che uno scienziato cammini in un campo e misuri l’altezza di diverse piante. Senza rendersene conto, misura le dimensioni di tre specie diverse: una abbastanza grande, un’altra di taglia media e un’altra abbastanza piccola.

Quando crea un istogramma per visualizzare la distribuzione dell’altezza, scopre che è multimodale: ogni picco rappresenta l’altezza più comune delle tre diverse specie.

Esempio di distribuzione multimodale

Esempio 3: distribuzione dei clienti

Il proprietario di un ristorante tiene traccia del numero di clienti che visitano ogni ora. Quando crea un istogramma per visualizzare la distribuzione dei clienti, vede che la distribuzione è multimodale: c’è un picco durante l’ora di pranzo e un altro picco durante l’ora di cena.

Quali sono le cause delle distribuzioni multimodali?

Di solito ci sono due cause alla base delle distribuzioni multimodali:

1. Diversi gruppi sono raggruppati insieme.

Possono verificarsi distribuzioni multimodali quando si raccolgono dati per più gruppi senza rendersene conto.

Ad esempio, se uno scienziato misura inconsapevolmente l’altezza di tre diverse specie di piante situate nello stesso campo, la distribuzione di tutte le piante apparirà multimodale se posizionate sullo stesso istogramma.

2. C’è un fenomeno di fondo.

Le distribuzioni multimodali possono verificarsi anche a causa di alcuni fenomeni sottostanti.

Ad esempio, il numero di clienti che visitano un ristorante ogni ora segue una distribuzione multimodale poiché le persone tendono a mangiare al ristorante in due orari distinti: pranzo e cena. Questo comportamento umano sottostante è l’origine della distribuzione multimodale.

Come analizzare le distribuzioni multimodali

Spesso descriviamo le distribuzioni utilizzando la media o la mediana perché questo ci dà un’idea di dove si trova il “centro” della distribuzione.

Sfortunatamente, la media e la mediana non sono utili da conoscere per una distribuzione bimodale. Ad esempio, il punteggio medio dell’esame degli studenti nell’esempio sopra è 81:

Tuttavia, pochissimi studenti hanno ottenuto un punteggio vicino a 81. In questo caso, la media è fuorviante. La maggior parte degli studenti in realtà ha ottenuto un punteggio di circa 74 o 88.

Un modo migliore per analizzare e interpretare le distribuzioni bimodali è semplicemente dividere i dati in due gruppi distinti e quindi analizzare la posizione del centro e la distribuzione per ciascun gruppo individualmente.

Ad esempio, possiamo dividere i risultati dell’esame in “punteggi bassi” e “punteggi alti” e quindi trovare la media e la deviazione standard per ciascun gruppo.

Quando calcoli le statistiche riassuntive per una determinata distribuzione come la media, la mediana o la deviazione standard, assicurati di visualizzare la distribuzione per determinare se è unimodale o multimodale.

Se una distribuzione è multimodale, può essere fuorviante descriverla utilizzando una singola media, mediana o deviazione standard.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *