Cosa sono le variabili dicotomiche? (definizione & #038; esempio)
Una variabile dicotomica è un tipo di variabile che accetta solo due valori possibili.
Ecco alcuni esempi di variabili dicotomiche:
- Sesso: maschio o femmina
- Lancio della moneta: testa o croce
- Tipologia immobile: Residenziale o Commerciale
- Status dell’atleta: Professionista o Dilettante
- Risultati dell’esame: superato o fallito
Questi tipi di variabili si presentano continuamente nella pratica. Ad esempio, considera il seguente set di dati che contiene 10 osservazioni e 4 variabili:

Le variabili genere e Campionato vinto sono dicotomiche perché possono assumere ciascuna solo due possibili valori:

Tuttavia, le variabili Divisione e Punti medi non sono dicotomiche perché possono assumere più valori.
Suggerimento bonus:
Puoi ricordare che le variabili dicotomiche possono assumere solo due valori ricordando che il prefisso “di” è una parola greca che significa “due”, “due volte” o “doppio”.
Come creare variabili dicotomiche
Da notare che possiamo creare una variabile dicotomica da una variabile continua semplicemente separando i valori in base ad una certa soglia.
Ad esempio, nel dataset precedente, potremmo trasformare la variabile Punti medi in una variabile dicotomica classificando i giocatori con una media superiore a 15 come “buoni marcatori” e quelli con una media inferiore a 15 come “cattivi marcatori”:

Come visualizzare le variabili dicotomiche
Solitamente visualizziamo le variabili dicotomiche utilizzando un semplice grafico a barre per rappresentare le frequenze di ciascun valore che possono assumere.
Ad esempio, il seguente grafico a barre mostra le frequenze di ciascun genere nel set di dati precedente:

Potremmo anche visualizzare le frequenze come percentuali sull’asse y:

Ciò ci consente di vedere facilmente che il 70% del totale degli atleti nel set di dati sono uomini e il 30% donne.
Come analizzare le variabili dicotomiche
Esistono diversi modi per analizzare le variabili dicotomiche. Due dei metodi più comuni includono:
1. Test z ad una proporzione
Un test z su una proporzione determina se una proporzione osservata è uguale o meno a una proporzione teorica.
Ad esempio, potremmo utilizzare questo test per determinare se la percentuale reale di atleti di sesso maschile in una data popolazione è pari al 50%.
2. Correlazione punto-biseriale
La correlazione punto-biseriale viene utilizzata per misurare la relazione tra una variabile dicotomica e una variabile continua.
Questo tipo di correlazione assume un valore compreso tra -1 e 1 dove:
- -1 indica una correlazione perfettamente negativa tra due variabili
- 0 indica alcuna correlazione tra due variabili
- 1 indica una correlazione perfettamente positiva tra due variabili
Ad esempio, potremmo calcolare la correlazione punto-biseriale tra genere e media punti per partita per capire quanto strettamente sono correlate queste due variabili.