Come calcolare la somma dei quadrati in anova (con esempio)
In statistica, un’ANOVA unidirezionale viene utilizzata per confrontare le medie di tre o più gruppi indipendenti per determinare se esiste una differenza statisticamente significativa tra le medie della popolazione corrispondente.
Ogni volta che esegui un’ANOVA unidirezionale, calcolerai sempre tre valori di somma dei quadrati:
1. Regressione della somma dei quadrati (SSR)
- È la somma dei quadrati delle differenze tra la media di ciascun gruppo e la media generale .
2. Errore della somma dei quadrati (SSE)
- Questa è la somma dei quadrati delle differenze tra ogni singola osservazione e la media del gruppo di tale osservazione.
3. Somma dei quadrati totali (SST)
- Questa è la somma dei quadrati delle differenze tra ogni singola osservazione e la media complessiva.
Ciascuno di questi tre valori viene inserito nella tabella ANOVA finale, che utilizziamo per determinare se esiste o meno una differenza statisticamente significativa tra le medie del gruppo.
L’esempio seguente mostra come calcolare nella pratica ciascuno di questi valori di somma dei quadrati per un’ANOVA unidirezionale.
Esempio: come calcolare la somma dei quadrati in ANOVA
Supponiamo di voler sapere se tre diversi programmi di preparazione al test portano o meno a punteggi medi diversi in un dato esame. Per testarlo, reclutiamo 30 studenti per partecipare a uno studio e li dividiamo in tre gruppi.
Gli studenti di ciascun gruppo vengono assegnati in modo casuale a utilizzare uno dei tre programmi di preparazione al test per le tre settimane successive per prepararsi a un esame. Alla fine delle tre settimane, tutti gli studenti sostengono lo stesso esame.
Di seguito sono riportati i risultati degli esami per ciascun gruppo:
I passaggi seguenti mostrano come calcolare la somma dei valori dei quadrati per questa ANOVA unidirezionale.
Passaggio 1: calcolare la media del gruppo e la media complessiva.
Per prima cosa calcoleremo la media dei tre gruppi nonché la media complessiva (o “complessiva”):
Passaggio 2: calcolare l’SSR.
Successivamente, calcoleremo la regressione della somma dei quadrati (SSR) utilizzando la seguente formula:
nΣ(X j – X ..) 2
Oro:
- n : la dimensione del campione del gruppo j
- Σ : simbolo greco che significa “somma”
- X j : la media del gruppo j
- X .. : la media complessiva
Nel nostro esempio, calcoliamo che SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2
Passaggio 3: calcolare il SES.
Successivamente, calcoleremo l’errore della somma dei quadrati (SSE) utilizzando la seguente formula:
Σ(X ij – X j ) 2
Oro:
- Σ : simbolo greco che significa “somma”
- X ij : l’ iesima osservazione del gruppo j
- X j : la media del gruppo j
Nel nostro esempio, calcoliamo l’SSE come segue:
Gruppo 1: (85-83,4) 2 + (86-83,4) 2 + (88-83,4) 2+ (75-83,4) 2+ (78-83,4) 2+ (94-83,4) 2+ (98-83,4) 2+ (79-83,4) 2+ (71-83,4) 2+ (80-83,4) 2 = 640,4
Gruppo 2: (91-89,3) 2 + (92-89,3) 2 + (93-89.3) 2+ (85-89.3) 2+ (87-89.3) 2+ (84-89.3) 2+ (82-89.3) 2+ (88-89.3) 2+ (95-89,3) 2+ (96-89,3) 2 = 208,1
Gruppo 3: (79-84,7) 2 + (78-84,7) 2 + (88-84.7) 2+ (94-84,7) 2+ (92-84,7) 2+ (85-84,7) 2+ (83-84,7) 2+ (85-84,7) 2+ (82-84.7) 2+ (81-84,7) 2 = 252,1
ESS: 640,4 + 208,1 + 252,1 = 1.100,6
Passaggio 4: calcolare l’SST.
Successivamente, calcoleremo la somma totale dei quadrati (SST) utilizzando la seguente formula:
SST = SSR + SSE
Nel nostro esempio SST = 192,2 + 1100,6 = 1292,8
Una volta calcolati i valori di SSR, SSE e SST, ognuno di questi valori verrà finalmente inserito nella tabella ANOVA:
Fonte | Somma dei quadrati (SS) | df | Quadrati medi (MS) | Valore F | valore p |
---|---|---|---|---|---|
Regressione | 192.2 | 2 | 96.1 | 2.358 | 0,1138 |
Errore | 1100.6 | 27 | 40.8 | ||
Totale | 1292.8 | 29 |
Ecco come abbiamo calcolato i diversi numeri nella tabella:
- regressione df: k-1 = 3-1 = 2
- errore df: nk = 30-3 = 27
- df totale: n-1 = 30-1 = 29
- Trattamento SEP: trattamento SST/df = 192,2 / 2 = 96,1
- Errore MS: errore SSE / df = 1100,6 / 27 = 40,8
- Valore F: elaborazione MS / errore MS = 96,1 / 40,8 = 2,358
- valore p : valore p che corrisponde al valore F.
Nota: n = numero totale di osservazioni, k = numero di gruppi
Dai un’occhiata a questo tutorial per imparare come interpretare il valore F e il valore p nella tabella ANOVA.