Come leggere il quadro di distribuzione f
Questo tutorial spiega come leggere e interpretare la tabella di distribuzione F.
Qual è la tabella di distribuzione F?
La tabella della distribuzione F è una tabella che mostra i valori critici della distribuzione F. Per utilizzare la tabella di distribuzione F, sono necessari solo tre valori:
- I gradi di libertà del numeratore
- I gradi di libertà del denominatore
- Il livello alfa (le scelte comuni sono 0,01, 0,05 e 0,10)
La tabella seguente mostra la tabella di distribuzione F per alfa = 0,10. I numeri nella parte superiore della tabella rappresentano i gradi di libertà del numeratore (etichettati DF1 nella tabella) e i numeri sul lato sinistro della tabella rappresentano i gradi di libertà del denominatore (etichettati DF2 nella tabella).
Sentiti libero di cliccare sulla tabella per ingrandire.
I valori critici nella tabella vengono spesso confrontati con la statistica F di un test F. Se la statistica F è maggiore del valore critico riportato nella tabella, è possibile rifiutare l’ipotesi nulla del test F e concludere che i risultati del test sono statisticamente significativi.
Esempi di utilizzo della tabella di distribuzione F
La tabella di distribuzione F viene utilizzata per trovare il valore critico per un test F. I tre scenari più comuni in cui eseguirai un test F sono:
- Test F nell’analisi di regressione per verificare la significatività complessiva di un modello di regressione.
- Test F in ANOVA (analisi della varianza) per verificare la differenza complessiva tra le medie dei gruppi.
- Test F per scoprire se due popolazioni hanno varianza uguale.
Vediamo un esempio di utilizzo della tabella di distribuzione F in ciascuno di questi scenari.
Test F nell’analisi di regressione
Supponiamo di eseguire un’analisi di regressione lineare multipla utilizzando le ore studiate e gli esami preparatori presi come variabili predittive e il voto dell’esame finale come variabile di risposta. Quando eseguiamo l’analisi di regressione, riceviamo il seguente risultato:
Fonte | SS | df | SM. | F | P. |
---|---|---|---|---|---|
Regressione | 546.53 | 2 | 273.26 | 5.09 | 0,033 |
Residuo | 483.13 | 9 | 53.68 | ||
Totale | 1029.66 | 11 |
Nell’analisi di regressione, la statistica f viene calcolata come MS di regressione/MS residua. Questa statistica indica se il modello di regressione fornisce un adattamento migliore ai dati rispetto a un modello che non contiene variabili indipendenti. Essenzialmente, verifica se il modello di regressione nel suo insieme è utile.
In questo esempio, la statistica F è 273,26 / 53,68 = 5,09 .
Supponiamo di voler sapere se questa statistica F è significativa al livello alfa = 0,05. Utilizzando la tabella di distribuzione F per alfa = 0,05, con i gradi di libertà del numeratore 2 ( df per Regressione) e i gradi di libertà del denominatore 9 ( df per Residuale) , troviamo che il valore critico F è 4, 2565 .
Poiché la nostra statistica f( 5.09 ) è maggiore del valore critico F( 4.2565) , possiamo concludere che il modello di regressione nel suo insieme è statisticamente significativo.
Prova F nell’ANOVA
Supponiamo di voler sapere se tre diverse tecniche di studio portano o meno a risultati di test diversi. Per testarlo, stiamo reclutando 60 studenti. Assegnamo in modo casuale 20 studenti ciascuno a utilizzare una delle tre tecniche di studio per un mese in preparazione a un esame. Una volta che tutti gli studenti hanno sostenuto l’esame, eseguiamo un’ANOVA unidirezionale per determinare se la tecnica di studio ha o meno un impatto sui risultati dell’esame. La tabella seguente mostra i risultati dell’ANOVA unidirezionale:
Fonte | SS | df | SM. | F | P. |
---|---|---|---|---|---|
Trattamento | 58.8 | 2 | 29.4 | 1,74 | 0,217 |
Errore | 202.8 | 12 | 16.9 | ||
Totale | 261.6 | 14 |
In un’ANOVA, la statistica f viene calcolata come MS trattamento/MS errore. Questa statistica indica se il punteggio medio dei tre gruppi è uguale o meno.
In questo esempio, la statistica F è 29,4 / 16,9 = 1,74 .
Supponiamo di voler sapere se questa statistica F è significativa al livello alfa = 0,05. Utilizzando la tabella di distribuzione F per alfa = 0,05, con i gradi di libertà al numeratore 2 ( df per Trattamento) e i gradi di libertà al denominatore 12 ( df per Errore) , troviamo che il valore critico F è 3, 8853 .
Poiché la nostra statistica f ( 1,74 ) non è maggiore del valore critico F ( 3,8853) , concludiamo che non vi è alcuna differenza statisticamente significativa tra i punteggi medi dei tre gruppi.
Test F per varianze uguali di due popolazioni
Supponiamo di voler sapere se le varianze di due popolazioni sono uguali o meno. Per verificarlo, possiamo eseguire un test F per varianze uguali in cui prendiamo un campione casuale di 25 osservazioni da ciascuna popolazione e troviamo la varianza campionaria per ciascun campione.
La statistica del test per questo F-Test è definita come segue:
Statistica F = s 1 2 / s 2 2
dove s 1 2 e s 2 2 sono le varianze campionarie. Quanto più questo rapporto è lontano da uno, tanto più forte è l’evidenza di varianze disuguali all’interno della popolazione.
Il valore critico del test F è definito come segue:
Valore critico F = valore trovato nella tabella di distribuzione F con n 1 -1 en 2 -1 gradi di libertà e un livello di significatività pari a α.
Supponiamo che la varianza campionaria per il campione 1 sia 30,5 e che la varianza campionaria per il campione 2 sia 20,5. Ciò significa che la nostra statistica del test è 30,5/20,5 = 1,487 . Per scoprire se questa statistica del test è significativa per alfa = 0,10, possiamo trovare il valore critico nella tabella di distribuzione F associata ad alfa = 0,10, numeratore df = 24 e denominatore df = 24. Questo numero risulta essere 1,7019. .
Poiché la nostra statistica f( 1.487 ) non è maggiore del valore critico F( 1.7019) , concludiamo che non esiste alcuna differenza statisticamente significativa tra le varianze di queste due popolazioni.
Risorse addizionali
Per un set completo di tabelle di distribuzione F per i valori alfa 0,001, 0,01, 0,025, 0,05 e 0,10, vedere questa pagina .