Come eseguire il test del rapporto di varianza in r (con esempio)


Un test del rapporto di varianza viene utilizzato per verificare se le varianze di due popolazioni sono uguali o meno.

Questo test utilizza le seguenti ipotesi nulle e alternative:

  • H 0 : le varianze della popolazione sono uguali
  • H A : Le varianze della popolazione non sono uguali

Per eseguire questo test, calcoliamo la seguente statistica del test:

F = s 1 2 / s 2 2

Oro:

  • s 1 2 : La varianza campionaria del primo gruppo
  • s 2 2 : La varianza campionaria del secondo gruppo

Se il valore p che corrisponde a questa statistica del test F è inferiore a una certa soglia (ad esempio 0,05), allora rifiutiamo l’ipotesi nulla e concludiamo che le varianze della popolazione non sono uguali.

Per eseguire un test del rapporto di varianza in R, possiamo utilizzare la funzione integrata var.test() .

L’esempio seguente mostra come utilizzare questa funzione nella pratica.

Esempio: test del rapporto di varianza in R

Supponiamo di voler sapere se due diverse specie di piante hanno la stessa variazione di altezza.

Per verificarlo, raccogliamo un semplice campione casuale di 15 piante di ciascuna specie.

Il codice seguente mostra come eseguire un test del rapporto di varianza in R per determinare se la varianza di altezza è uguale tra le due specie:

 #create vectors to hold plant heights from each sample
group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19)
group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29)

#perform variance ratio test
var. test (group1, group2)

	F test to compare two variances

data: group1 and group2
F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1467737 1.3021737
sample estimates:
ratio of variances 
         0.4371783

Ecco come interpretare i risultati del test:

dati: i nomi dei vettori che contengono i dati campione.

F: La statistica del test F. In questo caso è 0.43718 .

num df, denom df : i gradi di libertà del numeratore e del denominatore per la statistica del test F, calcolati rispettivamente come n 1 – 1 e n 2 -1.

Valore p: il valore p che corrisponde alla statistica del test F di 0,43718 con numeratore df = 14 e denominatore df = 14. Il valore p risulta essere 0,1336 .

Intervallo di confidenza al 95%: intervallo di confidenza al 95% per il vero rapporto delle varianze tra i due gruppi. Risulta essere [.147, 1.302] . Poiché 1 è contenuto in questo intervallo, è plausibile che il vero rapporto delle varianze sia 1, cioè varianze uguali.

stime campionarie: rappresenta il rapporto delle varianze tra ciascun gruppo. Se utilizziamo la funzione var() , possiamo vedere che la varianza campionaria del primo gruppo è 21,8381 e la varianza campionaria del secondo gruppo è 49,95238. Quindi il rapporto delle varianze è 21.8381 / 49.95238 = 0.4371783 .

Ricordiamo le ipotesi nulla e alternativa di questo test:

  • H 0 : le varianze della popolazione sono uguali
  • H A : Le varianze della popolazione non sono uguali

Poiché il valore p del nostro test (0,1336) non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla.

Ciò significa che non abbiamo prove sufficienti per concludere che la variazione nell’altezza delle piante tra le due specie non è uguale.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come eseguire un test T per un campione in R
Come eseguire il test T di Welch in R
Come eseguire un t-test per campioni accoppiati in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *