Come eseguire un test t a due campioni in python


Un t-test a due campioni viene utilizzato per verificare se le medie di due popolazioni sono uguali o meno.

Questo tutorial spiega come eseguire un t-test a due campioni in Python.

Esempio: due esempi di t-test in Python

I ricercatori vogliono sapere se due diverse specie di piante hanno la stessa altezza media. Per verificarlo, raccolgono un semplice campione casuale di 20 piante di ciascuna specie.

Seguire i passaggi seguenti per eseguire un test t su due campioni per determinare se le due specie di piante hanno la stessa altezza.

Passaggio 1: creare i dati.

Per prima cosa creeremo due tabelle per contenere le misurazioni per ciascun gruppo di 20 piante:

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Passaggio 2: eseguire un test t su due campioni.

Successivamente, utilizzeremo la funzione ttest_ind() dalla libreria scipy.stats per eseguire un t-test di due esempi, che utilizza la seguente sintassi:

ttest_ind(a, b, var_uguale=Vero)

Oro:

  • a: una tabella di esempi di osservazioni per il gruppo 1
  • b: una tabella di esempi di osservazioni per il gruppo 2
  • equal_var: se vero, esegue un test t standard indipendente a 2 campioni che presuppone varianze di popolazione uguali. Se falso, eseguire il test t di Welch , che non presuppone varianze di popolazione uguali. Questo è vero per impostazione predefinita.

Prima di eseguire il test, dobbiamo decidere se assumere o meno che le due popolazioni abbiano varianza uguale. In generale, possiamo assumere che le popolazioni abbiano varianze uguali se il rapporto tra la varianza campionaria più grande e quella più piccola è inferiore a 4:1.

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

Il rapporto tra la varianza campionaria più grande e la varianza campionaria più piccola è 12,26/7,73 = 1,586 , che è inferiore a 4. Ciò significa che possiamo supporre che le varianze della popolazione siano uguali.

Pertanto, possiamo procedere con l’esecuzione del test t su due campioni con varianze uguali:

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

La statistica del test t è -0,6337 e il corrispondente valore p a due code è 0,53005 .

Passaggio 3: interpretare i risultati.

Le due ipotesi per questo particolare t-test a due campioni sono:

H 0 : µ 1 = µ 2 (le due medie della popolazione sono uguali)

H A : µ 1 ≠μ 2 (le due medie della popolazione non sono uguali)

Poiché il valore p del nostro test (0,53005) è maggiore di alfa = 0,05, non riusciamo a rifiutare l’ipotesi nulla del test. Non abbiamo prove sufficienti per affermare che l’altezza media delle piante tra le due popolazioni sia diversa.

Risorse addizionali

Come eseguire un test T per un campione in Python
Come eseguire un test T di campioni accoppiati in Python

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *