Come eseguire un test t a due campioni in python
Un t-test a due campioni viene utilizzato per verificare se le medie di due popolazioni sono uguali o meno.
Questo tutorial spiega come eseguire un t-test a due campioni in Python.
Esempio: due esempi di t-test in Python
I ricercatori vogliono sapere se due diverse specie di piante hanno la stessa altezza media. Per verificarlo, raccolgono un semplice campione casuale di 20 piante di ciascuna specie.
Seguire i passaggi seguenti per eseguire un test t su due campioni per determinare se le due specie di piante hanno la stessa altezza.
Passaggio 1: creare i dati.
Per prima cosa creeremo due tabelle per contenere le misurazioni per ciascun gruppo di 20 piante:
import numpy as np group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12]) group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])
Passaggio 2: eseguire un test t su due campioni.
Successivamente, utilizzeremo la funzione ttest_ind() dalla libreria scipy.stats per eseguire un t-test di due esempi, che utilizza la seguente sintassi:
ttest_ind(a, b, var_uguale=Vero)
Oro:
- a: una tabella di esempi di osservazioni per il gruppo 1
- b: una tabella di esempi di osservazioni per il gruppo 2
- equal_var: se vero, esegue un test t standard indipendente a 2 campioni che presuppone varianze di popolazione uguali. Se falso, eseguire il test t di Welch , che non presuppone varianze di popolazione uguali. Questo è vero per impostazione predefinita.
Prima di eseguire il test, dobbiamo decidere se assumere o meno che le due popolazioni abbiano varianza uguale. In generale, possiamo assumere che le popolazioni abbiano varianze uguali se il rapporto tra la varianza campionaria più grande e quella più piccola è inferiore a 4:1.
#find variance for each group
print(np.var(group1), np.var(group2))
7.73 12.26
Il rapporto tra la varianza campionaria più grande e la varianza campionaria più piccola è 12,26/7,73 = 1,586 , che è inferiore a 4. Ciò significa che possiamo supporre che le varianze della popolazione siano uguali.
Pertanto, possiamo procedere con l’esecuzione del test t su due campioni con varianze uguali:
import scipy.stats as stats #perform two sample t-test with equal variances stats.ttest_ind(a=group1, b=group2, equal_var=True) (statistic=-0.6337, pvalue=0.53005)
La statistica del test t è -0,6337 e il corrispondente valore p a due code è 0,53005 .
Passaggio 3: interpretare i risultati.
Le due ipotesi per questo particolare t-test a due campioni sono:
H 0 : µ 1 = µ 2 (le due medie della popolazione sono uguali)
H A : µ 1 ≠μ 2 (le due medie della popolazione non sono uguali)
Poiché il valore p del nostro test (0,53005) è maggiore di alfa = 0,05, non riusciamo a rifiutare l’ipotesi nulla del test. Non abbiamo prove sufficienti per affermare che l’altezza media delle piante tra le due popolazioni sia diversa.
Risorse addizionali
Come eseguire un test T per un campione in Python
Come eseguire un test T di campioni accoppiati in Python