Hoe u een t-test met twee monsters uitvoert in python


Een t-test met twee steekproeven wordt gebruikt om te testen of de gemiddelden van twee populaties gelijk zijn of niet.

In deze tutorial wordt uitgelegd hoe u een t-test met twee steekproeven uitvoert in Python.

Voorbeeld: twee t-testvoorbeelden in Python

Onderzoekers willen weten of twee verschillende plantensoorten dezelfde gemiddelde hoogte hebben. Om dit te testen, verzamelen ze een eenvoudig willekeurig monster van twintig planten van elke soort.

Volg de volgende stappen om een t-test met twee monsters uit te voeren om te bepalen of de twee plantensoorten dezelfde hoogte hebben.

Stap 1: Creëer de gegevens.

Eerst maken we twee tabellen met de metingen voor elke groep van twintig planten:

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Stap 2: Voer een t-test met twee steekproeven uit.

Vervolgens gebruiken we de functie ttest_ind() uit de scipy.stats-bibliotheek om een t-test met twee voorbeelden uit te voeren, die de volgende syntaxis gebruikt:

ttest_ind(a, b, equal_var=Waar)

Goud:

  • a: een tabel met voorbeelden van observaties voor groep 1
  • b: een tabel met voorbeelden van observaties voor groep 2
  • equal_var: Indien waar, voer dan een standaard onafhankelijke t-test met twee steekproeven uit waarbij wordt uitgegaan van gelijke populatievarianties. Als dit niet waar is, voer dan de t-test van Welch uit, waarbij niet wordt uitgegaan van gelijke populatievarianties. Dit is standaard waar.

Voordat we de test uitvoeren, moeten we beslissen of we al dan niet aannemen dat de twee populaties gelijke varianties hebben. Over het algemeen kunnen we aannemen dat populaties gelijke varianties hebben als de verhouding tussen de grootste steekproefvariantie en de kleinste steekproefvariantie kleiner is dan 4:1.

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

De verhouding tussen de grootste steekproefvariantie en de kleinste steekproefvariantie is 12,26/7,73 = 1,586 , wat kleiner is dan 4. Dit betekent dat we kunnen aannemen dat de varianties van de populatie gelijk zijn.

We kunnen dus doorgaan met het uitvoeren van de t-test met twee steekproeven met gelijke varianties:

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

De t-teststatistiek is -0,6337 en de overeenkomstige tweezijdige p-waarde is 0,53005 .

Stap 3: Interpreteer de resultaten.

De twee aannames voor deze specifieke t-test met twee steekproeven zijn:

H 0 : µ 1 = µ 2 (de twee populatiegemiddelden zijn gelijk)

H A : µ 1 ≠µ 2 (de twee populatiegemiddelden zijn niet gelijk)

Omdat de p-waarde van onze test (0,53005) groter is dan alpha = 0,05, slagen we er niet in de nulhypothese van de test te verwerpen. We hebben niet voldoende bewijs om te zeggen dat de gemiddelde planthoogte tussen de twee populaties verschillend is.

Aanvullende bronnen

Hoe u een T-test met één monster uitvoert in Python
Hoe u een gepaarde samples T-test uitvoert in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert