Hoe u een paired samples t-test uitvoert in stata
Een paired samples t-test wordt gebruikt om de gemiddelden van twee monsters te vergelijken wanneer elke waarneming in het ene monster kan worden geassocieerd met een waarneming in het andere monster.
In deze tutorial wordt uitgelegd hoe u een t-test met gepaarde monsters uitvoert in Stata.
Voorbeeld: t-test met gepaarde steekproeven in Stata
Onderzoekers willen weten of een nieuwe brandstofbehandeling een verandering in het gemiddelde mpg van een bepaalde auto veroorzaakt. Om dit te testen voeren ze een experiment uit waarbij ze het mpg meten van 12 auto’s met en zonder brandstofbehandeling.
Omdat elke auto de behandeling krijgt, kunnen we een gepaarde t-test uitvoeren waarbij elke auto aan zichzelf wordt gekoppeld om te bepalen of er een verschil is in het gemiddelde mpg met en zonder de brandstofbehandeling.
Voer de volgende stappen uit om een gepaarde t-test uit te voeren in Stata.
Stap 1: Gegevens laden.
Laad eerst de gegevens door gebruik https://www.stata-press.com/data/r13/fuel in het opdrachtvenster te typen en op Enter te klikken.
Stap 2: Bekijk de onbewerkte gegevens.
Voordat we een gepaarde t-test uitvoeren, kijken we eerst naar de onbewerkte gegevens. Navigeer in de bovenste menubalk naar Gegevens > Gegevenseditor > Gegevenseditor (Bladeren) . De eerste kolom, mpg1 , geeft de mpg weer van de eerste auto zonder brandstofbehandeling, terwijl de tweede kolom, mpg2 , de mpg weergeeft van de eerste auto met brandstofbehandeling.
Stap 3: Voer een gepaarde t-test uit.
Ga in de menubalk bovenaan naar Statistieken > Samenvattingen, Tabellen & Toetsen > Klassieke hypothesetoetsen > t-Test (vergelijking van gemiddeldentoets) .
Kies Gekoppeld. Kies voor Eerste variabele mpg1 . Kies voor Tweede variabele mpg2 . Kies bij Betrouwbaarheidsniveau het gewenste niveau. Een waarde van 95 komt overeen met een significantieniveau van 0,05. We laten dit op 95 staan. Klik ten slotte op OK .
De gepaarde t-testresultaten worden weergegeven:
Per groep ontvangen wij de volgende gegevens:
Obs: het aantal waarnemingen. Er zijn 12 observaties in elke groep.
Gemiddeld: de gemiddelde mpg. In groep 0 is het gemiddelde 21. In groep 1 is het gemiddelde 22,75.
Standaard. Err: de standaardfout, berekend als σ / √ n
Standaard. Dev: de standaardafwijking van mpg.
95% Conf. Bereik: 95% betrouwbaarheidsinterval voor het werkelijke populatiegemiddelde in mpg.
t: de teststatistiek van de gepaarde t-test.
Vrijheidsgraden: de vrijheidsgraden die voor de toets moeten worden gebruikt, als volgt berekend: #pairs-1 = 12-1 = 11.
De p-waarden voor drie verschillende t-toetsen met twee steekproeven worden onderaan de resultaten weergegeven. Omdat we willen begrijpen of de gemiddelde mpg eenvoudigweg verschillend is tussen de twee groepen, zullen we kijken naar de resultaten van de tussenliggende test (waarin de alternatieve hypothese Ha:diff !=0 is), die een p-waarde van 0,0463 heeft. .
Omdat deze waarde onder ons significantieniveau van 0,05 ligt, verwerpen we de nulhypothese. We hebben voldoende bewijs om te zeggen dat het werkelijke gemiddelde mpg tussen de twee groepen verschillend is.
Stap 5: Rapporteer de resultaten.
Ten slotte zullen we de resultaten van onze gepaarde t-test rapporteren. Hier is een voorbeeld van hoe u dit kunt doen:
Er werd een gepaarde t-test uitgevoerd op twaalf auto’s om te bepalen of een nieuwe brandstofbehandeling een verschil in het gemiddelde aantal kilometers per gallon veroorzaakte.
De resultaten toonden aan dat de gemiddelde mpg statistisch significant was verschillend tussen de twee groepen (t = -2,2444 met df=11, p = 0,0463) op een significantieniveau van 0,05.
Een betrouwbaarheidsinterval van 95% voor het werkelijke verschil tussen populatiegemiddelden leverde een interval op van (-3,466, -0,034).
Op basis van deze resultaten leidt de nieuwe brandstofbehandeling tot statistisch significant hogere mpg voor auto’s.