Jak wykonać test t dla sparowanych próbek w pythonie
Test t dla par prób służy do porównania średnich z dwóch próbek, gdy każdą obserwację w jednej próbie można powiązać z obserwacją w drugiej próbie.
W tym samouczku wyjaśniono, jak wykonać test t dla sparowanych próbek w języku Python.
Przykład: Test T dla par próbek w Pythonie
Załóżmy, że chcemy wiedzieć, czy określony program nauczania ma znaczący wpływ na wyniki uczniów na konkretnym egzaminie. Aby to sprawdzić, prosimy 15 uczniów w klasie o przystąpienie do testu wstępnego. Następnie każdy z uczniów uczestniczy w programie nauczania przez dwa tygodnie. Następnie uczniowie ponownie przystępują do testu o podobnym stopniu trudności.
Aby porównać różnicę między średnimi wynikami pierwszego i drugiego testu, używamy testu t dla par prób, ponieważ w przypadku każdego ucznia jego wynik w pierwszym teście można powiązać z wynikiem w drugim teście.
Wykonaj poniższe kroki, aby wykonać test t dla par próbek w języku Python.
Krok 1: Utwórz dane.
Najpierw utworzymy dwie tabele zawierające wyniki przed i po teście:
pre = [88, 82, 84, 93, 75, 78, 84, 87, 95, 91, 83, 89, 77, 68, 91] post = [91, 84, 88, 90, 79, 80, 88, 90, 90, 96, 88, 89, 81, 74, 92]
Krok 2: Wykonaj test T dla par próbek.
Następnie użyjemy funkcji ttest_rel() z biblioteki scipy.stats, aby wykonać test t dla sparowanych próbek, który wykorzystuje następującą składnię:
test_rel(a, b)
Złoto:
- a: tabela przykładowych obserwacji z grupy 1
- b: tabela przykładowych obserwacji z grupy 2
Oto jak używać tej funkcji w naszym konkretnym przykładzie:
import scipy.stats as stats #perform the paired samples t-test stats.ttest_rel(pre, post) (statistic=-2.9732, pvalue=0.0101)
Statystyka testowa wynosi -2,9732 , a odpowiadająca jej dwustronna wartość p wynosi 0,0101 .
Krok 3: Interpretacja wyników.
W tym przykładzie test t dla sparowanych próbek wykorzystuje następujące hipotezy zerowe i alternatywne:
H 0 : Średnie wyniki przed i po teście są równe
H A : Średnie wyniki przed i po teście nie są równe
Ponieważ wartość p ( 0,0101 ) jest mniejsza niż 0,05, odrzucamy hipotezę zerową. Mamy wystarczające dowody, aby stwierdzić, że prawdziwy średni wynik testu różni się w przypadku uczniów przed i po uczestnictwie w programie studiów.