Jak wykonać test t dla dwóch próbek w stata
Test t dla dwóch prób służy do sprawdzenia, czy średnie z dwóch populacji są równe, czy nie.
W tym samouczku wyjaśniono, jak wykonać test t dla dwóch próbek w programie Stata.
Przykład: test t dla dwóch próbek w Stata
Naukowcy chcą wiedzieć, czy nowy sposób uzdatniania paliwa powoduje zmianę średniego zużycia paliwa przez określony samochód. Aby to sprawdzić, przeprowadzają eksperyment, w którym 12 samochodów otrzymuje nowe uzdatnienie paliwa, a 12 samochodów nie.
Wykonaj poniższe kroki, aby przeprowadzić test t dla dwóch próbek i określić, czy istnieje różnica w średnim przebiegu w mpg pomiędzy tymi dwiema grupami.
Krok 1: Załaduj dane.
Najpierw załaduj dane, wpisując use https://www.stata-press.com/data/r13/fuel3 w polu poleceń i klikając Enter.
Krok 2: Wyświetl surowe dane.
Przed wykonaniem testu t dla dwóch próbek przyjrzyjmy się najpierw surowym danym. Z górnego paska menu przejdź do opcji Dane > Edytor danych > Edytor danych (Przeglądaj) . Pierwsza kolumna, mpg , wyświetla mpg dla danego samochodu. Druga kolumna, „traktowana” , wskazuje, czy samochód został poddany obróbce paliwowej (0 = nie, 1 = tak).
Krok 3: Wizualizuj dane.
Następnie zwizualizujmy dane. Stworzymy wykresy pudełkowe , aby wyświetlić rozkład wartości mpg dla każdej grupy.
Z górnego paska menu wybierz Wykresy > Wykres pudełkowy . W obszarze zmiennych wybierz mpg :
Następnie w podnagłówku Kategorie w Zmienna grupująca wybierz Przetworzone :
Kliknij OK . Automatycznie wyświetli się wykres z dwoma wykresami pudełkowymi:
Od razu widać, że mpg wydaje się być wyższe w grupie leczonej (1) w porównaniu z grupą nieleczoną (0), ale musimy wykonać test t dla dwóch próbek, aby sprawdzić, czy różnice te są istotne statystycznie. .
Krok 4: Wykonaj test t dla dwóch próbek.
Z górnego paska menu wybierz Statystyka > Podsumowania, tabele i testy > Klasyczne testy hipotez > Test t (test porównania średnich) .
Wybierz opcję Dwie próbki przy użyciu grup . W polu Nazwa zmiennej wybierz mpg . W polu Nazwa zmiennej grupy wybierz opcję Przetworzone . W obszarze Poziom zaufania wybierz żądany poziom. Wartość 95 odpowiada poziomowi istotności 0,05. Zostawmy to na 95. Na koniec kliknij OK .
Wyświetlone zostaną wyniki dwóch przykładowych testów t:
Dla każdej grupy otrzymujemy następujące informacje:
Obs: Liczba obserwacji. W każdej grupie jest 12 obserwacji.
Średnia: średnia mpg. W grupie 0 średnia wynosi 21. W grupie 1 średnia wynosi 22,75.
Standard. Err: błąd standardowy obliczony jako σ / √ n
Standard. Dev: odchylenie standardowe mpg.
95% konf. Zakres: 95% przedział ufności dla prawdziwej średniej populacji w mpg.
t: statystyka testowa testu t dla dwóch próbek.
stopnie swobody: stopnie swobody stosowane w badaniu, obliczone jako n-2 = 24-2 = 22.
Wartości p dla trzech różnych testów t dla dwóch próbek pokazano na dole wyników. Ponieważ chcemy zrozumieć, czy średnie mpg po prostu różni się w obu grupach, przyjrzymy się wynikom testu pośredniego (w którym alternatywną hipotezą jest Ha:diff !=0), którego wartość p wynosi 0,1673. .
Ponieważ wartość ta nie jest niższa od naszego poziomu istotności wynoszącego 0,05, nie możemy odrzucić hipotezy zerowej. Nie mamy wystarczających dowodów, aby stwierdzić, że rzeczywista średnia wartość mpg różni się w obu grupach.
Krok 5: Ogłoś wyniki.
Na koniec podamy wyniki naszych dwóch przykładowych testów t. Oto przykład, jak to zrobić:
Przeprowadzono test T w dwóch próbach na 24 samochodach, aby ustalić, czy nowe uzdatnienie paliwa spowodowało różnicę w średnich milach na galon. Każda grupa liczyła 12 samochodów.
Wyniki pokazały, że średnia mpg nie różniła się pomiędzy obiema grupami (t = -1,428 przy df=22, p = 0,1673) na poziomie istotności 0,05.
95% przedział ufności dla prawdziwej różnicy w średnich populacji dał przedział (-4,29; 0,79).