Testowanie hipotez i przedział ufności: jaka jest różnica?
Dwie z najczęściej stosowanych procedur w statystyce to testowanie hipotez i przedziały ufności .
Oto różnica między nimi:
- Test hipotezy to formalny test statystyczny stosowany w celu ustalenia, czy hipoteza dotycząca parametru populacji jest prawdziwa.
- Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności.
W tym samouczku przedstawiono krótki przegląd każdej metody wraz z ich podobieństwami i różnicami.
Podstawy testowania hipotez
Hipoteza testowa służy do sprawdzenia, czy hipoteza dotycząca parametru populacji jest prawdziwa.
Aby przeprowadzić testowanie hipotez w świecie rzeczywistym, badacze pobiorą losową próbkę populacji i przeprowadzą test hipotez na przykładowych danych, stosując hipotezę zerową i alternatywną:
- Hipoteza zerowa (H 0 ): Przykładowe dane pochodzą wyłącznie z przypadku.
- Hipoteza alternatywna ( HA ): na przykładowe dane ma wpływ przyczyna nieprzypadkowa.
Jeśli wartość p testu hipotezy jest poniżej pewnego poziomu istotności (np. α = 0,05), wówczas możemy odrzucić hipotezę zerową i stwierdzić, że mamy wystarczające dowody, aby stwierdzić, że hipoteza alternatywna jest prawdziwa.
Przykład testowania hipotez
Załóżmy, że zakład produkcyjny chce sprawdzić, czy nowa metoda zmienia liczbę wadliwych gadżetów produkowanych miesięcznie, która obecnie wynosi 250.
Aby to przetestować, mogą zmierzyć średnią liczbę wadliwych widżetów wyprodukowanych przed i po zastosowaniu nowej metody przez miesiąc.
Potrafią przeprowadzić test hipotez, korzystając z następujących hipotez:
- H 0 : μ po = μ przed (średnia liczba wadliwych widżetów jest taka sama przed i po zastosowaniu nowej metody)
- H A : μ po ≠ μ przed (średnia liczba wyprodukowanych wadliwych widgetów jest różna przed i po zastosowaniu nowej metody)
Załóżmy, że przeprowadzają test t dla jednej próby i uzyskują wartość p wynoszącą 0,0032.
Ponieważ ta wartość p jest mniejsza niż α = 0,05, placówka może odrzucić hipotezę zerową i stwierdzić, że nowa metoda powoduje zmianę liczby wadliwych gadżetów produkowanych miesięcznie.
Podstawy przedziałów ufności
Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności.
Aby obliczyć rzeczywisty przedział ufności, badacze pobiorą losową próbkę populacji i zastosują następujący wzór do obliczenia przedziału ufności dla średniej populacji:
Przedział ufności = x +/- z*(s/√ n )
Złoto:
- x : średnia próbki
- z: wybrana wartość z
- s: odchylenie standardowe próbki
- n: wielkość próbki
Używana wartość z zależy od wybranego poziomu ufności. W poniższej tabeli przedstawiono wartość z odpowiadającą najczęściej wybieranym poziomom ufności:
| Poziom pewności | wartość z |
|---|---|
| 0,90 | 1645 |
| 0,95 | 1,96 |
| 0,99 | 2,58 |
Przykład przedziału ufności
Załóżmy, że biolog chce oszacować średnią masę żółwi w określonej populacji i zbiera losową próbkę żółwi, zawierając następujące informacje:
- Wielkość próby n = 25
- Średnia masa próbki x = 300
- Próbka odchylenie standardowe s = 18,5
Oto jak obliczyć 90% przedział ufności dla prawdziwej średniej wagi populacji:
90% przedział ufności: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
Biolog może być w 90% pewien, że rzeczywista średnia waga żółwia w tej populacji mieści się w przedziale od 293,1 funtów do 306,09 funtów.
Testowanie hipotez a przedział ufności: kiedy stosować każdy z nich
Decyzja o zastosowaniu testu hipotezy lub przedziału ufności zależy od pytania, na które próbujesz odpowiedzieć.
Jeśli chcesz oszacować wartość parametru populacji, musisz użyć przedziału ufności .
Testowania hipotez należy używać, jeśli chcesz ustalić, czy hipoteza dotycząca parametru populacji jest prawdopodobnie prawdziwa.
Aby sprawdzić swoją wiedzę na temat tego, kiedy należy zastosować każdą procedurę, rozważ następujące scenariusze.
Scenariusz 1: Godziny spędzone na nauce
Załóżmy, że badacz uniwersytecki chce zmierzyć średnią liczbę godzin, jakie studenci spędzają na nauce w tygodniu.
Jakiej procedury powinna użyć, aby odpowiedzieć na to pytanie?
Powinna zastosować przedział ufności, ponieważ chce oszacować wartość parametru populacji.
Scenariusz 2: Nowy lek
Załóżmy, że lekarz chce sprawdzić, czy nowy lek jest w stanie obniżyć ciśnienie krwi w większym stopniu niż obecnie stosowany lek standardowy.
Jakiej procedury powinien użyć, aby odpowiedzieć na to pytanie?
Powinien zastosować testowanie hipotez , ponieważ chce zrozumieć, czy konkretna hipoteza dotycząca parametru populacji jest prawdziwa, czy nie.
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat testowania hipotez :
Wprowadzenie do testowania hipotez
Wprowadzenie do testu t dla jednej próby
Wprowadzenie do testu t dla dwóch prób
Wprowadzenie do testu t dla par próbek
Poniższe samouczki zawierają dodatkowe informacje na temat przedziałów ufności :
Wprowadzenie do przedziałów ufności
Przedział ufności dla średniej
Przedział ufności dla proporcji