Wyjaśnienie wartości p i istotności statystycznej
W statystyce wartości p są powszechnie stosowane w testowaniu hipotez w testach t, testach chi-kwadrat, analizie regresji, ANOVA i różnych innych metodach statystycznych.
Chociaż są one tak powszechne, ludzie często błędnie interpretują wartości p, co może prowadzić do błędów podczas interpretacji wyników analizy lub badania.
W tym artykule wyjaśniono, jak rozumieć i interpretować wartości p w jasny i praktyczny sposób.
Testowanie hipotez
Aby zrozumieć wartości p, musimy najpierw zrozumieć koncepcję testowania hipotez .
Hipoteza testowa to formalny test statystyczny, którego używamy do odrzucenia hipotezy lub jej nieodrzucenia. Na przykład możemy postawić hipotezę, że nowy lek, metoda lub procedura ma pewną przewagę nad obecnym lekiem, metodą lub procedurą.
Aby to sprawdzić, możemy przeprowadzić test hipotezy, w którym używamy hipotezy zerowej i alternatywnej:
Hipoteza zerowa – nie ma efektu ani różnicy pomiędzy nową metodą a starą metodą.
Hipoteza alternatywna – istnieje efekt lub różnica pomiędzy nową metodą a starą metodą.
Wartość p wskazuje, jak wiarygodna jest hipoteza zerowa, biorąc pod uwagę przykładowe dane. W szczególności, zakładając, że hipoteza zerowa jest prawdziwa, wartość p mówi nam o prawdopodobieństwie uzyskania efektu co najmniej tak dużego, jak ten, który faktycznie zaobserwowaliśmy w danych próbnych.
Jeśli wartość p testu hipotezy jest wystarczająco niska, możemy odrzucić hipotezę zerową. W szczególności, gdy testujemy hipotezy, musimy od początku wybrać poziom istotności. Typowe poziomy istotności to 0,01, 0,05 i 0,10.
Jeśli wartości p są poniżej naszego poziomu istotności, wówczas możemy odrzucić hipotezę zerową.
W przeciwnym razie, jeśli wartość p jest równa lub większa od naszego poziomu istotności, nie odrzucimy hipotezy zerowej.
Jak interpretować wartość P
Klasyczna definicja wartości p to:
Wartość p to prawdopodobieństwo zaobserwowania statystyki próbki, która jest co najmniej tak ekstremalna jak statystyka próbki, przy założeniu, że hipoteza zerowa jest prawdziwa.
Załóżmy na przykład, że fabryka twierdzi, że produkuje opony o średniej masie 200 funtów. Audytor stawia hipotezę, że rzeczywista średnia waga opon produkowanych w tym zakładzie różni się o 200 funtów. Przeprowadza więc test hipotezy i stwierdza, że wartość p testu wynosi 0,04. Oto jak interpretować tę wartość p:
Jeśli fabryka rzeczywiście produkuje opony o średniej wadze 200 funtów, to w 4% wszystkich audytów uzyskamy efekt zaobserwowany w próbce lub więcej, ze względu na błąd losowej próby. To mówi nam, że uzyskanie przykładowych danych uzyskanych przez audytora byłoby dość rzadkie, gdyby fabryka faktycznie produkowała opony o średniej wadze 200 funtów.
W zależności od poziomu istotności zastosowanego w tym teście hipotezy audytor prawdopodobnie odrzuciłby hipotezę zerową, że rzeczywista średnia waga opon produkowanych w tym zakładzie w rzeczywistości wynosi 200 funtów. Próbki danych, które uzyskał podczas kontroli, nie są zbyt zgodne z hipotezą zerową.
Jak nie interpretować wartości P
Największym błędnym przekonaniem na temat wartości p jest to, że są one równoznaczne z prawdopodobieństwem popełnienia błędu poprzez odrzucenie prawdziwej hipotezy zerowej (zwanej błędem typu I).
Istnieją dwa główne powody, dla których wartości p nie mogą odpowiadać współczynnikowi błędów:
1. Wartości P oblicza się w oparciu o założenie, że hipoteza zerowa jest prawdziwa i że różnica między danymi z próby a hipotezą zerową wynika po prostu z przypadku. Zatem wartości p nie mogą określić prawdopodobieństwa, że wartość zerowa będzie prawdziwa lub fałszywa, ponieważ jest ona w 100% prawdziwa z punktu widzenia obliczeń.
2. Chociaż niska wartość p wskazuje, że dane z próbki są mało prawdopodobne przy założeniu, że zero jest prawdziwe, wartość p w dalszym ciągu nie pozwala określić, który z poniższych przypadków jest bardziej prawdopodobny:
- Wartość null jest fałszywa
- Wartość zerowa jest prawdziwa, ale otrzymałeś dziwną próbkę
W porównaniu z poprzednim przykładem, oto poprawny i niepoprawny sposób interpretacji wartości p:
- Prawidłowa interpretacja: zakładając, że fabryka produkuje opony o średniej masie 200 funtów, uzyskasz zaobserwowaną różnicę w próbce lub bardziej ekstremalną różnicę w 4% audytów w wyniku losowego pobierania próbek.
- Niepoprawna interpretacja: Jeśli odrzucisz hipotezę zerową, istnieje 4% szans, że popełnisz błąd.
Przykłady interpretacji wartości P
Poniższe przykłady ilustrują prawidłowe sposoby interpretacji wartości p w kontekście testowania hipotez.
Przykład 1
Firma telekomunikacyjna twierdzi, że 90% jej klientów jest zadowolonych z ich usług. Aby przetestować to twierdzenie, niezależny badacz zebrał prostą losową próbę 200 klientów i zapytał ich, czy są zadowoleni z ich usług, na co 85% odpowiedziało twierdząco. Stwierdzono, że wartość p związana z tą próbką danych wynosi 0,018.
Prawidłowa interpretacja wartości p: Zakładając, że 90% klientów jest rzeczywiście zadowolonych z ich obsługi, badacz otrzyma zaobserwowaną różnicę, którą uzyskał w swojej próbie lub bardziej ekstremalną różnicę w 1,8% audytów w wyniku losowego doboru próby błąd. .
Przykład 2
Firma wymyśla nową baterię do telefonów. Firma twierdzi, że nowa bateria będzie działać co najmniej 10 minut dłużej niż stara. Aby przetestować to twierdzenie, badacz pobiera prostą losową próbkę 80 nowych i 80 starych baterii. Nowe baterie działają średnio 120 minut przy odchyleniu standardowym 12 minut, a stare baterie działają średnio 115 minut przy odchyleniu standardowym 15 minut. Wartość p wynikająca z testu różnicy średnich w populacji wynosi 0,011.
Prawidłowa interpretacja wartości p: Zakładając, że nowa bateria działa przez ten sam czas lub krócej niż stara bateria, badacz uzyska zaobserwowaną różnicę lub bardziej ekstremalną różnicę w 1,1% badań z powodu błędu losowego próbkowania.