Jaki jest warunek pozytywny/negatywny w statystykach?
Próba Bernoulliego to eksperyment, w którym możliwe są tylko dwa wyniki – „sukces” lub „porażka”, a prawdopodobieństwo sukcesu jest takie samo za każdym razem, gdy eksperyment jest przeprowadzany.
Przykładem eseju Bernoulliego jest rzut monetą. Moneta może wylądować tylko na dwóch orłach (możemy nazwać orzeł „trafieniem”, a reszkę „porażką”), a prawdopodobieństwo powodzenia w każdym rzucie wynosi 0,5, zakładając, że moneta jest uczciwa.
Często w statystyce, gdy chcemy obliczyć prawdopodobieństwa obejmujące więcej niż kilka prób Bernoulliego, używamy rozkładu normalnego jako przybliżenia. Aby to jednak zrobić, musimy sprawdzić, czy spełniony jest warunek Pass/Fail :
Warunek pozytywny/negatywny: Aby można było zastosować rozkład normalny jako przybliżenie, w próbce musi znajdować się co najmniej 10 oczekiwanych sukcesów i 10 oczekiwanych niepowodzeń.
Zapisane w notacji, musimy sprawdzić następujące dwie rzeczy:
- Oczekiwana liczba sukcesów wynosi co najmniej 10: np ≥ 10
- Oczekiwana liczba awarii wynosi co najmniej 10: n(1-p) ≥ 10
gdzie n to wielkość próby, a p to prawdopodobieństwo sukcesu danej próby.
Uwaga: w niektórych podręcznikach podano, że do zastosowania normalnego przybliżenia potrzeba tylko 5 oczekiwanych sukcesów i 5 oczekiwanych niepowodzeń. Jednak liczba 10 jest częściej używana i jest liczbą bardziej konserwatywną. Dlatego użyjemy tej liczby w tym samouczku.
Przykład: Sprawdzanie warunku Pass/Fail
Załóżmy, że chcemy utworzyć przedział ufności dla odsetka mieszkańców hrabstwa, którzy opowiadają się za określonym prawem. Wybieramy losową próbę 100 mieszkańców i pytamy ich, jakie jest ich stanowisko w świetle prawa. Oto wyniki:
- Wielkość próby n = 100
- Proporcja na korzyść prawa p = 0,56
Do obliczenia przedziału ufności chcielibyśmy zastosować następujący wzór:
Przedział ufności = p +/- z*√ p(1-p) / n
Złoto:
- p: proporcja próbki
- z: wartość z odpowiadająca rozkładowi normalnemu
- n: wielkość próbki
W tej formule używana jest wartość az z rozkładu normalnego. Zatem w tym wzorze używamy rozkładu normalnego do przybliżenia rozkładu dwumianowego.
Aby to jednak zrobić, musimy sprawdzić, czy warunek Pass/Fail jest spełniony. Sprawdźmy, czy liczba sukcesów i liczba niepowodzeń w próbie wynosi co najmniej 10:
Liczba sukcesów: np = 100*.56 = 56
Liczba awarii: n(1-p) = 100*(1-.56) = 44
Obie liczby są równe lub większe niż 10, więc możemy użyć powyższego wzoru do obliczenia przedziału ufności.
Dodatkowe zasoby
Kolejnym warunkiem, który należy spełnić, aby zastosować rozkład normalny jako przybliżenie rozkładu dwumianowego, jest to, że wielkość próby, z którą pracujemy, nie przekracza 10% wielkości populacji. Nazywa się to warunkiem 10%.
Pamiętaj też, że jeśli pracujesz z dwiema proporcjami (np . tworzysz przedział ufności dla różnicy proporcji ), musisz sprawdzić, czy oczekiwana liczba sukcesów i niepowodzeń w obu próbach wynosi co najmniej 10.