Warunek 10% w statystyce: definicja i przykład
Próba Bernoulliego to eksperyment, w którym możliwe są tylko dwa wyniki – „sukces” lub „porażka”, a prawdopodobieństwo sukcesu jest takie samo za każdym razem, gdy eksperyment jest przeprowadzany.
Przykładem eseju Bernoulliego jest rzut monetą. Moneta może wylądować tylko na dwóch orłach (możemy nazwać orzeł „trafieniem”, a reszkę „porażką”), a prawdopodobieństwo powodzenia w każdym rzucie wynosi 0,5, zakładając, że moneta jest uczciwa.
Często w statystyce, gdy chcemy obliczyć prawdopodobieństwa obejmujące więcej niż kilka prób Bernoulliego, używamy rozkładu normalnego jako przybliżenia. Aby to jednak zrobić, musimy założyć, że próby są niezależne.
W przypadkach, gdy badania nie są w pełni niezależne, zawsze możemy założyć, że tak jest, jeśli wielkość próby, z którą pracujemy, nie przekracza 10% wielkości populacji. Nazywa się to warunkiem 10% .
Warunek 10%: Dopóki wielkość próby jest mniejsza lub równa 10% wielkości populacji, zawsze możemy założyć, że testy Bernoulliego są niezależne.
Intuicja stojąca za warunkiem 10%.
Aby rozwinąć intuicję stojącą za warunkiem 10%, rozważ następujący przykład.
Załóżmy, że prawdziwy odsetek uczniów w danej klasie, którzy wolą piłkę nożną od koszykówki, wynosi 50%. Niech zmienną losową X będzie liczba uczniów wybranych losowo w 4 próbach, którzy wolą piłkę nożną od koszykówki. Załóżmy, że chcemy poznać prawdopodobieństwo, że czterech losowo wybranych uczniów woli piłkę nożną od koszykówki.
Jeśli nasza klasa liczy 20 uczniów, a nasze badania były niezależne (na przykład moglibyśmy pobrać powtarzające się próbki wszystkich 20 uczniów), wówczas prawdopodobieństwo, że każdy uczeń woli piłkę nożną od koszykówki, można obliczyć w następujący sposób:
P (4 uczniów woli piłkę nożną) = 10/20 * 10/20 * 10/20 * 10/20 = 0,0625 .
Jeśli jednak nasze badania nie są niezależne (na przykład, gdy pobierzemy próbkę ucznia, nie będzie on mógł wrócić do klasy), wówczas prawdopodobieństwo, że wszyscy czterej uczniowie woleliby piłkę nożną, zostanie obliczone w następujący sposób:
P (4 uczniów woli piłkę nożną) = 10/20 * 9/19 * 8/18 * 7/17 = 0,0433 .
Te dwa prawdopodobieństwa są bardzo różne. Rozważmy, że w tym przykładzie liczebność naszej próby (4 uczniów) jest nie mniejsza lub równa 10% populacji (20 uczniów), więc nie będziemy mogli zastosować warunku 10%.
Jednakże rozważ poniższą tabelę, która pokazuje prawdopodobieństwo, że 4 losowo wybranych uczniów woli piłkę nożną, w zależności od wielkości klasy:
W miarę jak wielkość próby w stosunku do wielkości populacji (np. „wielkość klasy” w tym przykładzie) maleje, obliczone prawdopodobieństwo pomiędzy niezależnymi badaniami i badaniami niezależnymi staje się coraz bliżej.
Należy zauważyć, że gdy wielkość próby wynosi dokładnie 10% wielkości populacji, różnica między prawdopodobieństwem badań niezależnych i niezależnych jest stosunkowo podobna.
A gdy wielkość próby jest znacznie mniejsza niż 10% wielkości populacji (np. tylko 0,4% wielkości populacji w ostatnim wierszu tabeli), prawdopodobieństwa pomiędzy badaniami niezależnymi i niezależnymi są niezwykle zbliżone.
Wniosek
Warunek 10% stwierdza, że wielkość naszej próby musi być mniejsza lub równa 10% wielkości populacji, aby bezpiecznie założyć, że zbiór prób Bernoulliego jest niezależny.
Oczywiście najlepiej, aby wielkość naszej próby wynosiła znacznie poniżej 10% wielkości populacji, aby nasze wnioski na temat populacji były jak najbardziej dokładne. Na przykład wolelibyśmy, aby wielkość naszej próby wynosiła tylko 5% populacji, a nie 10%.
Dodatkowe zasoby
Wprowadzenie do rozkładu normalnego
Wprowadzenie do rozkładu dwumianowego
Wprowadzenie do centralnego twierdzenia granicznego