Minimalna wielkość próby dla testu t: wyjaśnienie i przykład
Częstym pytaniem zadawanym przez uczniów jest:
Czy do przeprowadzenia testu t wymagana jest minimalna wielkość próbki?
Krótka odpowiedź:
Nie. Do przeprowadzenia testu t nie jest wymagana żadna minimalna wielkość próbki.
Tak naprawdę, w pierwszym kiedykolwiek zastosowanym teście t wykorzystano jedynie próbę czterech osób .
Jeśli jednak założenia testu t nie zostaną spełnione, wyniki mogą nie być wiarygodne.
Dodatkowo, jeśli wielkość próby jest zbyt mała, moc testu może być zbyt mała, aby wykryć istotne różnice w danych.
Przyjrzyjmy się każdemu z tych potencjalnych problemów bardziej szczegółowo.
Zrozumienie założeń testu t
Test t dla jednej próby służy do sprawdzenia, czy średnia populacji jest równa określonej wartości.
Test ten przyjmuje następujące założenia:
- Niezależność : Obserwacje próbki muszą być niezależne.
- Losowe pobieranie próbek : Obserwacje należy zbierać przy użyciu metody losowego doboru próby, aby zmaksymalizować szansę, że próbka będzie reprezentatywna dla populacji będącej przedmiotem zainteresowania.
- Normalność : Obserwacje powinny mieć w przybliżeniu rozkład normalny.
Test t dla dwóch prób służy do sprawdzenia, czy istnieje istotna różnica między średnimi z dwóch populacji.
Test ten przyjmuje następujące założenia:
- Niezależność : obserwacje każdej próbki muszą być niezależne.
- Losowe pobieranie próbek : Obserwacje z każdej próbki należy zbierać przy użyciu metody losowego pobierania próbek.
- Normalność : każda próbka powinna być rozłożona w przybliżeniu normalnie.
- Równa wariancja : każda próbka powinna mieć w przybliżeniu tę samą wariancję.
Jeśli podczas wykonywania każdego rodzaju testu t jedno lub więcej z tych założeń nie zostanie spełnione, wyniki testu mogą stać się niewiarygodne.
W takim przypadku najlepiej zastosować alternatywny test nieparametryczny, który nie przyjmuje tych założeń.
Nieparametryczną alternatywą dla testu t dla jednej próby jest test rang ze znakiem Wilcoxona .
Nieparametryczną alternatywą dla testu t dla dwóch próbek jest test U Manna-Whitneya .
Zrozumienie mocy testów t
Moc statystyczna odnosi się do prawdopodobieństwa, że test wykryje efekt, jeśli faktycznie istnieje.
Można wykazać, że im mniejsza liczebność próby, tym mniejsza moc statystyczna danego testu. Właśnie dlatego badacze na ogół chcą większych próbek, aby uzyskać większą moc, a tym samym większe prawdopodobieństwo wykrycia prawdziwych różnic.
Załóżmy na przykład, że prawdziwa wielkość efektu między dwiema populacjami wynosi 0,5 – „średnia” wielkość efektu. Możemy użyć następującego kodu R, aby obliczyć moc testu t dla dwóch próbek przy użyciu próbek o różnej wielkości:
#sample size n=10 power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.1838375 #sample size n=30 power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.477841 #sample size n=50 power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.6968888
Oto jak interpretować wyniki:
- Jeżeli wielkość każdej próbki wynosi n = 10, moc wynosi 0,184 .
- Jeżeli wielkość każdej próbki wynosi n = 30, moc wynosi 0,478 .
- Gdy wielkość każdej próbki wynosi n = 50, moc wynosi 0,697 .
Widzimy, że moc testu rośnie wraz ze wzrostem wielkości próby.
Zatem nie potrzebujemy minimalnej wielkości próby, aby przeprowadzić test t, ale małe rozmiary próbek prowadzą do niższej mocy statystycznej, a tym samym zmniejszonej zdolności do wykrycia prawdziwej różnicy w danych.
Wniosek
Oto podsumowanie tego, czego się dowiedzieliśmy:
- Do przeprowadzenia testu t nie jest wymagana żadna minimalna wielkość próbki.
- Jeżeli założenia testu t nie są spełnione, musimy zastosować alternatywę nieparametryczną.
- Jeżeli wielkość próby jest zbyt mała, moc testu t będzie niska, a zdolność testu do wykrycia prawdziwych różnic w danych będzie niska.
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat testów t.
Wprowadzenie do testu t dla jednej próby
Wprowadzenie do testu t dla dwóch próbek
Wprowadzenie do testu t dla par próbek
Cztery hipotezy sformułowane w teście t