Statystyka nieparametryczna

W tym artykule wyjaśniamy, czym są statystyki nieparametryczne i do czego służą. Będzie można również zobaczyć przykład zastosowania statystyki nieparametrycznej, a ponadto jaka jest różnica pomiędzy statystyką nieparametryczną a statystyką parametryczną.

Co to są statystyki nieparametryczne?

Statystyka nieparametryczna to gałąź statystyki wnioskowania, która bada zmienne, które nie pasują do rozkładu prawdopodobieństwa lub których parametry rozkładu nie są zdefiniowane. Oznacza to, że statystyki nieparametryczne stosuje się dla zmiennych, których nie można zdefiniować za pomocą modeli teoretycznych.

Zatem rozkładów stosowanych w statystyce nieparametrycznej nie można zdefiniować a priori, lecz determinują je obserwowane dane.

Nieparametryczne metody statystyczne są na ogół stosowane, gdy nie są spełnione poprzednie założenia niektórych testów, ponieważ statystyka parametryczna z reguły wymaga przyjęcia pewnych założeń. Poniżej zobaczymy, jakie są różnice między statystyką nieparametryczną a statystyką parametryczną.

Dlatego też statystyki nieparametryczne służą do badania populacji posiadających ocenę, np. recenzje filmów, które otrzymują od jednej do pięciu gwiazdek. Innym zastosowaniem statystyki nieparametrycznej jest sytuacja, gdy dane mają ranking, ale nie mają jasnej interpretacji numerycznej, na przykład przy ocenie preferencji.

Przykład statystyki nieparametrycznej

Kiedy już zapoznamy się z definicją statystyki nieparametrycznej, zobaczymy przykład jej zastosowania, aby w pełni zrozumieć tę koncepcję.

Wyobraźmy sobie, że mamy próbę statystyczną składającą się z 99 obserwacji i chcemy określić prawdopodobieństwo wartości kolejnej obserwacji (obserwacja numer 100).

Gdybyśmy korzystali ze statystyki parametrycznej, najpierw obliczylibyśmy kilka parametrów statystycznych próbki, aby poznać jej charakterystykę. Moglibyśmy następnie przeprowadzić różne testy statystyczne, korzystając z obliczonych parametrów, aby określić prawdopodobieństwo wartości następnej obserwacji.

Jednak dzięki statystyce nieparametrycznej możemy poznać informację o kolejnej wartości bez konieczności obliczania parametrów statystycznych próby.

Na przykład, jeśli mamy próbkę 99 obserwacji, za pomocą statystyk nieparametrycznych możemy ustalić, że istnieje 1% prawdopodobieństwo, że obserwacja numer 100 jest większa niż wszystkie poprzednie. W ten sposób można przeprowadzić nieparametryczną estymację maksimum próbki.

Krótko mówiąc, dzięki statystyce nieparametrycznej możemy obliczać prawdopodobieństwa i dokonywać szacunków bez konieczności znajomości parametrów statystycznych próby.

Nieparametryczne testy statystyczne

Testy nieparametryczne to metody statystyczne oparte na statystykach nieparametrycznych. Dlatego w testach nieparametrycznych zmienne są oceniane bez przyjmowania założeń dotyczących rozkładów prawdopodobieństwa.

Najbardziej znane testy nieparametryczne to:

  • test chi-kwadrat
  • test dwumianowy
  • Test rangi podpisanej przez Wilcoxona
  • test mediany
  • Test Andersona-Darlinga
  • Test Cochrana
  • Test Kappa Cohena
  • Próba Fishera
  • Próba Friedmana
  • Test Kendalla
  • Test Kołmogorowa-Smirnowa
  • Próba Kuipera
  • Test Manna-Whitneya lub test Wilcoxona
  • Test McNemara
  • Test Siegela-Tukeya
  • Test znaku
  • Test Walda-Wolfowitza

Zalety i wady statystyki nieparametrycznej

W porównaniu ze statystyką parametryczną zalety i wady statystyki nieparametrycznej są następujące:

Korzyść:

  • Statystyki nieparametryczne można zastosować do danych numerycznych i nienumerycznych.
  • Ogólnie rzecz biorąc, testy nieparametryczne nie muszą spełniać wcześniejszych założeń, co pozwala na ich wykorzystanie w większej liczbie sytuacji.
  • Gdy wielkość próby jest mała, testy nieparametryczne są na ogół szybsze do zastosowania.

Niedogodności:

  • Czasami informacje mogą zostać utracone w wyniku ich przekształcenia w informacje jakościowe.
  • W przypadku dużej próby wykonanie testu nieparametrycznego jest bardzo pracochłonne.
  • Testy nieparametryczne mają zazwyczaj niższą moc, co oznacza, że do wyciągnięcia wniosków z tym samym poziomem ufności potrzebna jest większa próbka.
Patrz: Poziom ufności

Statystyka nieparametryczna i statystyka parametryczna

Na koniec, podsumowując, zobaczmy, jaka jest różnica między statystyką nieparametryczną a statystyką parametryczną.

Statystyka parametryczna to gałąź statystyki wnioskowanej, która zakłada, że dane można modelować za pomocą rozkładu prawdopodobieństwa. Na przykład test t-Studenta jest testem parametrycznym, ponieważ wykorzystuje rozkład prawdopodobieństwa t-Studenta.

Różnica między statystyką nieparametryczną a statystyką parametryczną polega na tym, czy opierają się one na modelach teoretycznych. Statystyka nieparametryczna bada zmienne, które nie pasują do rozkładów prawdopodobieństwa, podczas gdy statystyka parametryczna wykorzystuje zdefiniowane rozkłady prawdopodobieństwa.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *