Asymetria (statystyki)
W tym artykule wyjaśniono, co oznacza skośność w statystykach. W ten sposób znajdziesz definicję asymetrii w statystyce, jakie są różne rodzaje asymetrii, jak obliczany jest współczynnik asymetrii i jak jest on interpretowany.
Czym jest asymetria w statystyce?
W statystyce skośność jest miarą wskazującą stopień symetrii (lub asymetrii) rozkładu w stosunku do jego średniej. Mówiąc najprościej, skośność to parametr statystyczny używany do określenia stopnia symetrii (lub asymetrii) rozkładu bez konieczności przedstawiania go graficznie.
Zatem rozkład skośny to taki, który ma inną liczbę wartości po lewej stronie średniej niż po prawej stronie. Natomiast w rozkładzie symetrycznym po lewej i prawej stronie średniej znajduje się taka sama liczba wartości.
Na przykład rozkład wykładniczy jest asymetryczny, a rozkład normalny jest symetryczny.
Rodzaje asymetrii
W statystyce wyróżnia się trzy rodzaje asymetrii :
- Dodatnia asymetria : Rozkład ma więcej różnych wartości po prawej stronie średniej niż po jej lewej stronie.
- Symetria : Rozkład ma taką samą liczbę wartości po lewej stronie średniej, jak i po prawej stronie średniej.
- Ujemna skośność : Rozkład ma więcej różnych wartości po lewej stronie średniej niż po prawej stronie.
Współczynnik asymetrii
Współczynnik skośności lub wskaźnik asymetrii to współczynnik statystyczny, który pomaga określić asymetrię rozkładu. Zatem obliczając współczynnik asymetrii, można poznać rodzaj asymetrii rozkładu bez konieczności tworzenia jej graficznej reprezentacji.
Chociaż istnieją różne wzory na obliczenie współczynnika asymetrii i zobaczymy je wszystkie poniżej, niezależnie od zastosowanego wzoru, interpretacja współczynnika asymetrii zawsze odbywa się w następujący sposób:
- Jeśli współczynnik skośności jest dodatni, rozkład jest dodatnio skośny .
- Jeśli współczynnik skośności wynosi zero, rozkład jest symetryczny .
- Jeśli współczynnik skośności jest ujemny, rozkład jest ujemnie skośny .
Współczynnik asymetrii Fishera
Współczynnik skośności Fishera jest równy trzeciemu momentowi średniej podzielonej przez odchylenie standardowe próbki. Zatem wzór na współczynnik asymetrii Fishera wygląda następująco:
Równoważnie do obliczenia współczynnika Fishera można zastosować jeden z dwóch poniższych wzorów:
Złoto
jest matematyczną nadzieją,
średnia arytmetyczna,
odchylenie standardowe i
całkowita liczba danych.
Z drugiej strony, jeśli dane są pogrupowane, możesz użyć następującej formuły:
Gdzie w tym przypadku
To oznaka klasy i
bezwzględna częstotliwość kursu.
Współczynnik asymetrii Pearsona
Współczynnik skośności Pearsona jest równy różnicy między średnią próbki a modą podzieloną przez jej odchylenie standardowe (lub odchylenie standardowe). Wzór na współczynnik asymetrii Pearsona jest zatem następujący:
Złoto
jest współczynnikiem Pearsona,
średnia arytmetyczna,
moda i
odchylenie standardowe.
Należy pamiętać, że współczynnik skośności Pearsona można obliczyć tylko wtedy, gdy jest to rozkład jednomodalny, to znaczy, jeśli w danych występuje tylko jeden tryb.
Niektórzy autorzy do obliczenia współczynnika skośności Pearsona używają mediany zamiast trybu, ale generalnie stosuje się powyższy wzór.
Współczynnik asymetrii Bowleya
Współczynnik skośności Bowleya jest równy sumie trzeciego kwartyla plus pierwszy kwartyl minus dwukrotność mediany podzielonej przez różnicę między trzecim i pierwszym kwartylem. Wzór na ten współczynnik asymetrii jest zatem następujący:
Złoto
I
Są to odpowiednio pierwszy i trzeci kwartyl oraz
jest medianą rozkładu.
Przypomnijmy, że mediana rozkładu pokrywa się z drugim kwartylem.
Do czego służy asymetria w statystyce?
Aby w pełni zrozumieć znaczenie asymetrii w statystyce, zobaczmy, jak obliczana jest ta cecha rozkładu.
Skośność służy głównie do poznania kształtu rozkładu prawdopodobieństwa, ponieważ obliczając współczynnik skośności, można dowiedzieć się, czy jest to rozkład ujemny asymetryczny, dodatnio asymetryczny czy symetryczny, bez konieczności wykonywania jego graficznej reprezentacji.
Dodatkowo skośność wraz z kurtozą służy do określenia, czy zbiór danych może przybliżać rozkład normalny. Innymi słowy, współczynnik skośności i współczynnik kurtozy oblicza się w celu sprawdzenia, czy seria danych spełnia założenia rozkładu normalnego, a jeśli tak, okazuje się to bardzo korzystne, ponieważ implikuje możliwość zastosowania wielu twierdzeń statystycznych.