Asymetria i spłaszczenie

W tym artykule wyjaśniono, czym jest skośność i kurtoza w statystykach. Znajdziesz więc definicję tych dwóch pojęć, sposób obliczania skośności i kurtozy, jakie są ich wzory, a także kalkulator online do obliczania skośności i kurtozy dowolnej próbki danych.

Co to jest skośność i kurtoza?

Skośność i kurtoza to dwie miary statystyczne używane do opisu kształtu rozkładu bez konieczności jego wykreślania. Mówiąc dokładniej, skośność wskazuje stopień symetrii (lub skośności) rozkładu, podczas gdy kurtoza wskazuje stopień koncentracji rozkładu wokół jego średniej.

W statystyce skośność i kurtoza nazywane są również miarami kształtu .

👉 Możesz skorzystać z poniższego kalkulatora online, aby obliczyć skośność i kurtozę dowolnego zbioru danych.

Asymetria

W statystyce skośność jest miarą wskazującą stopień symetrii (lub asymetrii) rozkładu w stosunku do jego średniej. Mówiąc najprościej, skośność to parametr statystyczny używany do określenia stopnia symetrii (lub asymetrii) rozkładu bez konieczności przedstawiania go graficznie.

Zatem rozkład asymetryczny to taki, który ma inną liczbę wartości po lewej stronie średniej w porównaniu z jedną po jej prawej stronie. Natomiast w rozkładzie symetrycznym po lewej i prawej stronie średniej znajduje się taka sama liczba wartości.

Zatem wyróżniamy trzy rodzaje asymetrii :

  • Dodatnia asymetria : Rozkład ma więcej różnych wartości po prawej stronie średniej niż po jej lewej stronie.
  • Symetria : Rozkład ma taką samą liczbę wartości po lewej stronie średniej, jak i po prawej stronie średniej.
  • Ujemna skośność : Rozkład ma więcej różnych wartości po lewej stronie średniej niż po prawej stronie.
rodzaje asymetrii

współczynnik asymetrii

Współczynnik skośności lub wskaźnik asymetrii to współczynnik statystyczny, który pomaga określić asymetrię rozkładu. Zatem obliczając współczynnik asymetrii, można dowiedzieć się, jaki rodzaj asymetrii przedstawia rozkład, bez konieczności przedstawiania tego graficznie.

Chociaż istnieją różne wzory na obliczenie współczynnika asymetrii i zobaczymy je wszystkie poniżej, niezależnie od zastosowanego wzoru, interpretacja współczynnika asymetrii zawsze odbywa się w następujący sposób:

  • Jeśli współczynnik skośności jest dodatni, rozkład jest dodatnio skośny .
  • Jeśli współczynnik asymetrii jest równy zero, rozkład jest symetryczny .
  • Jeśli współczynnik skośności jest ujemny, rozkład jest ujemnie skośny .

Współczynnik asymetrii Fishera

Współczynnik skośności Fishera jest równy trzeciemu momentowi średniej podzielonej przez odchylenie standardowe próbki. Zatem wzór na współczynnik asymetrii Fishera wygląda następująco:

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

Równoważnie do obliczenia współczynnika Fishera można zastosować jeden z dwóch poniższych wzorów:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

Złoto

E

jest oczekiwaniem matematycznym,

\mu

średnia arytmetyczna,

\sigma

odchylenie standardowe i

N

całkowita liczba danych.

Z drugiej strony, jeśli dane są pogrupowane, możesz użyć następującej formuły:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

Gdzie w tym przypadku

x_i

To oznaka klasy i

f_i

bezwzględna częstotliwość kursu.

Współczynnik asymetrii Pearsona

Współczynnik skośności Pearsona jest równy różnicy między średnią próbki a modą podzieloną przez jej odchylenie standardowe (lub odchylenie standardowe). Wzór na współczynnik asymetrii Pearsona jest zatem następujący:

A_p=\cfrac{\mu-Mo}{\sigma}

Złoto

A_p

jest współczynnikiem Pearsona,

\mu

średnia arytmetyczna,

Mo

moda i

\sigma

odchylenie standardowe.

Należy pamiętać, że współczynnik skośności Pearsona można obliczyć tylko wtedy, gdy jest to rozkład jednomodalny, to znaczy, jeśli w danych występuje tylko jeden tryb.

Współczynnik asymetrii Bowleya

Współczynnik skośności Bowleya jest równy sumie trzeciego kwartyla plus pierwszy kwartyl minus dwukrotność mediany podzielonej przez różnicę między trzecim i pierwszym kwartylem. Wzór na ten współczynnik asymetrii jest zatem następujący:

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Złoto

Q_1

I

Q_3

Są to odpowiednio pierwszy i trzeci kwartyl oraz

Me

jest medianą rozkładu.

Spłaszczenie

Kurtoza , zwana także skośnością , wskazuje, jak skoncentrowany jest rozkład wokół jego średniej. Innymi słowy, kurtoza wskazuje, czy rozkład jest stromy czy płaski. W szczególności im większa kurtoza rozkładu, tym jest ona bardziej stroma (lub ostrzejsza).

pochlebny

Istnieją trzy rodzaje pochlebstw :

  • Leptokurtic : rozkład jest bardzo punktowy, co oznacza, że dane są silnie skoncentrowane wokół średniej. Dokładniej, rozkłady leptokurtyczne definiuje się jako rozkłady ostrzejsze niż rozkład normalny.
  • Mesokurtic : Kurtoza rozkładu jest równoważna kurtozie rozkładu normalnego. Dlatego nie jest uważany za ostry ani spłaszczony.
  • Platykurtic : rozkład jest bardzo płaski, co oznacza, że koncentracja wokół średniej jest niska. Formalnie rozkłady platykurtyczne definiuje się jako te rozkłady, które są bardziej płaskie niż rozkład normalny.

Należy zauważyć, że różne typy kurtozy są definiowane poprzez przyjęcie kurtozy rozkładu normalnego jako punktu odniesienia.

rodzaje pochlebstw

współczynnik kurtozy

Wzór na współczynnik kurtozy jest następujący:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

Wzór na współczynnik kurtozy dla danych pogrupowanych w tablice częstości :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

Na koniec wzór na współczynnik kurtozy dla danych pogrupowanych w przedziały :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

Złoto:

  • g_2

    jest współczynnikiem kurtozy.

  • N

    to całkowita liczba danych.

  • x_i

    jest i-tym punktem danych w szeregu.

  • \mu

    jest średnią arytmetyczną rozkładu.

  • \sigma

    jest odchyleniem standardowym (lub odchyleniem typowym) rozkładu.

  • f_i

    jest częstotliwością bezwzględną zbioru danych it.

  • c_i

    jest znakiem klasy i-tej grupy.

Należy zauważyć, że we wszystkich wzorach na współczynnik kurtozy odejmuje się 3, ponieważ jest to wartość kurtozy rozkładu normalnego. Zatem obliczenie współczynnika kurtozy odbywa się poprzez przyjęcie kurtozy rozkładu normalnego jako punktu odniesienia. Dlatego czasami w statystyce mówi się, że obliczana jest nadmierna kurtoza .

Po obliczeniu współczynnika kurtozy należy go interpretować w następujący sposób, aby określić, jakiego rodzaju jest to kurtoza:

  • Jeśli współczynnik kurtozy jest dodatni, oznacza to, że rozkład jest leptokurtyczny .
  • Jeśli współczynnik kurtozy wynosi zero, oznacza to, że rozkład jest mezokurtyczny .
  • Jeśli współczynnik kurtozy jest ujemny, oznacza to, że rozkład jest platykurtyczny .

Kalkulator skośności i kurtozy

Wprowadź zbiór danych do poniższego kalkulatora, aby obliczyć jego skośność i współczynnik kurtozy, a także określić, jaki to rodzaj rozkładu. Dane należy oddzielić spacją i wprowadzić z użyciem kropki jako separatora dziesiętnego.

Do czego służy asymetria i kurtoza?

Na koniec zobaczymy, do czego wykorzystuje się skośność i kurtozę w statystyce oraz jak interpretuje się te dwa typy parametrów statystycznych.

Skośność i kurtoza służą do definiowania kształtu rozkładu prawdopodobieństwa bez konieczności przedstawiania go graficznie. Oznacza to, że skośność i kurtozę oblicza się w celu określenia rodzaju rozkładu bez konieczności sporządzania wykresu, co zwykle zajmuje dużo czasu i wysiłku.

Dodatkowo wartości skośności i kurtozy służą do porównania krzywej rozkładu z rozkładem normalnym. Ponieważ jeśli są podobne, oznacza to, że badany rozkład można przybliżyć do rozkładu normalnego i dlatego można zastosować kilka twierdzeń statystycznych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *