Pomiary kształtu

W tym artykule wyjaśniono, czym są pomiary kształtu. Dowiesz się więc, do czego używane są metryki kształtu, jak metryki kształtu są interpretowane i jak obliczane są tego typu metryki statystyczne.

Co to są pomiary kształtu?

W statystyce miary kształtu są wskaźnikami, które pozwalają nam opisać rozkład prawdopodobieństwa zgodnie z jego kształtem. Oznacza to, że miary kształtu służą do określenia, jak wygląda rozkład, bez konieczności przedstawiania go na wykresie.

Istnieją dwa rodzaje pomiarów kształtu: skośność i kurtoza. Skośność wskazuje, jak symetryczny jest rozkład, podczas gdy kurtoza wskazuje, jak skoncentrowany jest rozkład wokół średniej.

Jakie są wymiary kształtu?

Biorąc pod uwagę definicję miar kształtu, w tej sekcji pokazano, jakie są tego typu parametry statystyczne.

W statystyce wyróżniamy dwie miary formy:

  • Skośność : wskazuje, czy rozkład jest symetryczny czy asymetryczny.
  • Kurtoza – wskazuje, czy rozkład jest stromy czy płaski.

Asymetria

Wyróżnia się trzy rodzaje asymetrii :

  • Dodatnia asymetria : Rozkład ma więcej różnych wartości po prawej stronie średniej niż po jej lewej stronie.
  • Symetria : Rozkład ma taką samą liczbę wartości po lewej stronie średniej, jak i po prawej stronie średniej.
  • Ujemna skośność : Rozkład ma więcej różnych wartości po lewej stronie średniej niż po prawej stronie.
rodzaje asymetrii

współczynnik asymetrii

Współczynnik skośności lub wskaźnik asymetrii to współczynnik statystyczny, który pomaga określić asymetrię rozkładu. Zatem obliczając współczynnik asymetrii, można poznać rodzaj asymetrii rozkładu bez konieczności jej graficznego przedstawiania.

Chociaż istnieją różne wzory na obliczenie współczynnika asymetrii i zobaczymy je wszystkie poniżej, niezależnie od zastosowanego wzoru, interpretacja współczynnika asymetrii zawsze odbywa się w następujący sposób:

  • Jeśli współczynnik skośności jest dodatni, rozkład jest dodatnio skośny .
  • Jeśli współczynnik skośności wynosi zero, rozkład jest symetryczny .
  • Jeśli współczynnik skośności jest ujemny, rozkład jest ujemnie skośny .
Współczynnik asymetrii Fishera

Współczynnik skośności Fishera jest równy trzeciemu momentowi średniej podzielonej przez odchylenie standardowe próbki. Zatem wzór na współczynnik asymetrii Fishera wygląda następująco:

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

Równoważnie do obliczenia współczynnika Fishera można zastosować jeden z dwóch poniższych wzorów:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

Złoto

E

jest oczekiwaniem matematycznym,

\mu

średnia arytmetyczna,

\sigma

odchylenie standardowe i

N

całkowita liczba danych.

Z drugiej strony, jeśli dane są pogrupowane, możesz użyć następującej formuły:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

Gdzie w tym przypadku

x_i

To oznaka klasy i

f_i

bezwzględna częstotliwość kursu.

Współczynnik asymetrii Pearsona

Współczynnik skośności Pearsona jest równy różnicy między średnią próbki a modą podzieloną przez jej odchylenie standardowe (lub odchylenie standardowe). Wzór na współczynnik asymetrii Pearsona jest zatem następujący:

A_p=\cfrac{\mu-Mo}{\sigma}

Złoto

A_p

jest współczynnikiem Pearsona,

\mu

średnia arytmetyczna,

Mo

moda i

\sigma

odchylenie standardowe.

Należy pamiętać, że współczynnik skośności Pearsona można obliczyć tylko wtedy, gdy jest to rozkład jednomodalny, to znaczy, jeśli w danych występuje tylko jeden tryb.

Współczynnik asymetrii Bowleya

Współczynnik skośności Bowleya jest równy sumie trzeciego kwartyla plus pierwszy kwartyl minus dwukrotność mediany podzielonej przez różnicę między trzecim i pierwszym kwartylem. Wzór na ten współczynnik asymetrii jest zatem następujący:

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Złoto

Q_1

I

Q_3

są odpowiednio pierwszym i trzecim kwartylem oraz

Me

jest medianą rozkładu.

Spłaszczenie

Kurtoza , zwana także skośnością , wskazuje, jak skoncentrowany jest rozkład wokół jego średniej. Innymi słowy, kurtoza wskazuje, czy rozkład jest stromy czy płaski. W szczególności im większa kurtoza rozkładu, tym jest ona bardziej stroma (lub ostrzejsza).

pochlebny

Istnieją trzy rodzaje pochlebstw :

  • Leptokurtic : rozkład jest bardzo punktowy, co oznacza, że dane są silnie skoncentrowane wokół średniej. Dokładniej, rozkłady leptokurtyczne definiuje się jako rozkłady ostrzejsze niż rozkład normalny.
  • Mesokurtic : Kurtoza rozkładu jest równoważna kurtozie rozkładu normalnego. Dlatego nie jest uważany za spiczasty ani spłaszczony.
  • Platicurtic : rozkład jest bardzo spłaszczony, co oznacza, że koncentracja wokół średniej jest niska. Formalnie rozkłady platykurtyczne definiuje się jako rozkłady bardziej płaskie niż rozkład normalny.

Należy zauważyć, że różne typy kurtozy są definiowane poprzez przyjęcie kurtozy rozkładu normalnego jako punktu odniesienia.

rodzaje pochlebstw

Współczynnik spłaszczania

Wzór na współczynnik kurtozy jest następujący:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

Wzór na współczynnik kurtozy dla danych pogrupowanych w tablice częstości :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

Na koniec wzór na współczynnik kurtozy dla danych pogrupowanych w przedziały :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

Złoto:

  • g_2

    jest współczynnikiem kurtozy.

  • N

    to całkowita liczba danych.

  • x_i

    to i-te dane w szeregu.

  • \mu

    jest średnią arytmetyczną rozkładu.

  • \sigma

    jest odchyleniem standardowym (lub odchyleniem typowym) rozkładu.

  • f_i

    jest częstotliwością bezwzględną zbioru danych it.

  • c_i

    jest znakiem klasy i-tej grupy.

Należy zauważyć, że we wszystkich wzorach na współczynnik kurtozy odejmuje się 3, ponieważ jest to wartość kurtozy rozkładu normalnego. Zatem obliczenie współczynnika kurtozy odbywa się poprzez przyjęcie kurtozy rozkładu normalnego jako punktu odniesienia. Dlatego czasami w statystyce mówi się, że obliczana jest nadmierna kurtoza .

Po obliczeniu współczynnika kurtozy należy go interpretować w następujący sposób, aby określić, jakiego rodzaju jest to kurtoza:

  • Jeśli współczynnik kurtozy jest dodatni, oznacza to, że rozkład jest leptokurtyczny .
  • Jeśli współczynnik kurtozy wynosi zero, oznacza to, że rozkład jest mezokurtyczny .
  • Jeśli współczynnik kurtozy jest ujemny, oznacza to, że rozkład jest platykurtyczny .

Inne rodzaje miar statystycznych

Możesz także zainteresować się którymś z poniższych mierników statystycznych. Kliknij jeden, aby zobaczyć, czym są i jak są obliczane.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *