Pomiary dyspersji

W tym artykule dowiesz się, czym są miary rozproszenia i do czego służą te metryki statystyczne. Dodatkowo będziesz mógł zobaczyć, jak obliczana jest każda miara dyspersji.

Co to są miary dyspersji?

Miary rozproszenia to miary statystyczne wskazujące rozproszenie zbioru danych. Oznacza to, że miary rozproszenia służą do oceny stopnia rozproszenia danych w próbce.

Miary rozproszenia nazywane są także miarami zmienności lub miarami rozproszenia .

Jakie są miary dyspersji?

Miary dyspersji są następujące:

  • Odchylenie standardowe (lub odchylenie standardowe)
  • Zmienność
  • Współczynnik zmienności
  • Czysty
  • Zakres międzykwartylowy
  • Średnia różnica

Poniżej wyjaśniono, jak określić każdą miarę dyspersji.

Odchylenie standardowe

Odchylenie standardowe , zwane także odchyleniem typowym , jest równe pierwiastkowi kwadratowemu z sumy kwadratów odchyleń serii danych podzielonej przez całkowitą liczbę obserwacji.

Wzór na tę miarę rozproszenia jest zatem następujący:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Zmienność

Wariancja jest równa sumie kwadratów reszt z całkowitej liczby obserwacji. Wzór na tę metrykę rozproszenia jest zatem następujący:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Złoto:

  • X

    jest zmienną losową, dla której chcesz obliczyć wariancję.

  • x_i

    jest wartością danych

    i

    .

  • n

    to całkowita liczba obserwacji.

  • \overline{X}

    jest średnią zmiennej losowej

    X

    .

Współczynnik zmienności

W statystyce współczynnik zmienności jest miarą rozproszenia stosowaną do określenia rozproszenia zbioru danych w stosunku do jego średniej. Współczynnik zmienności oblicza się, dzieląc odchylenie standardowe danych przez jego średnią, a następnie mnożąc przez 100, aby wyrazić wartość w procentach.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Czysty

Rozstęp jest miarą rozproszenia, która wskazuje różnicę między maksymalną i minimalną wartością danych w próbce. Dlatego też, aby obliczyć wielkość populacji lub próby statystycznej, od wartości minimalnej należy odjąć wartość maksymalną.

R=\text{M\'ax}-\text{M\'in}

Zakres międzykwartylowy

Rozstęp międzykwartylowy , zwany także rozstępem międzykwartylowym , jest miarą rozproszenia statystycznego, która wskazuje różnicę między trzecim i pierwszym kwartylem.

Dlatego, aby obliczyć rozstęp międzykwartylowy zbioru danych statystycznych, należy najpierw znaleźć trzeci i pierwszy kwartyl, a następnie je odjąć.

IQR=Q_3-Q_1

Symbolem rozstępu międzykwartylowego jest IQR, z angielskiego rozstępu międzykwartylowego .

Jedną z najkorzystniejszych cech tej miary rozproszenia jest to, że jest to solidna statystyka, to znaczy ma dużą odporność na wartości odstające. Ponieważ wartości skrajne nie są brane pod uwagę przy obliczaniu rozstępu międzykwartylowego, jego wartość będzie się bardzo nieznacznie różnić, jeśli pojawią się nowe wartości odstające .

Średnia różnica

Średnie odchylenie , zwane także średnim odchyleniem bezwzględnym , jest średnią odchyleń bezwzględnych. Średnie odchylenie jest zatem równe sumie odchyleń każdego elementu danych od średniej arytmetycznej podzielonej przez całkowitą liczbę elementów danych.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

Do czego służą pomiary dyspersji?

Miary dyspersji służą do oceny rozproszenia próbki statystycznej. Oznacza to, że pomiary dyspersji pozwalają nam określić ilościowo rozproszenie zbioru danych, a na podstawie uzyskanych wartości można przeanalizować rozproszenie próbki danych.

Miary rozproszenia są szeroko stosowane, ponieważ pomagają opisać próbkę danych. Miary rozproszenia pomagają zrozumieć, jak wygląda seria danych.

Inne często obliczane miary statystyczne to miary tendencji centralnej i miary pozycji. Zazwyczaj nie określa się pojedynczego pomiaru statystycznego, lecz wykonuje się wiele pomiarów, aby lepiej zrozumieć, jak wyglądają badane dane.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *