Pomiary pozycji

W tym artykule wyjaśniono, czym są pomiary położenia i do czego służą. Znajdziesz więc wszystkie pomiary pozycji, a także przykłady każdego typu.

Co to są pomiary pozycji?

Pozycja to parametry statystyczne pomiarów , które pomagają zdefiniować zbiór danych. Mówiąc najprościej, pomiary pozycji pomagają nam dowiedzieć się, jak wygląda zbiór danych.

W statystyce wyróżnia się dwa rodzaje pomiarów położenia: pomiary położenia centralnego , które służą do określenia wartości środkowych zbioru danych, oraz pomiary położenia niecentralnego , które służą do podziału danych na równe przedziały. .

Co to są pomiary pozycji?

W statystyce pomiary pozycji to:

  • Pomiary pozycji środkowej : Wskaż centralne wartości rozkładu.
    • Średnia : Jest to średnia wszystkich danych w próbie.
    • Mediana : Jest to środkowa wartość wszystkich danych uporządkowanych od najmniejszej do największej.
    • Tryb : jest to najczęściej powtarzana wartość w zbiorze danych.
  • Pomiary pozycji niecentralnej : Podziel zbiór danych na równe części.
    • Kwartyle : podziel próbkę danych na cztery identyczne części.
    • Kwintyle : Podziel dane na pięć równych części.
    • Decyle : Podziel zbiór danych na dziesięć przedziałów o równej wielkości.
    • Percentyle : dzielą dane na sto równoważnych części.

Każdy rodzaj pomiaru położenia wyjaśniono bardziej szczegółowo poniżej.

pomiary położenia centralnego

Pomiary pozycji środkowej wskazują centralną wartość rozkładu, to znaczy służą do znalezienia wartości reprezentatywnej dla środka zbioru danych. Istnieją przede wszystkim trzy miary położenia centralnego: średnia, mediana i moda.

Połowa

Aby obliczyć średnią, dodaj wszystkie wartości, a następnie podziel przez całkowitą liczbę obserwacji. Wzór na średnią jest zatem następujący:

\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^N x_i}{N}

Średnia jest również nazywana średnią arytmetyczną lub średnią . Co więcej, średnia rozkładu statystycznego jest równoważna jego matematycznym oczekiwaniom.

Mediana

Mediana to środkowa wartość wszystkich danych uporządkowanych od najmniejszej do największej. Innymi słowy, mediana dzieli uporządkowany zbiór danych na dwie równe części.

Obliczenie mediany zależy od tego, czy łączna liczba danych jest parzysta czy nieparzysta:

  • Jeśli całkowita liczba danych jest nieparzysta , medianą będzie wartość mieszcząca się w samym środku danych. To znaczy wartość znajdująca się na pozycji (n+1)/2 posortowanych danych.
  • Me=x_{\frac{n+1}{2}

  • Jeśli całkowita liczba punktów danych jest parzysta , mediana będzie średnią z dwóch punktów danych znajdujących się w środku. Oznacza to średnią arytmetyczną wartości znajdujących się na pozycjach n/2 i n/2+1 uporządkowanych danych.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

Złoto

n

to całkowita liczba danych w próbie, a Me to mediana.

Moda

W statystyce tryb to wartość w zbiorze danych, która ma najwyższą częstotliwość bezwzględną, to znaczy tryb to wartość, która pojawia się najczęściej w zbiorze danych.

Dlatego, aby obliczyć modę zbioru danych statystycznych, wystarczy policzyć, ile razy każdy element danych pojawia się w próbie, a modą będzie najczęściej powtarzający się element danych.

Tryb można również nazwać trybem statystycznym lub wartością modalną .

Ze względu na liczbę najczęściej powtarzanych wartości można wyróżnić trzy typy trybów:

  • Tryb unimodalny : Istnieje tylko jedna wartość z maksymalną liczbą powtórzeń. Na przykład [1, 4, 2, 4, 5, 3].
  • Tryb bimodalny : Maksymalna liczba powtórzeń występuje przy dwóch różnych wartościach i obie wartości są powtarzane taką samą liczbę razy. Na przykład [2, 6, 7, 2, 3, 6, 9].
  • Tryb multimodalny : Trzy lub więcej wartości mają tę samą maksymalną liczbę powtórzeń. Na przykład [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1].

Pomiary położenia niecentralnego

Pomiary pozycji niecentralnej służą do podziału zbioru danych statystycznych na równe przedziały. Istnieją głównie cztery typy niecentralnych miar pozycji: kwartyle, kwintyle, decyle i percentyle.

Kwartyle

W statystyce kwartyle to trzy wartości dzielące zbiór danych na cztery równe części. Zatem pierwszy, drugi i trzeci kwartyl reprezentuje odpowiednio 25%, 50% i 75% wszystkich danych statystycznych.

Kwartyle są reprezentowane przez dużą literę Q i indeks kwartylowy, zatem pierwszy kwartyl to Q 1 , drugi kwartyl to Q 2 , a trzeci kwartyl to Q 3 .

Kwintyle

Kwintyle to cztery wartości dzielące uporządkowany zbiór danych na pięć równych części. Zatem pierwszy, drugi, trzeci i czwarty kwintyle reprezentują odpowiednio 20%, 40%, 60% i 80% danych próbki.

Na przykład trzeci kwintyl reprezentuje ponad 60% wszystkich zebranych danych, ale jest mniejszy niż pozostałe dane.

Symbolem kwintylów jest wielka litera K z indeksem kwintylowym, tzn. pierwszy kwintyl to K 1 , drugi kwintyl to K 2 , trzeci kwintyl to K 3 i czwarty kwintyl to K 4 . Chociaż może być również reprezentowany przez literę Q (niezalecane, ponieważ powoduje zamieszanie z kwartylami).

Decyle

Decyle to dziewięć wartości, które dzielą zbiór uporządkowanych danych na dziesięć równych części. Zatem pierwszy, drugi, trzeci… decyl reprezentuje 10%, 20%, 30%… próbki lub populacji.

Na przykład czwarta wartość decyla jest większa niż 40% danych, ale niższa niż pozostałe dane.

Ogólnie rzecz biorąc, decyle są reprezentowane przez wielką literę D i indeks decylu, to znaczy pierwszy decyl to D 1 , drugi decyl to D 2 , trzeci decyl to D 3 itd.

Percentyle

Percentyle to wartości dzielące zbiór uporządkowanych danych na sto równych części. Zatem percentyl wskazuje wartość, poniżej której spada procent zbioru danych.

Na przykład wartość 35. percentyla jest wyższa niż 35% obserwowanych danych, ale niższa niż pozostałe dane.

Percentyle są reprezentowane przez wielką literę P i indeks percentyla, co oznacza, że 1. percentyl to P 1 , 40. percentyl to P 40 , 79. percentyl to P 79 i tak dalej.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *