Wzory statystyczne
Tutaj znajdziesz główne wzory statystyczne. Pozostawiamy również linki do naszych artykułów, w których można zobaczyć przykłady zastosowania poszczególnych wzorów statystycznych, a ponadto można skorzystać z kalkulatora online, aby nie musieć wykonywać obliczeń i znać bezpośrednio wynik wzoru.
Wzory na statystyczne miary tendencji centralnej
Połowa
Aby obliczyć średnią, dodaj wszystkie wartości, a następnie podziel przez całkowitą liczbę danych. Wzór na średnią jest zatem następujący:
W statystyce średnia jest również nazywana średnią arytmetyczną lub średnią .
Mediana
Mediana to środkowa wartość wszystkich danych uporządkowanych od najmniejszej do największej. Innymi słowy, mediana dzieli uporządkowany zbiór danych na dwie równe części.
Obliczenie mediany zależy od tego, czy łączna liczba danych jest parzysta czy nieparzysta:
- Jeśli całkowita liczba danych jest nieparzysta , medianą będzie wartość mieszcząca się w samym środku danych. To znaczy wartość znajdująca się na pozycji (n+1)/2 posortowanych danych.
- Jeśli całkowita liczba punktów danych jest parzysta , mediana będzie średnią z dwóch punktów danych znajdujących się w środku. Oznacza to średnią arytmetyczną wartości znajdujących się na pozycjach n/2 i n/2+1 uporządkowanych danych.
Złoto
oznacza całkowitą liczbę danych w próbie, a symbol Me oznacza medianę.
Moda
W statystyce tryb to wartość w zbiorze danych, która ma najwyższą częstotliwość bezwzględną, to znaczy tryb jest najczęściej powtarzaną wartością w zbiorze danych.
Dlatego nie ma konkretnego wzoru na modę, ale aby obliczyć mod zbioru danych statystycznych, wystarczy policzyć, ile razy każdy element danych pojawia się w próbce, a dane będą najczęściej powtarzane.
Tryb można również nazwać trybem statystycznym lub wartością modalną .
Wzory na statystyczne miary dyspersji
Odchylenie standardowe
Odchylenie standardowe, zwane także odchyleniem standardowym, jest równe pierwiastkowi kwadratowemu z sumy kwadratów odchyleń serii danych podzielonej przez całkowitą liczbę obserwacji.
Zatem wzór na odchylenie standardowe wygląda następująco:
Zmienność
Wariancja jest równa sumie kwadratów reszt z całkowitej liczby obserwacji. Wzór na tę metrykę statystyczną jest zatem następujący:
Złoto:
-
jest zmienną losową, dla której chcesz obliczyć wariancję.
-
jest wartością danych
.
-
to całkowita liczba obserwacji.
-
jest średnią zmiennej losowej
.
Współczynnik zmienności
W statystyce współczynnik zmienności jest miarą rozproszenia stosowaną do określenia rozproszenia zbioru danych w stosunku do jego średniej. Współczynnik zmienności oblicza się, dzieląc odchylenie standardowe danych przez jego średnią, a następnie mnożąc przez 100, aby wyrazić wartość w procentach.
Czysty
Rozstęp statystyczny jest miarą rozproszenia, która wskazuje różnicę między wartością maksymalną a minimalną wartością danych w próbce. Dlatego też, aby obliczyć wielkość populacji lub próby statystycznej, od wartości minimalnej należy odjąć wartość maksymalną.
Zakres międzykwartylowy
Rozstęp międzykwartylowy , zwany także rozstępem międzykwartylowym , jest miarą rozproszenia statystycznego, która wskazuje różnicę między trzecim i pierwszym kwartylem.
Dlatego, aby obliczyć rozstęp międzykwartylowy zbioru danych statystycznych, należy najpierw znaleźć trzeci i pierwszy kwartyl, a następnie je odjąć.
średnia różnica
Średnie odchylenie , zwane także średnim odchyleniem bezwzględnym , jest średnią odchyleń bezwzględnych. Średnie odchylenie jest zatem równe sumie odchyleń każdego elementu danych od średniej arytmetycznej podzielonej przez całkowitą liczbę elementów danych.
Wzory na statystyczne pomiary położenia
kwartyle
W statystyce kwartyle to trzy wartości dzielące zbiór uporządkowanych danych na cztery równe części. Zatem pierwszy, drugi i trzeci kwartyl reprezentuje odpowiednio 25%, 50% i 75% wszystkich danych statystycznych.
Kwartyle są reprezentowane przez dużą literę Q i indeks kwartylowy, więc pierwszy kwartyl to Q 1 , drugi kwartyl to Q 2 , a trzeci kwartyl to Q 3 .
Wzór kwartylowy to:
Uwaga: ten wzór informuje nas o pozycji kwartyla, a nie o jego wartości. Kwartylem będą dane znajdujące się na pozycji otrzymanej ze wzoru.
Czasami jednak wynik tej formuły da nam liczbę dziesiętną. Musimy zatem rozróżnić dwa przypadki w zależności od tego, czy wynik jest liczbą dziesiętną, czy nie:
- Jeżeli wynikiem wzoru jest liczba bez części dziesiętnej , kwartylem jest dana, która znajduje się na pozycji określonej we wzorze powyżej.
- Jeżeli wynikiem wzoru jest liczba zawierająca część dziesiętną , wartość kwartylowa obliczana jest według następującego wzoru:
Gdzie x i oraz x i+1 to numery pozycji, pomiędzy którymi znajduje się liczba uzyskana według pierwszego wzoru, a d to część dziesiętna liczby uzyskanej według pierwszego wzoru.
decyle
W statystyce decyle to dziewięć wartości, które dzielą zbiór uporządkowanych danych na dziesięć równych części. Tak więc pierwszy, drugi, trzeci… decyl reprezentuje 10%, 20%, 30%… próbki lub populacji.
Decyle są reprezentowane przez wielką literę D i indeks decylowy, to znaczy pierwszy decyl to D 1 , drugi decyl to D 2 , trzeci decyl to D 3 itd.
Wzór na decyl jest następujący:
Uwaga: ten wzór informuje nas o pozycji decyla, a nie o jego wartości. Decylem będą dane znajdujące się na pozycji otrzymanej ze wzoru.
Czasami jednak wynik tej formuły da nam liczbę dziesiętną, dlatego musimy rozróżnić dwa przypadki w zależności od tego, czy wynik jest liczbą dziesiętną, czy nie:
- Jeżeli wynikiem wzoru jest liczba bez części dziesiętnej , decylem jest dana znajdująca się na pozycji określonej we wzorze powyżej.
- Jeżeli wynikiem wzoru jest liczba zawierająca część dziesiętną , wartość decyla oblicza się według następującego wzoru:
Gdzie x i oraz x i+1 to numery pozycji, pomiędzy którymi znajduje się liczba uzyskana według pierwszego wzoru, a d to część dziesiętna liczby uzyskanej według pierwszego wzoru.
percentyle
W statystyce percentyle to wartości dzielące zbiór uporządkowanych danych na sto równych części. Zatem percentyl wskazuje wartość, poniżej której spada procent zbioru danych.
Percentyle są reprezentowane przez wielką literę P i indeks percentyla, czyli pierwszy percentyl to P 1 , 40. percentyl to P 40 , 79. percentyl to P 79 itd.
Wzór percentyla to:
Uwaga: ten wzór informuje nas o położeniu percentyla, ale nie o jego wartości. Percentylem będą dane znajdujące się na pozycji uzyskanej ze wzoru.
Czasami jednak wynik tej formuły da nam liczbę dziesiętną, dlatego musimy rozróżnić dwa przypadki w zależności od tego, czy wynik jest liczbą dziesiętną, czy nie:
- Jeżeli wynikiem wzoru jest liczba bez części dziesiętnej , percentylowi odpowiadają dane znajdujące się na pozycji podanej we wzorze powyżej.
- Jeśli wynikiem wzoru jest liczba z częścią dziesiętną , dokładna wartość percentyla jest obliczana przy użyciu następującego wzoru:
Gdzie x i oraz x i+1 to numery pozycji, pomiędzy którymi znajduje się liczba uzyskana według pierwszego wzoru, a d to część dziesiętna liczby uzyskanej według pierwszego wzoru.
Statystyczne wzory na pomiar kształtu
współczynnik asymetrii
Współczynnik skośności lub wskaźnik skośności to współczynnik statystyczny używany do określenia skośności rozkładu. Zatem obliczając współczynnik asymetrii, można poznać rodzaj asymetrii rozkładu bez konieczności tworzenia jej graficznej reprezentacji.
Wzór na współczynnik asymetrii jest następujący:
Równoważnie do obliczenia współczynnika asymetrii Fishera można zastosować jeden z dwóch poniższych wzorów:
Złoto
jest oczekiwaniem matematycznym,
średnia arytmetyczna,
odchylenie standardowe i
całkowita liczba danych.
współczynnik kurtozy
Kurtoza, zwana także ostrością, wskazuje, jak skoncentrowany jest rozkład wokół średniej. Innymi słowy, kurtoza wskazuje, czy rozkład jest stromy czy płaski. W szczególności im większa kurtoza rozkładu, tym jest ona bardziej stroma (lub ostrzejsza).
Wzór na współczynnik kurtozy jest następujący:
Złoto
jest wartością odpowiadającą obserwacji
,
średnia arytmetyczna,
odchylenie standardowe i
całkowita liczba danych.
Tabela podsumowująca wszystkie formuły statystyczne
Na koniec zostawiamy tabelę podsumowującą główne formuły statystyczne.