Co to jest analiza jednoczynnikowa? (definicja – przykład)
Termin analiza jednowymiarowa odnosi się do analizy jednej zmiennej. Możesz to zapamiętać, ponieważ przedrostek „uni” oznacza „jeden”.
Celem analizy jednowymiarowej jest zrozumienie rozkładu wartości pojedynczej zmiennej. Ten typ analizy można porównać z następującymi:
- Analiza dwuwymiarowa : Analiza dwóch zmiennych.
- Analiza wielowymiarowa: analiza dwóch lub więcej zmiennych.
Załóżmy na przykład, że mamy następujący zestaw danych:
Możemy zdecydować się na przeprowadzenie analizy jednoczynnikowej na jednej z poszczególnych zmiennych w zbiorze danych, aby lepiej zrozumieć rozkład wartości.
Na przykład możemy zdecydować się na wykonanie analizy jednoczynnikowej dla zmiennej Wielkość gospodarstwa domowego :
Istnieją trzy popularne sposoby przeprowadzania analizy jednowymiarowej:
1. Statystyki podsumowujące
Najbardziej powszechnym sposobem przeprowadzania analizy jednoczynnikowej jest opisanie zmiennej za pomocąstatystyki podsumowującej .
Istnieją dwa popularne typy statystyk podsumowujących:
- Miary tendencji centralnej : Liczby te opisują, gdzie znajduje się środek zbioru danych. Przykłady obejmują średnią i medianę .
- Miary dyspersji : Liczby te opisują rozkład wartości w zbiorze danych. Przykłady obejmują przedział , rozstęp międzykwartylowy , odchylenie standardowe i wariancję .
2. Rozkłady częstotliwości
Innym sposobem przeprowadzenia analizy jednowymiarowej jest utworzenie rozkładu częstotliwości , który opisuje, jak często w zbiorze danych pojawiają się różne wartości.
3. Grafika
Innym sposobem przeprowadzenia analizy jednowymiarowej jest utworzenie wykresów wizualizujących rozkład wartości dla określonej zmiennej.
Typowe przykłady obejmują:
- Wykresy pudełkowe
- Histogramy
- Krzywe gęstości
- Camemberty
Poniższe przykłady pokazują, jak przeprowadzić każdy typ analizy jednoczynnikowej przy użyciu zmiennej Wielkość gospodarstwa domowego z naszego wcześniej wspomnianego zbioru danych:
Statystyki podsumowujące
Możemy obliczyć następujące miary tendencji centralnej wielkości gospodarstwa domowego:
- Średnia (wartość średnia): 3,8
- Mediana (wartość średnia): 4
Wartości te dają nam pojęcie, gdzie leży „centralna” wartość.
Możemy również obliczyć następujące miary dyspersji:
- Zakres (różnica między maks. a min.): 6
- Skala międzykwartylowa (rozkład środkowych 50% wartości): 2.5
- Odchylenie standardowe (średnia miara spreadu): 1,87
Wartości te dają nam wyobrażenie o rozkładzie wartości tej zmiennej.
Rozkład częstotliwości
Możemy również utworzyć następującą tabelę rozkładu częstotliwości, aby podsumować, jak często występują różne wartości:
Dzięki temu możemy szybko zauważyć, że najczęściej spotykaną wielkością gospodarstwa domowego są 4 osoby .
Zasób: Możesz użyć tego kalkulatora częstotliwości , aby automatycznie wygenerować rozkład częstotliwości dla dowolnej zmiennej.
Grafika
Możemy utworzyć następujące wykresy, które pomogą nam zwizualizować rozkład wartości dla wielkości gospodarstwa domowego:
1. Wykres pudełkowy
Wykres pudełkowy to wykres przedstawiający pięciocyfrowe podsumowanie zbioru danych.
Podsumowanie składające się z pięciu liczb obejmuje:
- Wartość minimalna
- Pierwszy kwartyl
- Wartość średnia
- Trzeci kwartyl
- Maksymalna wartość
Oto jak wyglądałby wykres pudełkowy dla zmiennej Wielkość gospodarstwa domowego:
Zasób: Możesz użyć tegogeneratora wykresu pudełkowego , aby automatycznie utworzyć wykres pudełkowy dla dowolnej zmiennej.
2. Histogram
Histogram to rodzaj wykresu, który wykorzystuje pionowe słupki do przedstawienia częstotliwości. Ten typ wykresu jest przydatnym sposobem wizualizacji rozkładu wartości w zbiorze danych.
Oto jak wyglądałby histogram zmiennej Wielkość gospodarstwa domowego:
3. Krzywa gęstości
Krzywa gęstości to krzywa na wykresie przedstawiająca rozkład wartości w zestawie danych.
Jest to szczególnie przydatne do wizualizacji „kształtu” rozkładu, w tym tego, czy rozkład ma jeden lub więcej „szczytów” częstych wartości oraz czy rozkład jest przekrzywiony w lewo lub w prawo .
Oto jak wyglądałaby krzywa gęstości dla zmiennej Wielkość gospodarstwa domowego:
4. Wykres kołowy
Wykres kołowy jest rodzajem wykresu w kształcie koła i wykorzystuje wycinki do przedstawienia proporcji całości.
Oto jak wyglądałby wykres kołowy dla zmiennej Wielkość gospodarstwa domowego:
W zależności od rodzaju danych jeden z tych wykresów może być bardziej przydatny do wizualizacji rozkładu wartości niż inne.