Co to jest analiza jednoczynnikowa? (definicja – przykład)


Termin analiza jednowymiarowa odnosi się do analizy jednej zmiennej. Możesz to zapamiętać, ponieważ przedrostek „uni” oznacza „jeden”.

Celem analizy jednowymiarowej jest zrozumienie rozkładu wartości pojedynczej zmiennej. Ten typ analizy można porównać z następującymi:

  • Analiza dwuwymiarowa : Analiza dwóch zmiennych.
  • Analiza wielowymiarowa: analiza dwóch lub więcej zmiennych.

Załóżmy na przykład, że mamy następujący zestaw danych:

Możemy zdecydować się na przeprowadzenie analizy jednoczynnikowej na jednej z poszczególnych zmiennych w zbiorze danych, aby lepiej zrozumieć rozkład wartości.

Na przykład możemy zdecydować się na wykonanie analizy jednoczynnikowej dla zmiennej Wielkość gospodarstwa domowego :

Przykład analizy jednoczynnikowej

Istnieją trzy popularne sposoby przeprowadzania analizy jednowymiarowej:

1. Statystyki podsumowujące

Najbardziej powszechnym sposobem przeprowadzania analizy jednoczynnikowej jest opisanie zmiennej za pomocąstatystyki podsumowującej .

Istnieją dwa popularne typy statystyk podsumowujących:

  • Miary tendencji centralnej : Liczby te opisują, gdzie znajduje się środek zbioru danych. Przykłady obejmują średnią i medianę .
  • Miary dyspersji : Liczby te opisują rozkład wartości w zbiorze danych. Przykłady obejmują przedział , rozstęp międzykwartylowy , odchylenie standardowe i wariancję .

2. Rozkłady częstotliwości

Innym sposobem przeprowadzenia analizy jednowymiarowej jest utworzenie rozkładu częstotliwości , który opisuje, jak często w zbiorze danych pojawiają się różne wartości.

3. Grafika

Innym sposobem przeprowadzenia analizy jednowymiarowej jest utworzenie wykresów wizualizujących rozkład wartości dla określonej zmiennej.

Typowe przykłady obejmują:

  • Wykresy pudełkowe
  • Histogramy
  • Krzywe gęstości
  • Camemberty

Poniższe przykłady pokazują, jak przeprowadzić każdy typ analizy jednoczynnikowej przy użyciu zmiennej Wielkość gospodarstwa domowego z naszego wcześniej wspomnianego zbioru danych:

Przykład analizy jednoczynnikowej

Statystyki podsumowujące

Możemy obliczyć następujące miary tendencji centralnej wielkości gospodarstwa domowego:

  • Średnia (wartość średnia): 3,8
  • Mediana (wartość średnia): 4

Wartości te dają nam pojęcie, gdzie leży „centralna” wartość.

Możemy również obliczyć następujące miary dyspersji:

  • Zakres (różnica między maks. a min.): 6
  • Skala międzykwartylowa (rozkład środkowych 50% wartości): 2.5
  • Odchylenie standardowe (średnia miara spreadu): 1,87

Wartości te dają nam wyobrażenie o rozkładzie wartości tej zmiennej.

Rozkład częstotliwości

Możemy również utworzyć następującą tabelę rozkładu częstotliwości, aby podsumować, jak często występują różne wartości:

Dzięki temu możemy szybko zauważyć, że najczęściej spotykaną wielkością gospodarstwa domowego są 4 osoby .

Zasób: Możesz użyć tego kalkulatora częstotliwości , aby automatycznie wygenerować rozkład częstotliwości dla dowolnej zmiennej.

Grafika

Możemy utworzyć następujące wykresy, które pomogą nam zwizualizować rozkład wartości dla wielkości gospodarstwa domowego:

1. Wykres pudełkowy

Wykres pudełkowy to wykres przedstawiający pięciocyfrowe podsumowanie zbioru danych.

Podsumowanie składające się z pięciu liczb obejmuje:

  • Wartość minimalna
  • Pierwszy kwartyl
  • Wartość średnia
  • Trzeci kwartyl
  • Maksymalna wartość

Oto jak wyglądałby wykres pudełkowy dla zmiennej Wielkość gospodarstwa domowego:

Zasób: Możesz użyć tegogeneratora wykresu pudełkowego , aby automatycznie utworzyć wykres pudełkowy dla dowolnej zmiennej.

2. Histogram

Histogram to rodzaj wykresu, który wykorzystuje pionowe słupki do przedstawienia częstotliwości. Ten typ wykresu jest przydatnym sposobem wizualizacji rozkładu wartości w zbiorze danych.

Oto jak wyglądałby histogram zmiennej Wielkość gospodarstwa domowego:

3. Krzywa gęstości

Krzywa gęstości to krzywa na wykresie przedstawiająca rozkład wartości w zestawie danych.

Jest to szczególnie przydatne do wizualizacji „kształtu” rozkładu, w tym tego, czy rozkład ma jeden lub więcej „szczytów” częstych wartości oraz czy rozkład jest przekrzywiony w lewo lub w prawo .

Oto jak wyglądałaby krzywa gęstości dla zmiennej Wielkość gospodarstwa domowego:

4. Wykres kołowy

Wykres kołowy jest rodzajem wykresu w kształcie koła i wykorzystuje wycinki do przedstawienia proporcji całości.

Oto jak wyglądałby wykres kołowy dla zmiennej Wielkość gospodarstwa domowego:

W zależności od rodzaju danych jeden z tych wykresów może być bardziej przydatny do wizualizacji rozkładu wartości niż inne.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *