Szybkie wprowadzenie do analizy dwuwymiarowej


Termin analiza dwuwymiarowa odnosi się do analizy dwóch zmiennych. Możesz to zapamiętać, ponieważ przedrostek „bi” oznacza „dwa”.

Celem analizy dwuwymiarowej jest zrozumienie związku między dwiema zmiennymi. Ten typ analizy można porównać z następującymi:

  • Analiza jednowymiarowa : Analiza jednej zmiennej.
  • Analiza wielowymiarowa: analiza dwóch lub więcej zmiennych.

Istnieją trzy popularne sposoby przeprowadzania analizy dwuwymiarowej:

1. Wykresy punktowe.

2. Współczynniki korelacji.

3. Prosta regresja liniowa.

W tym samouczku przedstawiono przykład każdego z typów analizy dwuwymiarowej przy użyciu następującego zestawu danych, który zawiera informacje o dwóch zmiennych: (1) godzinach spędzonych na nauce i (2) wynikach egzaminów uzyskanych przez 20 różnych uczniów:

1. Chmury punktów

Wykres rozrzutu zapewnia wizualny sposób przeprowadzania analizy dwuwymiarowej. Pozwala nam to zwizualizować związek między dwiema zmiennymi, umieszczając wartość jednej zmiennej na osi x, a wartość drugiej zmiennej na osi y.

Na poniższym wykresie rozrzutu umieściliśmy przestudiowane godziny na osi x, a wyniki egzaminu na osi y:

Analiza dwuwymiarowa z wykresem rozrzutu

Wyraźnie widać, że istnieje pozytywny związek między tymi dwiema zmiennymi: wraz ze wzrostem liczby godzin nauki zwiększają się również wyniki egzaminów.

2. Współczynniki korelacji

Współczynnik korelacji zapewnia inny sposób przeprowadzania analizy dwuwymiarowej. Najpopularniejszym typem współczynnika korelacji jest współczynnik korelacji Pearsona , który jest miarą liniowego powiązania między dwiema zmiennymi.   Ma wartość od -1 do 1, gdzie:

  • -1 oznacza całkowicie ujemną korelację liniową pomiędzy dwiema zmiennymi
  • Wartość 0 oznacza brak liniowej korelacji pomiędzy dwiema zmiennymi
  • 1 wskazuje doskonale dodatnią korelację liniową pomiędzy dwiema zmiennymi

Ta prosta metryka daje nam dobre pojęcie o tym, jak powiązane są dwie zmienne. W praktyce często używamy wykresów rozrzutu i współczynników korelacji, aby zrozumieć związek między dwiema zmiennymi, abyśmy mogli wizualizować i określić ilościowo ich związek.

3. Prosta regresja liniowa

Trzecim sposobem przeprowadzenia analizy dwuwymiarowej jest zastosowanie prostej regresji liniowej .

Stosując tę metodę, wybieramy jedną zmienną jako zmienną objaśniającą , a drugą jako zmienną odpowiedzi . Następnie znajdujemy wiersz, który najlepiej „pasuje” do zbioru danych, i możemy go następnie wykorzystać do zrozumienia dokładnej relacji między dwiema zmiennymi.

Na przykład najlepiej dopasowany wiersz dla powyższego zbioru danych to:

Wynik egzaminu = 69,07 + 3,85*(godziny nauki)

Oznacza to, że każda dodatkowa godzina nauki wiąże się ze średnim wzrostem wyniku z egzaminu o 3,85. Dopasowując ten model regresji liniowej, możemy określić ilościowo dokładny związek między przestudiowanymi godzinami a oceną z egzaminu.

Powiązane: Jak wykonać prostą regresję liniową w programie Excel

Wniosek

Analiza dwuwymiarowa jest jednym z najczęściej stosowanych rodzajów analiz w statystyce, ponieważ często chcemy zrozumieć związek między dwiema zmiennymi.

Używając wykresów rozrzutu, współczynników korelacji i prostej regresji liniowej, możemy wizualizować i określać ilościowo związek między dwiema zmiennymi.

Często te trzy metody są stosowane łącznie w analizie w celu uzyskania pełnego obrazu związku między dwiema zmiennymi. Warto więc zapoznać się z każdą metodą.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *