Jak obliczyć skorygowany r-kwadrat w programie excel
R-kwadrat , często zapisywany jako R2 , to proporcja wariancji zmiennej odpowiedzi , którą można wyjaśnić za pomocą zmiennych predykcyjnych w modelu regresji liniowej .
Wartość R kwadrat może mieścić się w zakresie od 0 do 1. Wartość 0 oznacza, że zmiennej odpowiedzi w ogóle nie można wyjaśnić zmienną predykcyjną, natomiast wartość 1 oznacza, że zmienną odpowiedzi można wyjaśnić za pomocą zmiennej predykcyjnej. doskonale wyjaśnione bez błędu przez predyktora. zmienne.
Skorygowane R-kwadrat to zmodyfikowana wersja R-kwadrat, która dostosowuje liczbę predyktorów w modelu regresji. Oblicza się go w następujący sposób:
Skorygowany R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
Złoto:
- R 2 : R 2 modelu
- n : Liczba obserwacji
- k : Liczba zmiennych predykcyjnych
Ponieważ współczynnik R2 zawsze wzrasta w miarę dodawania predyktorów do modelu, skorygowany współczynnik R2 może służyć jako metryka informująca o przydatności modelu, skorygowany na podstawie liczby predyktorów w modelu .
W tym samouczku przedstawiono krok po kroku przykład obliczenia skorygowanego R2 dla modelu regresji w języku R.
Krok 1: Utwórz dane
Na potrzeby tego przykładu utworzymy zbiór danych zawierający następujące zmienne dla 12 różnych uczniów:
- Wynik egazminu
- Godziny spędzone na nauce
- Aktualna klasa
Krok 2: Dopasuj model regresji
Następnie dopasujemy model regresji liniowej , wykorzystując wynik egzaminu jakozmienną odpowiedzi oraz godziny nauki i aktualną ocenę jako zmienne predykcyjne.
Aby dopasować ten model, kliknij kartę Dane na górnej wstążce, a następnie kliknij opcję Analiza danych :
Jeśli ta opcja nie jest dostępna, należy najpierw załadować pakiet Data Analysis ToolPak .
W wyświetlonym oknie wybierz Regresja . W nowym oknie, które się pojawi, podaj następujące informacje:
Po kliknięciu OK pojawią się dane wyjściowe modelu regresji:
Krok 3: Zinterpretuj skorygowany R-kwadrat
Skorygowany R-kwadrat modelu regresji to liczba obok skorygowanego R-kwadrat :
Skorygowany współczynnik R-kwadrat dla tego modelu wynosi 0,946019 .
Ta wartość jest niezwykle wysoka, co wskazuje, że zmienne predykcyjne Godziny nauki i Aktualna ocena dobrze radzą sobie z przewidywaniem wyniku egzaminu .
Dodatkowe zasoby
Jaka jest dobra wartość R-kwadrat?
Jak obliczyć skorygowany R-kwadrat w R
Jak obliczyć skorygowany R-kwadrat w Pythonie