Jak obliczyć r-kwadrat w arkuszach google
R-kwadrat , często zapisywany jako r2 , jest miarą tego, jak dobrze model regresji liniowej pasuje do zbioru danych.
Z technicznego punktu widzenia jest to część wariancji zmiennej odpowiedzi, którą można wyjaśnić za pomocą zmiennej predykcyjnej.
Wartość r 2 może wynosić od 0 do 1:
- Wartość 0 wskazuje, że zmienna odpowiedzi nie może być w ogóle wyjaśniona przez zmienną predykcyjną.
- Wartość 1 wskazuje, że zmienna odpowiedzi może być doskonale i bezbłędnie wyjaśniona przez zmienną predykcyjną.
Poniższy przykład pokazuje, jak obliczyć R do kwadratu dla dwóch zmiennych w Arkuszach Google.
Przykład: obliczanie R-kwadratu w Arkuszach Google
Załóżmy, że mamy następujące dane dotyczące liczby przepracowanych godzin i uzyskanych wyników egzaminów dla 20 uczniów:
Załóżmy teraz, że chcemy dopasować prosty model regresji liniowej , używając „godzin” jako zmiennej predykcyjnej i „wyniku” jako zmiennej odpowiedzi.
Aby znaleźć R kwadrat tego modelu, możemy użyć funkcji RSQ() Arkuszy Google, która wykorzystuje następującą składnię:
=RSQ(znane_y, znane_xs)
Złoto:
- znane_ys: wartości zmiennej odpowiedzi
- znane_xs: wartości zmiennej predykcyjnej
W naszym przykładzie możemy wpisać następującą formułę w komórce D2:
=RSQ( A2:A21 , B2:B21 )
Poniższy zrzut ekranu pokazuje, jak zastosować tę formułę w praktyce:
Wartość R-kwadrat wynosi około 0,7273 .
Oznacza to, że 72,73% różnic w wynikach egzaminów można wytłumaczyć liczbą godzin nauki.
Powiązane: Jaka jest dobra wartość R-kwadrat?
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Arkuszach Google:
Jak znaleźć najlepiej dopasowany wiersz w Arkuszach Google
Jak wykonać regresję liniową w Arkuszach Google
Jak utworzyć prognozę w Arkuszach Google (z przykładem)