Як розрахувати r-квадрат у google таблицях


R-квадрат , який часто записують як r2 , є показником того, наскільки модель лінійної регресії відповідає набору даних.

З технічної точки зору, це частка дисперсії у змінній відповіді, яку можна пояснити змінною предиктора.

Значення r 2 може коливатися від 0 до 1:

  • Значення 0 вказує на те, що змінна відповіді взагалі не може бути пояснена змінною предиктора.
  • Значення 1 вказує на те, що змінна відповіді може бути ідеально пояснена безпомилково змінною предиктора.

У наступному прикладі показано, як обчислити R у квадраті для двох змінних у Google Таблицях.

Приклад: обчислення R-квадрату в Google Таблицях

Припустимо, що ми маємо такі дані щодо кількості вивчених годин і результату іспиту, отриманого для 20 студентів:

Тепер припустімо, що ми хочемо підібрати просту модель лінійної регресії , використовуючи «години» як змінну-прогноз і «бал» як змінну відповіді.

Щоб знайти R у квадраті цієї моделі, ми можемо скористатися функцією Google Sheets RSQ() , яка використовує такий синтаксис:

=RSQ(відомі_ys, відомі_xs)

золото:

  • відомі_і: значення змінної відповіді
  • відомі_xs: значення змінної предиктора

У нашому прикладі ми можемо ввести таку формулу в клітинку D2:

 =RSQ( A2:A21 , B2:B21 )

На наступному знімку екрана показано, як використовувати цю формулу на практиці:

R у квадраті в Google Таблицях

Значення R-квадрат виявляється приблизно 0,7273 .

Це означає, що 72,73% варіації оцінок на іспитах можна пояснити кількістю вивчених годин.

За темою: що таке хороше значення R-квадрат?

Додаткові ресурси

У наведених нижче посібниках пояснюється, як виконувати інші типові завдання в Google Таблицях.

Як знайти найкращий рядок у Google Таблицях
Як виконати лінійну регресію в Google Таблицях
Як створити прогноз у Google Таблицях (з прикладом)

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *