Як виконати тест чоу в r
Тест Чоу використовується, щоб перевірити, чи рівні коефіцієнти двох різних регресійних моделей на різних наборах даних.
Цей тест зазвичай використовується в галузі економетрики з даними часових рядів, щоб визначити, чи існує структурний розрив у даних у певний момент часу.
Цей підручник надає покроковий приклад того, як виконати тест Чоу в R.
Крок 1: Створіть дані
Спочатку ми створимо фейкові дані:
#create data data <- data.frame(x = c(1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 7, 8, 8, 9, 10, 10, 11, 12, 12, 13, 14, 15, 15, 16, 17, 18, 18, 19, 20, 20), y = c(3, 5, 6, 10, 13, 15, 17, 14, 20, 23, 25, 27, 30, 30, 31, 33, 32, 32, 30, 32, 34, 34, 37, 35, 34, 36, 34, 37, 38, 36)) #view first six rows of data head(data) xy 1 1 3 2 1 5 3 2 6 4 3 10 5 4 13 6 4 15
Крок 2: Візуалізуйте дані
Далі ми створимо просту діаграму розсіювання для візуалізації даних:
#load ggplot2 visualization package library (ggplot2) #create scatterplot ggplot(data, aes (x = x, y = y)) + geom_point(col=' steelblue ', size= 3 )
З діаграми розсіювання ми бачимо, що шаблон у даних змінюється при x = 10. Таким чином, ми можемо виконати тест Чоу, щоб визначити, чи існує структурна точка зламу в даних при x = 10.
Крок 3: Виконайте тест чау
Ми можемо використовувати функцію sctest з пакету strucchange для виконання тесту Chow:
#load strucchange package library (strucchange) #perform Chow test sctest(data$y ~ data$x, type = " Chow ", point = 10 ) Chow test data: data$y ~ data$x F = 110.14, p-value = 2.023e-13
З результатів тесту ми бачимо:
- Статистика F-тесту : 110,14
- р-значення: <.0000
Оскільки p-значення менше 0,05, ми можемо відхилити нульову гіпотезу тесту. Це означає, що ми маємо достатньо доказів, щоб стверджувати, що в даних присутній структурний розрив.
Іншими словами, дві лінії регресії можуть більш ефективно вписати модель у дані, ніж одна лінія регресії.