Что такое пищевой тест? (объяснение и пример)
Тест Чоу — это статистический тест, разработанный экономистом Грегори Чоу , который используется для проверки того, равны ли коэффициенты двух разных моделей регрессии в разных наборах данных.
Тест Чоу обычно используется в области эконометрики с данными временных рядов, чтобы определить, есть ли структурный разрыв в данных в данный момент времени.
Например, рассмотрим следующую диаграмму рассеяния:
Если бы мы использовали линию регрессии для обобщения модели в данных, это могло бы выглядеть так:
И если бы мы использовали две отдельные линии регрессии для обобщения модели в данных, это могло бы выглядеть так:
Тест Чоу позволяет нам проверить, равны ли коэффициенты регрессии каждой линии регрессии.
Если тест определяет, что коэффициенты между линиями регрессии не равны, это означает, что имеются значительные доказательства структурного разрыва в данных. Другими словами, тенденция данных сильно различается до и после этой точки структурного перелома.
Когда использовать тест Чоу
Следующие примеры иллюстрируют ситуации, в которых может потребоваться выполнить тест Чоу:
1. Определите, меняются ли цены на акции с разной скоростью до и после выборов.
2. Определите, меняются ли цены на жилье до и после изменения процентной ставки.
3. Определить, различается ли средняя прибыль государственных предприятий до и после принятия нового налогового закона.
В каждой ситуации мы могли бы использовать тест Чоу, чтобы определить, есть ли в данных в любой момент времени точка структурного разрыва.
Шаги по проведению теста на чау
Мы можем использовать следующие шаги для выполнения теста Чоу.
Шаг 1: Определите нулевую и альтернативную гипотезы.
Предположим, мы подгоняем следующую модель регрессии ко всему нашему набору данных:
- y t = a + bx 1t + cx t2 + ε
Далее предположим, что мы разделяем наши данные на две группы на основе структурной точки разрыва и подгоняем к каждой группе следующие модели регрессии:
- y t = a 1 + b 1 x 1t + c 1 x t2 + ε
- y t = а 2 + b 2 x 1t + c 2 x t2 + ε
Для теста Чоу мы бы использовали следующие нулевые и альтернативные гипотезы:
- Нуль (H 0 ): a 1 = a 2 , b 1 = b 2 и c 1 = c 2
- Альтернатива ( HA ): По крайней мере одно из сравнений в Null не равно.
Если мы отвергнем нулевую гипотезу, у нас будет достаточно доказательств, чтобы сказать, что в данных есть структурная точка разрыва и что две линии регрессии могут соответствовать данным лучше, чем одна.
Если нам не удастся отвергнуть нулевую гипотезу, у нас не будет достаточно доказательств, чтобы сказать, что в данных есть структурный перелом. В этом случае мы говорим, что линии регрессии можно «объединить» в одну линию регрессии, которая достаточно хорошо отражает структуру данных.
Шаг 2: Рассчитайте статистику теста.
Если мы определим следующие понятия:
- S T : Сумма квадратов остатков общих данных.
- S 1 , S 2 : сумма квадратов остатков каждой группы
- N 1 , N 2 : Количество наблюдений в каждой группе.
- k: количество параметров
Тогда мы можем сказать, что статистика теста Чоу:
Статистика теста Чоу = [(S T – (S 1 +S 2 ))/k] / [(S 1 +S 2 )/ (N 1 +N 2 -2k)]
Эта тестовая статистика соответствует распределению F с k и N 1 +N 2 -2k степеней свободы.
Шаг 3: Отклонить или не отвергать нулевую гипотезу.
Если значение p, связанное с этой тестовой статистикой, ниже определенного уровня значимости , мы можем отвергнуть нулевую гипотезу и сделать вывод, что в данных имеется структурный перелом.
К счастью, большинство статистических программ способны выполнять тест Чоу, поэтому вам, вероятно, никогда не придется выполнять тест вручную.
Пример выполнения теста Чоу
Обратитесь к этому руководству , чтобы увидеть пошаговый пример выполнения теста Чоу для заданного набора данных в R.
Заметки по тестам Чоу
Вот некоторые примечания, которые следует учитывать при тесте Чоу:
1. Тест предполагает, что остатки регрессионных моделей независимо и одинаково распределяются от нормального распределения с неизвестной дисперсией.
2. Тест Чоу следует использовать только в том случае, если структурный разрыв, который вы хотите проверить, произошел в известное время. Другими словами, тест не следует использовать повторно для определения того, можно ли считать данный момент структурным переломом.