Гомоскедастичность
В этой статье объясняется, что такое гомоскедастичность в статистике. Итак, вы найдете определение гомоскедастичности, каковы причины отсутствия гомоскедастичности в регрессионной модели и многое другое, как это исправить.
Что такое гомоскедастичность?
Гомоскедастичность — это характеристика регрессионной модели, ошибки объясняющих переменных которой имеют постоянную дисперсию. То есть, когда дисперсия ошибок регрессионной модели постоянна, указанная модель демонстрирует гомоскедастичность и, следовательно, является гомоскедастической моделью.
Помните, что ошибка (или остаток) определяется как разница между реальным значением и значением, оцененным с помощью регрессионной модели.
При запуске модели регрессии мы получим значение, отличное от предыдущего выражения для каждого наблюдения. Таким образом, гомоскедастическая статистическая модель — это модель, в которой дисперсия рассчитанных ошибок постоянна на протяжении всех наблюдений.

Важно, чтобы регрессионная модель демонстрировала гомоскедастичность; по сути, это одно из предыдущих предположений регрессионных моделей. Если остатки не гомоскедастичны, лучше переделать модель другим способом, чтобы получить гомоскедастичность. В противном случае оценка коэффициентов регрессии , скорее всего, будет ошибочной, а также возникнут ошибки при проверке гипотез из-за принятия нулевых гипотез, которые на самом деле следует отвергнуть.
Причины отсутствия гомоскедастичности
Наиболее распространенными причинами отсутствия гомоскедастичности модели являются:
- Когда диапазон данных очень широк по сравнению со средним. Если в одной и той же статистической выборке присутствуют очень большие значения и очень маленькие значения, вполне вероятно, что полученная регрессионная модель не является гомоскедастической.
- Исключение переменных в регрессионной модели также приводит к отсутствию гомоскедастичности. Логично, что если соответствующая переменная не включена в модель, ее изменение будет включено в остатки и не обязательно будет зафиксировано.
- Изменение структуры может привести к плохому согласованию модели с набором данных, и, следовательно, дисперсия остатков не будет постоянной.
- Когда некоторые переменные имеют гораздо большие значения, чем другие объясняющие переменные, модель может не обладать гомоскедастичностью. В этом случае переменные могут быть релятивизированы для решения проблемы.
Однако есть случаи, которые по своей сути трудно представить как гомоскедастичность. Например, если мы смоделируем доход человека с его расходами на еду, у более богатых людей будет гораздо большая вариативность в своих расходах на еду, чем у более бедных людей. Потому что богатый человек иногда ест в дорогих ресторанах, а иногда в дешевых, в отличие от бедного человека, который всегда ест в дешевых ресторанах. Поэтому в регрессионной модели трудно добиться гомоскедастичности.
Исправление данных для достижения гомоскедастичности
Если полученная регрессионная модель не является гомоскедастической, для достижения гомоскедастичности можно попытаться внести следующие поправки:
- Вычислите натуральный логарифм независимой переменной. Обычно это полезно, когда на графике увеличивается дисперсия остатков.
- В зависимости от остаточного графика более практичным может оказаться другой тип преобразования независимой переменной. Например, если график имеет форму параболы, мы можем вычислить квадрат независимой переменной и добавить эту переменную в модель.
- В модели также можно использовать другие переменные; удалив или добавив переменную, можно изменить дисперсию остатков.
- Вместо использования критерия наименьших квадратов можно использовать взвешенный критерий наименьших квадратов.
Гомоскедастичность и гетероскедастичность
Наконец, мы увидим, в чем разница между гомоскедастичностью и гетероскедастичностью, поскольку это две важные статистические концепции регрессионных моделей.
Гетероскедастичность — это статистическая характеристика, которая подразумевает, что остатки регрессионной модели не имеют постоянной дисперсии, поэтому изменчивость ошибок не одинакова на всем графике.
Разница между гомоскедастичностью и гетероскедастичностью заключается в постоянстве дисперсии ошибки. Гомоскедастичность подразумевает, что дисперсия ошибок постоянна, тогда как гетероскедастичность подразумевает, что дисперсия ошибок не является постоянной.