Рубрика: Гид

Регрессия главных компонентов в r (шаг за шагом)

Учитывая набор переменных-предикторов p и переменную отклика, множественная линейная регрессия использует метод, известный как наименьшие квадраты, для минимизации остаточной суммы квадратов (RSS): RSS = Σ(y i – ŷ i ) 2 Золото: Σ : греческий символ, означающий сумму. y i :...

Регрессия главных компонентов в python (шаг за шагом)

Учитывая набор переменных-предикторов p и переменную отклика, множественная линейная регрессия использует метод, известный как наименьшие квадраты, для минимизации остаточной суммы квадратов (RSS): RSS = Σ(y i – ŷ i ) 2 Золото: Σ : греческий символ, означающий сумму. y i :...

Как определить диапазон дат в r (с примерами)

Самый простой способ определить фрейм данных по диапазону дат в R — использовать следующий синтаксис: df[df$date >= " some date " & df$date <= " some date ", ] В этом руководстве представлено несколько примеров практического использования этой функции. Пример 1:...

Как назначить цвета по коэффициенту в ggplot2 (с примерами)

Часто вам может потребоваться назначить цвета точкам на графике ggplot2 на основе категориальной переменной. К счастью, это легко сделать, используя следующий синтаксис: ggplot(df, aes (x=x_variable, y=y_variable, color=color_variable)) + geom_point() В этом руководстве представлено несколько примеров того, как практически использовать этот синтаксис...

Введение в метод частичных наименьших квадратов

Одна из наиболее распространенных проблем, с которыми вы можете столкнуться в машинном обучении, — это мультиколлинеарность . Это происходит, когда две или более переменных-предикторов в наборе данных сильно коррелируют. Когда это происходит, модель может хорошо соответствовать набору обучающих данных, но может...

Частичные наименьшие квадраты в r (шаг за шагом)

Одна из наиболее распространенных проблем, с которыми вы можете столкнуться в машинном обучении, — это мультиколлинеарность . Это происходит, когда две или более переменных-предикторов в наборе данных сильно коррелируют. Когда это происходит, модель может хорошо соответствовать набору обучающих данных, но может...

Частичные наименьшие квадраты в python (шаг за шагом)

Одна из наиболее распространенных проблем, с которыми вы можете столкнуться в машинном обучении, — это мультиколлинеарность . Это происходит, когда две или более переменных-предикторов в наборе данных сильно коррелируют. Когда это происходит, модель может хорошо соответствовать набору обучающих данных, но может...

Введение в полиномиальную регрессию

Когда у нас есть набор данных с переменной-предиктором и переменной отклика , мы часто используем простую линейную регрессию для количественной оценки связи между двумя переменными. Однако простая линейная регрессия (SLR) предполагает, что связь между предиктором и переменной ответа является линейной. Записанный...

Множественная линейная регрессия вручную (шаг за шагом)

Множественная линейная регрессия — это метод, который мы можем использовать для количественной оценки взаимосвязи между двумя или более переменными-предикторами и переменной отклика . В этом руководстве объясняется, как вручную выполнить множественную линейную регрессию. Пример: множественная линейная регрессия вручную Предположим, у нас...

Введение в многомерные сплайны адаптивной регрессии

Когда связь между набором переменных-предикторов и переменной ответа является линейной, мы часто можем использовать линейную регрессию , которая предполагает, что связь между данной переменной-предиктором и переменной ответа принимает форму: Y = β 0 + β 1 X + ε Но на...