Линейный дискриминантный анализ — это метод, который вы можете использовать, когда у вас есть набор переменных-предикторов и вы хотите классифицировать переменную ответа на два или более классов. В этом руководстве представлен пошаговый пример выполнения линейного дискриминантного анализа в Python. Шаг 1....
Когда у нас есть набор переменных-предикторов и мы хотим классифицировать переменную отклика в один из двух классов, мы обычно используем логистическую регрессию . Однако, когда переменная ответа имеет более двух возможных классов, мы обычно используем линейный дискриминантный анализ , часто называемый...
Квадратичный дискриминантный анализ — это метод, который вы можете использовать, когда у вас есть набор переменных-предикторов и вы хотите классифицировать переменную ответа на два или более класса. Он считается нелинейным эквивалентом линейного дискриминантного анализа . В этом руководстве представлен пошаговый пример...
Квадратичный дискриминантный анализ — это метод, который вы можете использовать, когда у вас есть набор переменных-предикторов и вы хотите классифицировать переменную ответа на два или более класса. Он считается нелинейным эквивалентом линейного дискриминантного анализа . В этом руководстве представлен пошаговый пример...
Исследователи часто берут образцы из популяции и используют данные выборки, чтобы сделать выводы о популяции в целом. Обычно используемым методом выборки является кластерная выборка , при которой совокупность делится на кластеры и все члены определенных кластеров выбираются для включения в выборку....
Исследователи часто берут образцы из популяции и используют данные выборки, чтобы сделать выводы о популяции в целом. Обычно используемым методом выборки является систематическая выборка , которая реализуется в виде простого двухэтапного процесса: 1. Расположите каждого члена популяции в определенном порядке. 2....
Скользящие корреляции — это корреляции между двумя временными рядами в скользящем окне. Одним из преимуществ этого типа корреляции является то, что вы можете визуализировать корреляцию между двумя временными рядами с течением времени. В этом руководстве объясняется, как рассчитать и визуализировать скользящие...
Чтобы оценить эффективность модели на наборе данных, нам необходимо измерить, насколько хорошо прогнозы, сделанные моделью, соответствуют наблюдаемым данным. Самый распространенный способ измерить это — использовать среднеквадратическую ошибку (MSE), которая рассчитывается следующим образом: MSE = (1/n)*Σ(y i – f(x i )) 2...
Чтобы оценить эффективность модели на наборе данных, нам необходимо измерить, насколько хорошо прогнозы, сделанные моделью, соответствуют наблюдаемым данным. Обычно используемый метод для этого известен как перекрестная проверка с исключением одного (LOOCV) , в котором используется следующий подход: 1. Разделите набор данных...
Энный процентиль набора данных — это значение, которое отсекает верхние n процентов значений данных, когда все значения отсортированы от наименьшего к наибольшему. Например, 90-й процентиль набора данных — это значение, которое отделяет нижние 90 % значений данных от верхних 10 %...