Одной из наиболее часто используемых метрик для измерения точности прогнозирования модели является MSE , что означает среднеквадратическую ошибку . Он рассчитывается следующим образом: MSE = (1/n) * Σ(факт – прогноз) 2 Золото: Σ – причудливый символ, означающий «сумма». n – размер...
Пятизначное резюме — это способ суммирования набора данных с использованием следующих пяти значений: Минимум Первый квартиль Медиана Третий квартиль Максимум Сводка из пяти цифр полезна, поскольку она дает краткую информацию о распределении данных следующим образом: Он сообщает нам, где находится медианное...
Коррекция непрерывности применяется, когда вы хотите использовать непрерывное распределение для аппроксимации дискретного распределения. Обычно он используется, когда вы хотите использовать нормальное распределение для аппроксимации биномиального распределения . Напомним, что биномиальное распределение говорит нам о вероятности достижения успеха x в n испытаниях,...
Поправка на непрерывность используется, когда вы хотите использовать нормальное распределение для аппроксимации биномиального распределения. Этот калькулятор позволяет применять поправку на непрерывность к нормальному распределению, чтобы найти приблизительные вероятности для биномиального распределения. Просто введите ниже соответствующие значения для данного биномиального распределения, а...
Экспоненциальное сглаживание — это метод «сглаживания» данных временных рядов, который часто используется для краткосрочного прогнозирования. Основная идея заключается в том, что данные временных рядов часто связаны со «случайным шумом», приводящим к пикам и спадам в данных, но, применяя экспоненциальное сглаживание, мы...
В статистике вероятность относится к шансам наступления события. Он рассчитывается следующим образом: ВЕРОЯТНОСТЬ: P(событие) = (# желаемых результатов) / (# возможных результатов) Например, предположим, что у нас в мешке четыре красных и один зеленый шар. Если вы закроете глаза и наугад...
Таблица распределения частот — это таблица, в которой отображаются частоты различных классов данных. Например, следующая таблица распределения частот показывает частоту для пяти различных классов: Сорт Частота 1 – 10 20 11 – 20 21 21 – 30 16 31 – 40...
Оценка Брайера — это показатель, который мы используем в статистике для измерения точности вероятностных прогнозов. Обычно он используется, когда результат прогноза является двоичным: результат либо наступает, либо не наступает. Например, предположим, что в прогнозе погоды говорится, что вероятность дождя составляет 90%,...
Взвешенное скользящее среднее — это метод, который можно использовать для сглаживания данных временных рядов, чтобы уменьшить «шум» в данных и упростить выявление закономерностей и тенденций. Идея взвешенного скользящего среднего состоит в том, чтобы взять среднее значение ряда предыдущих периодов, чтобы получить...
U-критерий Манна-Уитни (иногда называемый критерием суммы рангов Уилкоксона) используется для сравнения различий между двумя независимыми выборками, когда распределения выборки не имеют нормального распределения и размеры выборки малы (n < 30). Он считается непараметрическим эквивалентом независимого двухвыборочного t-критерия . В этом руководстве...