Среднеквадратическая ошибка (MSE) — это распространенный способ измерения точности прогнозирования модели. Он рассчитывается следующим образом: MSE = (1/n) * Σ(факт – прогноз) 2 Золото: Σ – причудливый символ, означающий «сумма». n – размер выборки реальный – фактическое значение данных прогноз –...
«Гоколообразная кривая» — это прозвище, данное форме нормального распределения , которая имеет отчетливую форму «колокола»: В этом уроке объясняется, как создать колоколообразную кривую в Python. Как создать колоколообразную кривую в Python Следующий код показывает, как создать колоколообразную кривую с использованием библиотек...
В статистике группировка — это процесс объединения числовых значений в группы . Наиболее распространенная форма кластеризации известна как кластеризация равной ширины , при которой мы делим набор данных на k групп одинаковой ширины. Менее часто используемая форма кластеризации известна как кластеризация...
Предположим, у нас есть следующий набор данных на Python, который отображает количество продаж, совершенных определенным магазином каждый день недели в течение пяти недель: import numpy as np import pandas as pd import seaborn as sns #create a dataset np.random.seed(0) data =...
Пирамида населения — это график, показывающий распределение населения по возрасту и полу. Это полезно для понимания состава населения и тенденции его роста. В этом руководстве объясняется, как создать следующую демографическую пирамиду в Python: Возрастная пирамида в Python Предположим, у нас есть...
Индекс сходства Жаккара измеряет сходство между двумя наборами данных. Оно может находиться в диапазоне от 0 до 1. Чем выше число, тем более похожи два набора данных. Индекс сходства Жаккара рассчитывается следующим образом: Сходство Жаккара = (количество наблюдений в обоих наборах)...
Тест Макнемара используется для определения наличия статистически значимой разницы в пропорциях между парными данными. В этом руководстве объясняется, как выполнить тест Макнемара в Python. Пример: тест Макнемара на Python Допустим, исследователи хотят знать, может ли определенное маркетинговое видео изменить мнение людей...
Точный критерий Фишера используется для определения наличия значимой связи между двумя категориальными переменными. Обычно он используется в качестве альтернативы критерию независимости хи-квадрат , когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5. В этом руководстве объясняется, как...
Критерий согласия хи-квадрат используется для определения того, соответствует ли категориальная переменная гипотетическому распределению. В этом руководстве объясняется, как выполнить критерий согласия хи-квадрат в Python. Пример: критерий согласия хи-квадрат в Python Владелец магазина говорит, что в его магазин каждый день недели приходит...
Критерий независимости по хи-квадрату используется для определения того, существует ли значимая связь между двумя категориальными переменными. В этом руководстве объясняется, как выполнить тест независимости хи-квадрат в Python. Пример: тест независимости хи-квадрат в Python Предположим, мы хотим знать, связан ли пол...