Рубрика: Гид

Как применить эмпирическое правило в r

Эмпирическое правило , иногда называемое правилом 68-95-99,7, гласит, что для данного набора данных с нормальным распределением: 68% значений данных находятся в пределах одного стандартного отклонения от среднего значения. 95% значений данных находятся в пределах двух стандартных отклонений от среднего значения. 99,7%...

Как рассчитать корреляцию между категориальными переменными

Мы часто используем коэффициент корреляции Пирсона для расчета корреляции между непрерывными числовыми переменными. Однако нам нужно использовать другую метрику для расчета корреляции между категориальными переменными, то есть переменными, которые имеют имена или метки, такие как: Семейное положение (холост, женат, разведен) Статус...

Как выполнить горячее кодирование в python

Горячее кодирование используется для преобразования категориальных переменных в формат, который может быть легко использован алгоритмами машинного обучения . Основная идея горячего кодирования — создание новых переменных, которые принимают значения 0 и 1 для представления исходных категориальных значений. Например, на следующем изображении...

Как создать подсюжеты в seaborn (с примерами)

Вы можете использовать следующий базовый синтаксис для создания подграфиков в библиотеке визуализации данных Seaborn на Python: #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ', y='...

Как извлечь месяц из даты в pandas (с примерами)

Вы можете использовать следующий базовый синтаксис для извлечения месяца из даты в pandas: df[' month '] = pd. DatetimeIndex (df[' date_column ']). month В следующем примере показано, как использовать эту функцию на практике. Пример: извлечь месяц из даты в Pandas Предположим,...

Как преобразовать данные в python (журнал, квадратный корень, кубический корень)

Многие статистические тесты предполагают, что наборы данных распределены нормально. Однако на практике это часто не так. Один из способов решения этой проблемы — преобразовать распределение значений в наборе данных с помощью одного из трёх преобразований: 1. Преобразование журнала: преобразуйте переменную ответа...

Как выполнить горячее кодирование в r

Горячее кодирование используется для преобразования категориальных переменных в формат, который может использоваться алгоритмами машинного обучения . Основная идея горячего кодирования заключается в создании новых переменных, которые принимают значения 0 и 1 для представления исходных категориальных значений. Например, на следующем изображении показано,...

Как рассчитать полихорическую корреляцию в r

Полихорическая корреляция используется для расчета корреляции между порядковыми переменными. Напомним, что порядковые переменные — это переменные, возможные значения которых категоричны и имеют естественный порядок. Вот несколько примеров переменных, измеряемых по порядковой шкале: Удовлетворенность : Очень недовольна, недовольна, нейтральна, удовлетворена, очень удовлетворена....

Понимание нулевой гипотезы логистической регрессии

Логистическая регрессия — это тип модели регрессии, которую мы можем использовать, чтобы понять взаимосвязь между одной или несколькими переменными-предикторами и переменной ответа , когда переменная ответа является двоичной. Если у нас есть только одна переменная-предиктор и одна переменная отклика, мы можем...

Как сообщить точные результаты теста фишера

Точный критерий Фишера используется для определения наличия значимой связи между двумя категориальными переменными. Обычно он используется в качестве альтернативы критерию независимости хи-квадрат , когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5. Сообщая точные результаты теста Фишера,...