Категорія: Гід

Як обчислити стандартне відхилення в pandas: із прикладами

Ви можете використовувати функцію DataFrame.std() , щоб обчислити стандартне відхилення значень у pandas DataFrame. Для розрахунку стандартного відхилення на практиці можна використовувати такі методи: Спосіб 1. Обчисліть стандартне відхилення стовпця df [ ' column_name ' ] . std ( ) Спосіб...

Як застосувати емпіричне правило в r

Емпіричне правило , яке іноді називають правилом 68-95-99.7, стверджує, що для заданого набору даних із нормальним розподілом: 68% значень даних знаходяться в межах одного стандартного відхилення від середнього. 95% значень даних знаходяться в межах двох стандартних відхилень від середнього. 99,7% значень...

Як розрахувати кореляцію між категоріальними змінними

Ми часто використовуємо коефіцієнт кореляції Пірсона для обчислення кореляції між безперервними числовими змінними. Однак нам потрібно використовувати іншу метрику для обчислення кореляції між категоріальними змінними, тобто змінними, які мають імена або мітки, наприклад: Сімейний стан (незаміжня, одружена, розлучена) Статус куріння (курить,...

Як виконати однооперативне кодування в python

Одночасне кодування використовується для перетворення категоріальних змінних у формат, який легко використовуватиметься алгоритмами машинного навчання . Основна ідея одноразового кодування полягає у створенні нових змінних, які приймають значення 0 і 1 для представлення вихідних категоріальних значень. Наприклад, на наведеному нижче зображенні...

Як створити підсюжети в seaborn (з прикладами)

Ви можете використовувати наступний базовий синтаксис для створення підсхем у бібліотеці візуалізації даних Seaborn у Python: #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ', y='...

Як виділити місяць із дати в pandas (з прикладами)

Ви можете використовувати наступний базовий синтаксис, щоб витягти місяць із дати в pandas: df[' month '] = pd. DatetimeIndex (df[' date_column ']). month У наступному прикладі показано, як використовувати цю функцію на практиці. Приклад: вилучення місяця з дати в Pandas Припустімо,...

Як трансформувати дані в python (лог, квадратний корінь, кубічний корінь)

Багато статистичних тестів припускають, що набори даних розподілені нормально. Однак на практиці це часто не так. Одним із способів вирішення цієї проблеми є перетворення розподілу значень у наборі даних за допомогою одного з трьох перетворень: 1. Перетворення журналу: перетворення змінної відповіді...

Як виконати one-hot encoding у r

Одночасне кодування використовується для перетворення категоріальних змінних у формат, який можна використовувати алгоритмами машинного навчання . Основна ідея одноразового кодування полягає у створенні нових змінних, які приймають значення 0 і 1 для представлення вихідних категоріальних значень. Наприклад, на наведеному нижче зображенні...

Як розрахувати поліхорічну кореляцію в r

Поліхорична кореляція використовується для обчислення кореляції між порядковими змінними. Нагадаємо, що порядкові змінні – це змінні, можливі значення яких є категоричними і мають природний порядок. Ось кілька прикладів змінних, виміряних за порядковою шкалою: Задоволення : дуже незадоволений, незадоволений, нейтральний, задоволений, дуже...

Розуміння нульової гіпотези для логістичної регресії

Логістична регресія – це тип регресійної моделі, який ми можемо використовувати для розуміння зв’язку між однією або декількома змінними предиктора та змінною відповіді , якщо змінна відповіді двійкова. Якщо ми маємо лише одну змінну-прогностику та одну змінну відповіді, ми можемо використати...