Часто вам может потребоваться объединить два кадра данных pandas по нескольким столбцам. К счастью, это легко сделать с помощью функции pandas merge() , которая использует следующий синтаксис: p.d. merge (df1, df2, left_on=['col1','col2'], right_on = ['col1','col2']) В этом руководстве объясняется, как использовать...
Часто вам может потребоваться найти все уникальные значения в нескольких столбцах в DataFrame pandas. К счастью, это легко сделать, используя функцию pandas unique() в сочетании с функцией ravel() : unique() : возвращает уникальные значения в порядке появления. ravel(): возвращает серию сглаженных...
Часто вам может потребоваться подсчитать количество пропущенных значений в DataFrame pandas. В этом руководстве показано несколько примеров того, как подсчитать пропущенные значения, используя следующий DataFrame: import pandas as pd import numpy as np #create DataFrame with some missing values df =...
Часто вам может потребоваться преобразовать дату/время в дату в пандах. К счастью, это легко сделать с помощью функции .dt.date , которая использует следующий синтаксис: df[' date_column '] = pd. to_datetime (df[' datetime_column ']). dt . date Пример: Datetime to date в...
Часто вам может потребоваться получить номера строк в DataFrame pandas, которые содержат определенное значение. К счастью, это легко сделать с помощью функции .index . В этом уроке показано несколько примеров практического использования этой функции. Пример 1. Получите номера строк, соответствующие определенному...
Часто вам может потребоваться выбрать строки в DataFrame pandas, где определенное значение отображается в одном из столбцов. К счастью, это легко сделать с помощью функции .any pandas. В этом руководстве объясняется несколько примеров практического использования этой функции. Пример 1. Найдите значение...
Часто вам может потребоваться отсортировать DataFrame pandas на основе столбца, содержащего даты. К счастью, это легко сделать с помощью функции sort_values() . В этом уроке показано несколько примеров практического использования этой функции. Пример 1. Сортировка по столбцу даты Предположим, у нас...
Симметричная средняя абсолютная процентная ошибка (SMAPE) используется для измерения точности прогнозирования моделей. Он рассчитывается следующим образом: SMAPE = (1/n) * Σ(|прогноз – факт| / ((|факт| + |прогноз|)/2) * 100 Золото: Σ – символ, означающий «сумма». n – размер выборки реальный –...
Квадратичная регрессия — это тип регрессии, который мы можем использовать для количественной оценки связи между переменной-предиктором и переменной ответа, когда истинные отношения являются квадратичными, что может выглядеть на графике как буква «U» или перевернутая буква «U». То есть, когда переменная-предиктор увеличивается,...
Часто вам может потребоваться сгруппировать и агрегировать несколько столбцов DataFrame pandas. К счастью, это легко сделать с помощью функций pandas .groupby() и .agg() . В этом руководстве объясняется несколько примеров практического использования этих функций. Пример 1. Сгруппируйте по двум столбцам и...