Категорія: Гід

Як перемістити елементи в масиві numpy (з прикладами)

Щоб зсунути елементи масиву NumPy, можна використати один із наведених нижче методів: Спосіб 1: Зміщення елементів (збереження всіх початкових елементів) #shift each element two positions to the right data_new = np. roll (data, 2) Спосіб 2: Зсув елементів (дозволити заміну елементів)...

Як створити категоріальну змінну з continue у r

Ви можете використовувати функцію cut() в R, щоб створити категоріальну змінну з постійної змінної. Ця функція використовує такий базовий синтаксис: df$cat_variable <- cut(df$continuous_variable, breaks=c(5, 10, 15, 20, 25), labels=c(' A ', ' B ', ' C ', ' D ')) Зауважте,...

Як використовувати gsub() у r для заміни кількох шаблонів

Функцію gsub() у R можна використовувати для заміни всіх випадків певного шаблону в рядку в R. Щоб замінити декілька моделей одночасно, ви можете використати вкладений оператор gsub() : df$col1 <- gsub(' old1 ', ' new1 ', gsub(' old2 ', ' new2...

Pandas: як видалити дублікати в кількох стовпцях

Ви можете використовувати такі методи, щоб видалити повторювані рядки в кількох стовпцях у pandas DataFrame: Спосіб 1: видаліть дублікати в усіх стовпцях df. drop_duplicates () Спосіб 2. Видаліть дублікати в певних стовпцях df. drop_duplicates ([' column1 ',' column3 ']) Наступні приклади...

Pandas: як розрахувати дельту часу в місяцях

Ви можете використовувати таку функцію, щоб обчислити дельту часу в місяцях між двома стовпцями pandas DataFrame: def month_diff(x, y): end = x. dt . to_period (' M '). view (dtype=' int64 ') start = y. dt . to_period (' M ')....

Pandas: як використовувати factorize() для кодування рядків як чисел

Функцію pandas factorize() можна використовувати для кодування рядків як числових значень. Ви можете використовувати такі методи, щоб застосувати функцію factorize() до стовпців pandas DataFrame: Спосіб 1. Розкладіть стовпець на множники df[' col1 '] = pd. factorize (df[' col '])[0] Спосіб 2....

Seaborn: як створити коробковий графік із кількома стовпцями

Ви можете використовувати наступний базовий синтаксис у Seaborn, щоб створити діаграму з кількома стовпцями для pandas DataFrame: sns. boxplot (x=' variable ', y=' value ', data=df) У наступному прикладі показано, як використовувати цей синтаксис на практиці. Приклад: Boxplot кількох стовпців за...

Pandas: як розрахувати ковзне середнє для групи

Ви можете використовувати такий базовий синтаксис, щоб обчислити групове ковзне середнє для панд: #calculate 3-period moving average of 'values' by 'group' df. groupby (' group ')[' values ']. transform ( lambda x: x.rolling (3,1) .mean ()) У наступному прикладі показано, як...

Як використовувати функцію pandas burst() (з прикладами)

Ви можете використовувати функцію pandas burst() , щоб перетворити кожен елемент вбудованого списку в DataFrame. Ця функція використовує такий базовий синтаксис: df. explode (' variable_to_explode ') У наступному прикладі показано, як використовувати цей синтаксис на практиці. Приклад: використовуйте функцію explosive() із...

Три гіпотези, сформульовані в парному t-критерії

Т-критерій для парних вибірок використовується для порівняння середніх значень двох вибірок, коли кожне спостереження в одній вибірці можна пов’язати зі спостереженням в іншій вибірці. Цей тип перевірки робить такі припущення щодо даних: 1. Незалежність: кожне спостереження має бути незалежним від будь-якого...