Рубрика: Гид

Панды vs лок: в чем разница?

Когда дело доходит до выбора строк и столбцов в DataFrame pandas, .loc и .at — две часто используемые функции. Вот тонкая разница между этими двумя функциями: .loc может принимать несколько строк и столбцов в качестве входных аргументов. .at может принимать только...

Панды: как использовать эквивалент np.where()

Вы можете использовать функцию NumPy Where() для быстрого обновления значений массива NumPy с использованием логики if-else. Например, следующий код показывает, как обновить значения в массиве NumPy, соответствующие определенному условию: import numpy as np #create NumPy array of values x = np....

Pandas: как добавить промежуточные итоги в сводную таблицу

Часто вам может потребоваться добавить промежуточные итоги в сводную таблицу Pandas. К счастью, это легко сделать, используя встроенные функции pandas. В следующем примере показано, как это сделать. Пример: добавление промежуточных итогов в сводную таблицу Pandas Предположим, у нас есть следующий DataFrame...

Pandas: как создать сводную таблицу с суммой значений

Вы можете использовать следующий базовый синтаксис для создания сводной таблицы в pandas, которая отображает сумму значений в определенных столбцах: p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' sum ') В следующем примере показано, как использовать этот...

Как исправить: valueerror: невозможно выполнить маскирование с помощью нелогического массива, содержащего значения na/nan.

Ошибка, с которой вы можете столкнуться при использовании панд: ValueError : Cannot mask with non-boolean array containing NA / NaN values Эта ошибка обычно возникает, когда вы пытаетесь найти строки в DataFrame pandas, содержащие определенную строку, но столбец, который вы ищете,...

Как исправить ошибку: «данные» должны быть фреймом данных или другим объектом, управляемым с помощью «fortify()», а не числовым вектором.

Ошибка, с которой вы можете столкнуться в R: Error: `data` must be a data frame, or other object coercible by `fortify()`, not a digital vector Эта ошибка возникает, когда вы пытаетесь использовать ggplot2 для построения переменных в фрейме данных, но в...

Как заменить несколько значений во фрейме данных с помощью dplyr

Вы можете использовать следующий базовый синтаксис для замены нескольких значений во фрейме данных в R с помощью функций пакета dplyr : library (dplyr) df %>% mutate(var1 = recode(var1, ' oldvalue1 ' = ' newvalue1 ', ' oldvalue2 ' = ' newvalue2...

Как заменить строку в столбце с помощью dplyr

Вы можете использовать следующие методы для замены строки в определенном столбце фрейма данных с помощью функций пакета dplyr : Способ 1. Замените строку новой строкой. library (dplyr) library (stringr) df %>% mutate(across(' column_name ', str_replace, ' old_value ', ' new_value ')) Способ 2....

Как использовать функциюthrough() в dplyr (3 примера)

Вы можете использовать функциюthrough () из пакета dplyr в R, чтобы применить преобразование к нескольким столбцам. Существует бесчисленное множество способов использования этой функции, но следующие методы иллюстрируют несколько распространенных способов использования: Способ 1: применить функцию к нескольким столбцам #multiply values in...

Как суммировать по нескольким столбцам с помощью dplyr

Вы можете использовать следующие методы для суммирования значений нескольких столбцов во фрейме данных с помощью dplyr: Метод 1: суммирование по всем столбцам df %>% mutate(sum = rowSums(., na. rm = TRUE )) Метод 2: суммирование по всем числовым столбцам df %>%...