Рубрика: Гид

Как использовать ungroup() в dplyr (с примерами)

Вы можете использовать функцию ungroup() в dplyr, чтобы разгруппировать строки после использования функции group_by() для суммирования одной переменной в группе. В следующем примере показано, как использовать эту функцию на практике. Пример: как использовать ungroup() в dplyr Предположим, у нас есть следующий...

Как построить объект svm в r (с примером)

Вы можете использовать следующий базовый синтаксис для построения объекта машины опорных векторов (SVM) в R: library (e1071) plot(svm_model, df) В этом примере df — это имя фрейма данных, а svm_model — это машина опорных векторов, подобранная с помощью функции svm() ....

Как изменить метки осей фасетов в ggplot2

Вы можете использовать функцию as_labeller() для изменения меток осей фасетов в ggplot2: ggplot(df, aes(x, y)) + geom_point() + facet_wrap(.~group, strip. position = ' left ', labeller = as_labeller(c(A=' new1 ', B=' new2 ', C=' new3 ', D=' new4 '))) + ylab(NULL)...

Scikit-learn: используйте кодирование меток из нескольких столбцов

В машинном обучении кодирование меток — это процесс преобразования значений категориальной переменной в целочисленные значения. Например, на следующем снимке экрана показано, как преобразовать каждое уникальное значение категориальной переменной Team в целочисленное значение в алфавитном порядке: Вы можете использовать следующий синтаксис для...

Как исправить: входные данные содержат nan, бесконечность или значение, слишком большое для dtype («float64»).

Распространенная ошибка, с которой вы можете столкнуться при использовании Python: ValueError: Input contains infinity or a value too large for dtype('float64'). Эта ошибка обычно возникает, когда вы пытаетесь использовать функцию из модуля scikit-learn, но DataFrame или матрица, которую вы используете в...

Как исправить: первый аргумент должен быть итерацией объектов pandas, вы передали объект типа «dataframe»;

Распространенная ошибка, с которой вы можете столкнуться при использовании Python: TypeError: first argument must be an iterable of pandas objects, you passed an object of type "DataFrame" Эта ошибка обычно возникает, когда вы пытаетесь использовать функцию concat() для добавления двух кадров...

Как выполнить регрессию ols в python (с примером)

Регрессия обычных наименьших квадратов (OLS) — это метод, который позволяет нам найти линию, которая лучше всего описывает взаимосвязь между одной или несколькими переменными-предикторами и переменной отклика . Этот метод позволяет найти следующее уравнение: ŷ = б 0 + б 1 х...

Как сгруппировать данные по времени в pandas (с примером)

Вы можете использовать следующий синтаксис для группировки данных по времени и выполнения агрегации в pandas: df. groupby ([df[' time ']. dt . hour ]). dirty . sum () В этом конкретном примере значения группируются по часам в столбец « Час» ,...

Pandas: как удалить пробелы из столбцов

Вы можете использовать следующие методы для удаления пробелов из столбцов в DataFrame pandas: Способ 1: удалить пробелы из столбца df[' my_column '] = df[' my_column ']. str . strip () Способ 2: удалить пробелы из всех строковых столбцов df = df....

Как заменить значения nan на ноль в numpy

Вы можете использовать следующий базовый синтаксис для замены значений NaN нулем в NumPy: my_array[np. isnan (my_array)] = 0 Этот синтаксис работает как с матрицами, так и с массивами. Следующие примеры показывают, как использовать этот синтаксис на практике. Пример 1. Замена значений...