Гид - Statorials

Как масштабировать только числовые столбцы в r (с примером)

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующий синтаксис из пакета dplyr для масштабирования только числовых столбцов фрейма данных в R: library (dplyr) df %>% mutate(across(where(is. numeric ), scale)) В следующем примере показано, как использовать эту функцию на практике. Пример. Масштабируйте только числовые столбцы с...

[Продолжить чтение...]

Как выбрать столбцы по имени в pandas (3 примера)

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующие методы для выбора столбцов по имени в DataFrame pandas: Способ 1: выберите столбец по имени df. loc [:, ' column1 '] Способ 2: выберите несколько столбцов по имени df. loc [:,[' column1 ',' column3 ',' column4 ']]...

[Продолжить чтение...]

Как выполнить анти-соединение в pandas

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Антиобъединение позволяет вернуть все строки в одном наборе данных, которые не имеют совпадающих значений в другом наборе данных. Вы можете использовать следующий синтаксис для выполнения анти-соединения между двумя кадрами данных pandas: outer = df1. merge (df2, how=' outer ', indicator= True...

[Продолжить чтение...]

Как выбрать только числовые столбцы в pandas

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующий базовый синтаксис для выбора только числовых столбцов в DataFrame pandas: import pandas as pd import numpy as np df. select_dtypes (include= np.number ) В следующем примере показано, как использовать эту функцию на практике. Пример: выберите только числовые...

[Продолжить чтение...]

Как установить первую строку в качестве заголовка в pandas

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующий базовый синтаксис, чтобы установить первую строку DataFrame pandas в качестве заголовка: df. columns = df. iloc [0] df = df[1:] В следующем примере показано, как использовать этот синтаксис на практике. Пример: установить первую строку в качестве заголовка...

[Продолжить чтение...]

Как создать легенду в ggplot2 из нескольких строк

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующий синтаксис для создания легенды в ggplot2 из нескольких строк: ggplot(df, aes(x=x_var, y=y_var, color=group_var)) + geom_point() + guides(color=guide_legend(nrow= 2 , byrow= TRUE )) Значение аргумента nrow указывает количество строк, используемых в легенде. В следующем примере показано, как использовать...

[Продолжить чтение...]

Как изменить расстояние между элементами легенды в ggplot2

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующие методы, чтобы изменить расстояние между элементами легенды в ggplot2: Способ 1: изменить горизонтальный интервал p+ theme(legend. spacing . x = unit(1, ' cm ')) Способ 2: изменить вертикальный интервал p+ theme(legend. spacing . y = unit(1, '...

[Продолжить чтение...]

Как извлечь значения p из линейной регрессии в статистических моделях

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующие методы для извлечения значений p для коэффициентов в модели линейной регрессии с использованием модуля statsmodels в Python: #extract p-values for all predictor variables for x in range(0, 3): print ( model.pvalues [x]) #extract p-value for specific predictor...

[Продолжить чтение...]

Как преобразовать timedelta в int в pandas (с примерами)

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующие методы для преобразования столбца timedelta в целочисленный столбец в DataFrame pandas: Метод 1: преобразовать дельту времени в целое число (дни) df[' days '] = df[' timedelta_column ']. dt . days Метод 2: преобразовать дельту времени в целое...

[Продолжить чтение...]

Pandas: как удалить дубликаты, сохранив строку с максимальным значением

К бенджамин андерсон 17 июля, 2023 Гид 0 комментариев

Вы можете использовать следующие методы для удаления дубликатов в DataFrame pandas, но сохраните строку, содержащую максимальное значение в определенном столбце: Метод 1: удалить дубликаты в столбце и сохранить строку с Максом df. sort_values (' var2 ', ascending= False ). drop_duplicates ('...

[Продолжить чтение...]

Рубрика: Гид