Рубрика: Гид

Как создать категориальную переменную из continue в r

Вы можете использовать функцию Cut() в R для создания категориальной переменной из непрерывной переменной. Эта функция использует следующий базовый синтаксис: df$cat_variable <- cut(df$continuous_variable, breaks=c(5, 10, 15, 20, 25), labels=c(' A ', ' B ', ' C ', ' D ')) Обратите...

Как использовать gsub() в r для замены нескольких шаблонов

Функцию gsub() в R можно использовать для замены всех вхождений определенного шаблона в строку в R. Чтобы заменить несколько моделей одновременно, вы можете использовать вложенный оператор gsub() : df$col1 <- gsub(' old1 ', ' new1 ', gsub(' old2 ', ' new2...

Pandas: как удалить дубликаты в нескольких столбцах

Вы можете использовать следующие методы для удаления повторяющихся строк в нескольких столбцах в DataFrame pandas: Способ 1. Удаление дубликатов во всех столбцах. df. drop_duplicates () Способ 2. Удаление дубликатов в определенных столбцах df. drop_duplicates ([' column1 ',' column3 ']) В следующих примерах...

Pandas: как рассчитать timedelta в месяцах

Вы можете использовать следующую функцию для расчета разницы во времени в месяцах между двумя столбцами DataFrame pandas: def month_diff(x, y): end = x. dt . to_period (' M '). view (dtype=' int64 ') start = y. dt . to_period (' M...

Pandas: как использовать factorize() для кодирования строк как чисел

Функцию pandas Factorize() можно использовать для кодирования строк в числовые значения. Вы можете использовать следующие методы, чтобы применить функцию Factorize() к столбцам DataFrame pandas: Способ 1: Факторинг столбца df[' col1 '] = pd. factorize (df[' col '])[0] Метод 2: Столбцы с...

Сиборн: как создать многоколоночную диаграмму

Вы можете использовать следующий базовый синтаксис в Seaborn для создания многостолбцовой диаграммы DataFrame pandas: sns. boxplot (x=' variable ', y=' value ', data=df) В следующем примере показано, как использовать этот синтаксис на практике. Пример: коробчатая диаграмма нескольких столбцов с использованием Seaborn...

Панды: как рассчитать скользящее среднее по группе

Вы можете использовать следующий базовый синтаксис для расчета группового скользящего среднего для панд: #calculate 3-period moving average of 'values' by 'group' df. groupby (' group ')[' values ']. transform ( lambda x: x.rolling (3,1) .mean ()) В следующем примере показано, как...

Как использовать функцию pandas burst() (с примерами)

Вы можете использовать функцию pandasburst() для преобразования каждого элемента встроенного списка в DataFrame. Эта функция использует следующий базовый синтаксис: df. explode (' variable_to_explode ') В следующем примере показано, как использовать этот синтаксис на практике. Пример: используйте функцию взрывного() с Pandas DataFrame....

Три гипотезы, сформулированные в парном t-тесте

T-критерий парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть связано с наблюдением в другой выборке. Этот тип теста делает следующие предположения относительно данных: 1. Независимость: каждое наблюдение должно быть независимым от любого...

8 примеров использования статистики в реальной жизни

Область статистики занимается сбором, анализом, интерпретацией и представлением данных. Изучая статистику, студенты часто спрашивают: Когда статистика действительно используется в реальной жизни? Оказывается, он используется во многих различных областях для различных применений. В этой статье мы поделимся 8 примерами использования статистики в...