Категорія: Гід

Як фільтрувати рядки, що містять певний рядок, за допомогою dplyr

Часто вам може знадобитися фільтрувати рядки у кадрі даних у R, які містять певний рядок. На щастя, це легко зробити за допомогою функції filter() у пакеті dplyr і функції grepl() у Base R. Цей підручник показує кілька прикладів практичного використання цих...

Порівняння grep() і grepl() у r: у чому різниця?

Дві функції, які люди часто плутають у R, це grep() і grepl() . Обидві функції дозволяють побачити, чи існує певний шаблон у рядку, але вони повертають різні результати: grepl() повертає TRUE, якщо в рядку існує шаблон. grep() повертає вектор рядкових індексів,...

Як надрукувати всі рядки tibble мовою r

Tibble — це кадр даних у R, який має вдосконалений метод друку, який відображає лише перші 10 рядків кадру даних. Це значно полегшує роботу з великими даними та запобігає спробам R відобразити кожен рядок у кадрі даних. Наприклад, розглянемо наступну табличку...

Як обчислити відносні частоти за допомогою dplyr

Часто вам може знадобитися обчислити відносні частоти/пропорції значень в одному або кількох стовпцях кадру даних у R. На щастя, це легко зробити за допомогою функцій у пакеті dplyr . У цьому підручнику показано, як використовувати ці функції для обчислення відносних частот...

Як знайти максимальне значення для групи в r

Часто вам може знадобитися знайти максимальне значення кожної групи у кадрі даних у R. На щастя, це легко зробити за допомогою функцій у пакеті dplyr . У цьому підручнику пояснюється, як це зробити за допомогою наступного кадру даних: #create data frame...

Створіть нові змінні в r за допомогою mutate() і case_when()

Часто ви можете створити нову змінну у кадрі даних у R на основі певних умов. На щастя, це легко зробити за допомогою функцій mutate() і case_when() з пакету dplyr . Цей підручник показує кілька прикладів використання цих функцій із таким кадром...

Як обчислити інтерквартильний діапазон у python

Міжквартильний діапазон , який часто називають “IQR”, є способом вимірювання розподілу середніх 50% набору даних. Він обчислюється як різниця між першим квартилем* (25-м процентилем) і третім квартилем (75-м процентилем) набору даних. На щастя, легко обчислити інтерквартильний діапазон набору даних у Python...

Як створити діаграми поруч у ggplot2

Часто вам може знадобитися створити дві ділянки поруч за допомогою пакета ggplot2 у R. На щастя, це легко зробити за допомогою пакета patchwork . #install ggplot2 and patchwork packages install.packages(' ggplot2 ') install.packages(' patchwork ') #load the packages library(ggplot2) library(patchwork) У...

Як встановити межі осей у ggplot2

Часто вам може знадобитися встановити межі осей на діаграмі за допомогою ggplot2 . Ви можете легко зробити це за допомогою таких функцій: xlim() : визначає нижню та верхню межі осі x. ylim(): визначає нижню та верхню межі осі y. Зауважте, що...

Як видалити викиди в коробкових діаграмах у r

Іноді вам може знадобитися видалити викиди з коробкових діаграм у R. Цей підручник пояснює, як це зробити за допомогою як base R, так і ggplot2 . Видаліть викиди в коробкових діаграмах у Base R Припустимо, що ми маємо наступний набір даних:...