Две функции, которые люди часто путают в R, — это grep() и grepl() . Обе функции позволяют увидеть, существует ли в строке определенный шаблон, но возвращают разные результаты: grepl() возвращает TRUE, если в строке существует шаблон. grep() возвращает вектор строковых индексов,...
Тиббл — это фрейм данных в R, имеющий усовершенствованный метод печати, который отображает только первые 10 строк фрейма данных. Это значительно упрощает работу с большими данными и не позволяет R пытаться отобразить каждую строку во фрейме данных. Например, рассмотрим следующий тиббл...
Часто вам может потребоваться вычислить относительные частоты/пропорции значений в одном или нескольких столбцах фрейма данных в R. К счастью, это легко сделать с помощью функций пакета dplyr . В этом руководстве показано, как использовать эти функции для расчета относительных частот в...
Часто вам может потребоваться найти максимальное значение каждой группы во фрейме данных в R. К счастью, это легко сделать с помощью функций пакета dplyr . В этом руководстве объясняется, как это сделать, используя следующий фрейм данных: #create data frame df <-...
Часто вам может потребоваться создать новую переменную во фрейме данных в R на основе определенных условий. К счастью, это легко сделать с помощью функций mutate() и case_when() из пакета dplyr . В этом руководстве показано несколько примеров использования этих функций со...
Межквартильный диапазон , часто называемый «IQR», — это способ измерения распределения средних 50% набора данных. Он рассчитывается как разница между первым квартилем* (25-й процентиль) и третьим квартилем (75-й процентиль) набора данных. К счастью, в Python легко вычислить межквартильный диапазон набора данных...
Часто вам может потребоваться создать два графика рядом с помощью пакета ggplot2 в R. К счастью, это легко сделать с помощью пакета patchwork . #install ggplot2 and patchwork packages install.packages(' ggplot2 ') install.packages(' patchwork ') #load the packages library(ggplot2) library(patchwork) В...
Часто вам может потребоваться установить пределы оси графика с помощью ggplot2 . Вы можете легко сделать это, используя следующие функции: xlim() : определяет нижний и верхний предел оси X. ylim(): определяет нижний и верхний предел оси Y. Обратите внимание, что оба...
Иногда вам может потребоваться удалить выбросы из коробчатых диаграмм в R. В этом руководстве объясняется, как это сделать, используя базовый R и ggplot2 . Удалите выбросы на диаграммах в Base R Предположим, у нас есть следующий набор данных: data <- c(5,...
Ящичные диаграммы полезны для визуализации пятизначного сводного набора данных, который включает в себя: Минимум Первый квартиль Медиана Третий квартиль Максимум Связанный: Нежное введение в коробочные диаграммы К счастью, в R легко создавать коробчатые диаграммы с помощью библиотеки визуализации ggplot2 . Это...