Как обработать предупреждение r: stat_bin() с использованием bins = 30
Обычное предупреждение, с которым вы можете столкнуться в R:
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Это предупреждение появляется, когда вы используете geom_histogram() для создания гистограммы в ggplot2 и не можете указать количество групп, которые будут использоваться в гистограмме.
Чтобы избежать этого предупреждения, вы можете использовать аргумент bins , чтобы указать количество используемых ячеек:
ggplot(df, aes(x=my_variable)) +
geom_histogram(bins= 10 )
В следующем примере показано, как на практике избежать этого предупреждения.
Пример: Как избежать предупреждения stat_bins(), используя bins = 30
Предположим, мы используем функцию geom_histogram() ggplot2 для создания гистограммы для переменной во фрейме данных:
library (ggplot2)
#make this example reproducible
set. seed ( 0 )
#create data frame
df <- data. frame (my_values = rnorm( 1000 ))
#view head of data frame
head(df)
my_values
1 1.2629543
2 -0.3262334
3 1.3297993
4 1.2724293
5 0.4146414
6 -1.5399500
#create histogram
ggplot(df, aes(x=my_values)) +
geom_histogram(col=' black ', fill=' steelblue ')
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Обратите внимание, что мы получаем предупреждение `stat_bin()`, используя `bins = 30`. Выберите лучшее значение с помощью `binwidth`.
Следует отметить, что это всего лишь предупреждение и гистограмма по-прежнему создается ggplot2.
Однако мы можем полностью избежать этого предупреждения, используя аргумент bins в geom_histogram() , чтобы указать количество ячеек, которые будут использоваться в гистограмме.
Например, мы можем использовать следующий код, чтобы использовать 10 ячеек для гистограммы:
#create histogram with 10 bins
ggplot(df, aes(x=my_values)) +
geom_histogram(col=' black ', fill=' steelblue ', bins= 10 )
Обратите внимание, что на этот раз мы не получаем никаких предупреждающих сообщений, а гистограмма содержит ровно 10 ячеек.
Обратите внимание: чем меньше контейнеров вы используете, тем шире будет каждый контейнер.
Например, вместо этого мы могли бы использовать 5 контейнеров:
#create histogram with 5 bins
ggplot(df, aes(x=my_values)) +
geom_histogram(col=' black ', fill=' steelblue ', bins= 5 )
Обратите внимание, что на этой гистограмме групп меньше, но они крупнее.
Не стесняйтесь использовать в своей гистограмме столько ячеек, сколько захотите.
Дополнительные ресурсы
В следующих руководствах объясняется, как устранить другие распространенные ошибки в R:
Как исправить в R: Имена не совпадают с предыдущими именами
Как исправить в R: NA, введенные принудительно
Как починить в R: подсказка за пределами
Как исправить в R: контрасты можно применять только к факторам с 2 и более уровнями