Как обработать предупреждение r: stat_bin() с использованием bins = 30


Обычное предупреждение, с которым вы можете столкнуться в R:

 `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Это предупреждение появляется, когда вы используете geom_histogram() для создания гистограммы в ggplot2 и не можете указать количество групп, которые будут использоваться в гистограмме.

Чтобы избежать этого предупреждения, вы можете использовать аргумент bins , чтобы указать количество используемых ячеек:

 ggplot(df, aes(x=my_variable)) +
  geom_histogram(bins= 10 )

В следующем примере показано, как на практике избежать этого предупреждения.

Пример: Как избежать предупреждения stat_bins(), используя bins = 30

Предположим, мы используем функцию geom_histogram() ggplot2 для создания гистограммы для переменной во фрейме данных:

 library (ggplot2)

#make this example reproducible
set. seed ( 0 )

#create data frame
df <- data. frame (my_values = rnorm( 1000 ))

#view head of data frame
head(df)

   my_values
1 1.2629543
2 -0.3262334
3 1.3297993
4 1.2724293
5 0.4146414
6 -1.5399500

#create histogram
ggplot(df, aes(x=my_values)) +
  geom_histogram(col=' black ', fill=' steelblue ')

`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Обратите внимание, что мы получаем предупреждение `stat_bin()`, используя `bins = 30`. Выберите лучшее значение с помощью `binwidth`.

Следует отметить, что это всего лишь предупреждение и гистограмма по-прежнему создается ggplot2.

Однако мы можем полностью избежать этого предупреждения, используя аргумент bins в geom_histogram() , чтобы указать количество ячеек, которые будут использоваться в гистограмме.

Например, мы можем использовать следующий код, чтобы использовать 10 ячеек для гистограммы:

 #create histogram with 10 bins
ggplot(df, aes(x=my_values)) +
  geom_histogram(col=' black ', fill=' steelblue ', bins= 10 ) 

Обратите внимание, что на этот раз мы не получаем никаких предупреждающих сообщений, а гистограмма содержит ровно 10 ячеек.

Обратите внимание: чем меньше контейнеров вы используете, тем шире будет каждый контейнер.

Например, вместо этого мы могли бы использовать 5 контейнеров:

 #create histogram with 5 bins
ggplot(df, aes(x=my_values)) +
  geom_histogram(col=' black ', fill=' steelblue ', bins= 5 ) 

Обратите внимание, что на этой гистограмме групп меньше, но они крупнее.

Не стесняйтесь использовать в своей гистограмме столько ячеек, сколько захотите.

Дополнительные ресурсы

В следующих руководствах объясняется, как устранить другие распространенные ошибки в R:

Как исправить в R: Имена не совпадают с предыдущими именами
Как исправить в R: NA, введенные принудительно
Как починить в R: подсказка за пределами
Как исправить в R: контрасты можно применять только к факторам с 2 и более уровнями

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *