Як обробляти попередження r: stat_bin() з використанням bins = 30


Загальне попередження, яке ви можете зустріти в R:

 `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Це попередження з’являється, коли ви використовуєте geom_histogram() для створення гістограми в ggplot2 і не можете вказати кількість груп для використання в гістограмі.

Щоб уникнути цього попередження, ви можете використовувати аргумент bins , щоб вказати кількість бункерів для використання:

 ggplot(df, aes(x=my_variable)) +
  geom_histogram(bins= 10 )

У наступному прикладі показано, як уникнути цього попередження на практиці.

Приклад: як уникнути попередження stat_bins() за допомогою bins = 30

Припустимо, ми використовуємо функцію geom_histogram() ggplot2 для створення гістограми для змінної у кадрі даних:

 library (ggplot2)

#make this example reproducible
set. seed ( 0 )

#create data frame
df <- data. frame (my_values = rnorm( 1000 ))

#view head of data frame
head(df)

   my_values
1 1.2629543
2 -0.3262334
3 1.3297993
4 1.2724293
5 0.4146414
6 -1.5399500

#create histogram
ggplot(df, aes(x=my_values)) +
  geom_histogram(col=' black ', fill=' steelblue ')

`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Зауважте, що ми отримуємо попередження `stat_bin()`, використовуючи `bins = 30`. Виберіть краще значення за допомогою binwidth.

Слід зазначити, що це лише попередження, і гістограма все ще створюється ggplot2.

Однак ми можемо повністю уникнути цього попередження, використовуючи аргумент bins у geom_histogram() , щоб вказати кількість бінів для використання в гістограмі.

Наприклад, ми можемо використовувати такий код, щоб використовувати 10 бінів для гістограми:

 #create histogram with 10 bins
ggplot(df, aes(x=my_values)) +
  geom_histogram(col=' black ', fill=' steelblue ', bins= 10 ) 

Зауважте, що цього разу ми не отримуємо жодних попереджень, а гістограма містить рівно 10 бінів.

Зауважте, що чим менше бункерів ви використовуєте, тим ширшим буде кожен бункер.

Наприклад, замість цього ми можемо використовувати 5 бункерів:

 #create histogram with 5 bins
ggplot(df, aes(x=my_values)) +
  geom_histogram(col=' black ', fill=' steelblue ', bins= 5 ) 

Зверніть увагу, що на цій гістограмі є менше, але більші групи.

Не соромтеся використовувати скільки завгодно бінів у своїй гістограмі.

Додаткові ресурси

У наступних посібниках пояснюється, як вирішити інші поширені помилки в R:

Як виправити в R: імена не збігаються з попередніми іменами
Як виправити в R: NAs, введені примусово
Як ремонтувати в R: підказка поза межами
Як виправити в R: контрасти можна застосовувати лише до факторів із 2 або більше рівнями

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *