Как создать диаграмму парето в r (шаг за шагом)
Диаграмма Парето — это тип диаграммы, которая отображает частоты различных категорий, а также совокупную частоту категорий.
В этом руководстве представлен пошаговый пример создания диаграммы Парето в R.
Шаг 1. Создайте данные
Предположим, мы проводим опрос, в котором просим 350 разных людей назвать свою любимую марку хлопьев между брендами A, B, C, D и E.
Следующий набор данных показывает общее количество голосов за каждый бренд:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
Шаг 2. Создайте диаграмму Парето
Чтобы создать диаграмму Парето для визуализации результатов этого опроса, мы можем использовать функцию pareto.chart() из пакета qcc :
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
Выходная таблица показывает нам частоту и совокупную частоту каждого бренда. Например:
- Частота бренда A: 140 | Совокупная частота: 140
- Частота брендов B: 97 | Совокупная частота A, B: 237
- Частота отметки C: 58 | Совокупная частота A, B, C: 295
И так далее.
Шаг 3. Отредактируйте диаграмму Парето (необязательно)
Следующий код показывает, как изменить заголовок диаграммы, а также используемую цветовую палитру:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
Полный список доступных цветовых палитр вы можете найти в этой шпаргалке R Color .
Дополнительные ресурсы
Как создать таблицы частот в R
Как создать гистограмму относительной частоты в R
Как рассчитать совокупные суммы в R