R에서 파레토 차트를 만드는 방법(단계별)
파레토 차트는 다양한 범주의 빈도와 해당 범주의 누적 빈도를 표시하는 차트 유형입니다.
이 튜토리얼에서는 R에서 Pareto 차트를 만드는 단계별 예를 제공합니다.
1단계: 데이터 생성
350명의 사람들에게 A, B, C, D, E 브랜드 중에서 가장 좋아하는 시리얼 브랜드를 식별하도록 요청하는 설문조사를 실시한다고 가정해 보겠습니다.
다음 데이터 세트는 각 브랜드에 대한 총 투표 수를 보여줍니다.
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
2단계: 파레토 차트 만들기
이 설문 조사 결과를 시각화하기 위해 Pareto 차트를 만들려면 qcc 패키지의 pareto.chart() 함수를 사용할 수 있습니다.
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
출력 테이블에는 각 브랜드의 빈도와 누적 빈도가 표시됩니다. 예를 들어:
- 브랜드 A 주파수: 140 | 누적 빈도: 140
- 브랜드 B 빈도: 97 | A, B의 누적 빈도: 237
- C 마크 빈도: 58 | A, B, C의 누적 빈도: 295
등등.
3단계: 파레토 차트 편집(선택 사항)
다음 코드는 차트 제목과 사용된 색상 팔레트를 수정하는 방법을 보여줍니다.
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
이 R 색상 치트 시트 에서 사용 가능한 색상 팔레트의 전체 목록을 찾을 수 있습니다.