R에서 상대 빈도 히스토그램을 만드는 방법
상대도수 히스토그램은 데이터 세트에 있는 값의 상대도수를 표시하는 그래프입니다.
이 튜토리얼에서는 다음 구문을 사용하는 lattice histogram() 함수를 사용하여 R에서 상대 빈도 히스토그램을 생성하는 방법을 설명합니다.
히스토그램(x, 유형)
금:
- x: 데이터
- 유형: 생성하려는 상대 빈도 히스토그램의 유형입니다. 옵션에는 백분율, 개수 및 밀도가 포함됩니다.
기본 히스토그램
먼저 lattice 패키지를 로드합니다.
library(lattice)
기본적으로 이 패키지는 y축을 따라 백분율을 표시하는 상대 빈도 히스토그램을 생성합니다.
#create data data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14) #create relative frequency histogram histogram(data)
히스토그램 편집
다음 인수를 사용하여 제목, 다른 축 레이블 및 다른 색상을 포함하도록 히스토그램을 수정할 수 있습니다.
- 메인: 제목
- xlab: x축 레이블
- ylab: y축의 라벨
- col: 히스토그램에 사용할 채우기 색상
예를 들어:
#modify the histogram
histogram(data,
main='Points per Game by Player',
xlab='Points per Game',
col='steelblue')
빈 수 변경
break 인수를 사용하여 히스토그램에 사용할 bin 수를 지정할 수 있습니다.
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=15 )
더 많은 범주를 지정할수록 데이터에 대한 더 세부적인 통찰력을 얻을 수 있습니다. 반대로, 카테고리를 적게 지정할수록 데이터가 더 많이 집계됩니다.
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=3 )
관련 항목: Sturges’ Rule을 사용하여 히스토그램에 사용할 최적의 그룹 수를 식별합니다.