A: 히스토그램의 빈 수를 변경하는 방법


R에서 히스토그램을 만들 때 Sturges의 규칙 이라는 공식을 사용하여 사용할 최적의 그룹 수를 결정합니다.

그러나 다음 구문을 사용하여 이 수식을 재정의하고 히스토그램에 사용할 정확한 그룹 수를 지정할 수 있습니다.

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

히스토그램에 사용되는 그룹 수는 length.out 인수에 지정된 수보다 하나 적습니다.

다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.

예 1: 기본 히스토그램 생성

다음 코드는 Bin 수를 지정하지 않고 R에서 기본 히스토그램을 생성하는 방법을 보여줍니다.

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

Sturges의 규칙을 사용하여 R은 히스토그램에 총 8개의 그룹을 사용하기로 결정했습니다.

예 2: 히스토그램에 사용할 Bin 수 지정

다음 코드는 동일한 데이터 벡터에 대한 히스토그램을 만들고 정확히 6개의 그룹을 사용하는 방법을 보여줍니다.

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

특정 개수의 빈 선택 시 주의사항

히스토그램에 사용되는 그룹 수는 데이터 세트를 해석하는 방법에 큰 영향을 미칩니다.

너무 적은 수의 그룹을 사용하면 데이터의 실제 기본 패턴이 숨겨질 수 있습니다.

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

반대로, 그룹을 너무 많이 사용하면 데이터세트의 노이즈를 간단히 시각화할 수 있습니다.

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

일반적으로 R에서 사용되는 기본 Sturges 규칙은 최적의 그룹 수를 가진 히스토그램을 생성하는 경향이 있습니다.

여기에 제공된 코드를 사용하여 정확한 수의 빈이 포함된 히스토그램을 생성할 수 있지만 너무 많거나 너무 적은 빈을 선택하지 않도록 주의하세요.

추가 리소스

다음 튜토리얼에서는 R에서 히스토그램을 사용하여 다른 일반적인 기능을 수행하는 방법을 설명합니다.

R에서 여러 히스토그램을 그리는 방법
R에서 두 변수의 히스토그램을 만드는 방법
R에서 상대 빈도 히스토그램을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다