R에서 열 값의 분포를 그리는 방법
다음 방법을 사용하여 R의 열 값 분포를 그릴 수 있습니다.
방법 1: 밀도 플롯을 사용하여 값의 분포를 플롯합니다.
plot(density(df$my_column))
방법 2: 히스토그램을 사용하여 값의 분포를 플롯합니다.
hist(df$my_column)
다음 예는 다음 데이터 프레임을 사용하여 실제로 각 방법을 사용하는 방법을 보여줍니다.
#create data frame df = data. frame (team=rep(c(' A ', ' B '), each= 10 ), points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17)) #view data frame df team points 1 to 3 2 to 3 3 to 4 4 to 5 5 to 4 6 to 7 7 to 7 8 to 7 9 to 10 10 to 11 11 B 8 12 B 7 13 B 8 14 B 9 15 B 12 16 B 12 17 B 12 18 B 14 19 B 15 20 B 17
예 1: 밀도 플롯을 사용하여 값 분포 플롯
다음 코드는 밀도 플롯을 사용하여 포인트 열의 값 분포를 플롯하는 방법을 보여줍니다.
#plot distribution of values in points column
plot(density(df$points))
이 구문은 변수 값의 분포를 요약하는 부드러운 곡선을 생성합니다.
원하는 경우 밀도 플롯의 제목, 축 레이블 및 선 색상을 변경할 수도 있습니다.
#plot distribution of values in points column plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')
예 2: 히스토그램을 사용하여 값 분포 플롯
다음 코드는 히스토그램을 사용하여 포인트 열의 값 분포를 그리는 방법을 보여줍니다.
#plot distribution of values in points column using histogram
hist(df$points)
히스토그램은 분포 모양을 요약하는 매끄러운 선과 달리 막대를 사용하여 점 열의 값 빈도를 나타냅니다.
히스토그램에 사용된 제목, 축 레이블, 색상 및 점프 수를 변경할 수도 있습니다.
#plot distribution of values in points column using histogram hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )
참고 : 나누기 인수에 대해 선택한 값이 클수록 히스토그램에 더 많은 막대가 표시됩니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R의 히스토그램에 수직선을 추가하는 방법
R에서 커널 밀도 플롯을 만드는 방법
ggplot2에서 밀도 플롯을 오버레이하는 방법