Ggplot2에서 점을 지터링하는 방법(예제 포함)


산점도를 생성할 때 점을 움직여 겹치는 점을 더 쉽게 볼 수 있도록 하면 도움이 될 수 있습니다.

ggplot2에서 점을 지터링하는 가장 쉬운 방법은 다음 기본 구문을 사용하는 geom_jitter() 를 사용하는 것입니다.

 ggplot(df, aes(x=x, y=y)) + 
  geom_jitter()

다음 예는 R의 다음 데이터 프레임에서 실제로 geom_jitter() 함수를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (x=c(4, 4, 4, 4, 6, 6, 6, 6, 8, 8, 8, 8),
                 y=c(3, 3, 3, 3, 7, 7, 7, 7, 9, 9, 9, 9))

#view data frame
df

   xy
1 4 3
2 4 3
3 4 3
4 4 3
5 6 7
6 6 7
7 6 7
8 6 7
9 8 9
10 8 9
11 8 9
12 8 9

예 1: 지터 없는 포인트 클라우드 생성

다음 코드는 지터를 사용하지 않고 ggplot2에서 산점도를 생성하는 방법을 보여줍니다.

 library (ggplot2)

#create scatterplot
ggplot(df, aes(x=x, y=y)) + 
  geom_point() 

원본 데이터베이스에는 12개의 관측치가 포함되어 있지만 그 중 여러 관측치가 동일한 x 및 y 값을 가지므로 산점도에는 3개의 관측치만 있는 것으로 나타납니다.

예 2: 기본 지터를 사용하여 포인트 클라우드 생성

다음 코드는 geom_jitter() 의 기본 설정을 사용하여 ggplot2에서 산점도를 생성하는 방법을 보여줍니다.

 library (ggplot2)

#create scatter plot with jittered points
ggplot(df, aes(x=x, y=y)) + 
  geom_jitter() 

ggplot2 지터

geom_jitter()를 사용하여 각 점의 너비와 높이 모두에 임의의 노이즈를 추가했기 때문에 이제 12개의 관측값 각각이 점 구름에 표시됩니다.

예 3: 사용자 정의 지터를 사용하여 포인트 클라우드 생성

다음 코드는 geom_jitter()너비높이 인수에 대한 사용자 정의 값을 사용하여 ggplot2에서 산점도를 생성하는 방법을 보여줍니다.

 library (ggplot2)

#create scatter plot with jittered points
ggplot(df, aes(x=x, y=y)) + 
  geom_jitter(width= 0.2 , height= 0.2 ) 

점은 불안정했지만 이전 예보다 분산이 훨씬 적습니다.

geom_jitter() 에서 너비높이 인수에 사용하는 값이 작을수록 점이 원래 위치에서 멀어집니다.

원하는 대로 점이 흔들리도록 너비높이 인수를 자유롭게 사용해 보세요.

추가 리소스

다음 튜토리얼에서는 ggplot2에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

ggplot2에서 점 모양을 변경하는 방법
ggplot2에서 범례 제목을 변경하는 방법
ggplot2에서 축 레이블을 회전하는 방법
R에서 수정하는 방법: “ggplot” 함수를 찾을 수 없습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다