R에서 분할표를 만드는 방법


분할표 (“교차 분석표”라고도 함)는 두 범주형 변수 간의 관계를 요약하는 표 유형입니다.

다행스럽게도 피벗 테이블 기능을 사용하여 R에서 변수에 대한 분할표를 만드는 것은 쉽습니다. 이 튜토리얼에서는 이를 수행하는 방법의 예를 보여줍니다.

예: R의 분할표

구매한 제품 유형과 제품을 구매한 국가를 포함하여 20개의 다양한 제품 주문에 대한 정보를 표시하는 다음 데이터 세트가 있다고 가정해 보겠습니다.

 #create data
df <- data.frame(order_num = 1:20,
                 product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)),
                 country= rep (c(' A ', ' B ', ' C ', ' D '), times =5))

#view data
df

   order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

분할표를 만들려면 간단히 table() 함수를 사용하고 제품 및 국가 변수를 인수로 제공하면 됩니다.

 #create contingency table
table <- table(df$product, df$country)

#view contingency table
table

           ABCD
  Computer 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

addmargins() 함수를 사용하여 테이블에 여백을 추가할 수도 있습니다.

 #add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

            ABCD Sum
  Computer 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Sum 5 5 5 5 20

테이블을 해석하는 방법은 다음과 같습니다.

  • 오른쪽 하단에 있는 값은 주문한 총 제품 수(20개)를 나타냅니다.
  • 오른쪽 값은 행의 합계를 나타냅니다. 총 5대의 컴퓨터가 주문되었고, 6대의 라디오가 주문되었으며, 9대의 텔레비전이 주문되었습니다.
  • 표 하단의 값은 열의 합계를 나타냅니다. 총 5개의 제품이 A 국가에서 주문되었으며, 5개는 B 국가에서, 5개는 C 국가에서, 5개는 D 국가에서 주문되었습니다.
  • 표 안의 값은 국가 A에서 컴퓨터 1대, A 국가에서 라디오 1대, A 국가에서 TV 3대 등 각 국가에서 주문한 특정 제품의 수를 나타냅니다.

추가 리소스

R의 열을 평균하는 방법
R의 특정 열을 합산하는 방법
R에서 여러 열의 평균을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다