R에서 분할표를 만드는 방법
분할표 (“교차 분석표”라고도 함)는 두 범주형 변수 간의 관계를 요약하는 표 유형입니다.
다행스럽게도 피벗 테이블 기능을 사용하여 R에서 변수에 대한 분할표를 만드는 것은 쉽습니다. 이 튜토리얼에서는 이를 수행하는 방법의 예를 보여줍니다.
예: R의 분할표
구매한 제품 유형과 제품을 구매한 국가를 포함하여 20개의 다양한 제품 주문에 대한 정보를 표시하는 다음 데이터 세트가 있다고 가정해 보겠습니다.
#create data df <- data.frame(order_num = 1:20, product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)), country= rep (c(' A ', ' B ', ' C ', ' D '), times =5)) #view data df order_num product country 1 1 TV A 2 2 TV B 3 3 TV C 4 4 TV D 5 5 TV A 6 6 TV B 7 7 TV C 8 8 TV D 9 9 TV A 10 10 Radio B 11 11 Radio C 12 12 Radio D 13 13 Radio A 14 14 Radio B 15 15 Radio C 16 16 Computer D 17 17 Computer A 18 18 Computer B 19 19 Computer C 20 20 Computer D
분할표를 만들려면 간단히 table() 함수를 사용하고 제품 및 국가 변수를 인수로 제공하면 됩니다.
#create contingency table table <- table(df$product, df$country) #view contingency table table ABCD Computer 1 1 1 2 Radio 1 2 2 1 TV 3 2 2 2
addmargins() 함수를 사용하여 테이블에 여백을 추가할 수도 있습니다.
#add margins to contingency table table_w_margins <- addmargins(table) #view contingency table table_w_margins ABCD Sum Computer 1 1 1 2 5 Radio 1 2 2 1 6 TV 3 2 2 2 9 Sum 5 5 5 5 20
테이블을 해석하는 방법은 다음과 같습니다.
- 오른쪽 하단에 있는 값은 주문한 총 제품 수(20개)를 나타냅니다.
- 오른쪽 값은 행의 합계를 나타냅니다. 총 5대의 컴퓨터가 주문되었고, 6대의 라디오가 주문되었으며, 9대의 텔레비전이 주문되었습니다.
- 표 하단의 값은 열의 합계를 나타냅니다. 총 5개의 제품이 A 국가에서 주문되었으며, 5개는 B 국가에서, 5개는 C 국가에서, 5개는 D 국가에서 주문되었습니다.
- 표 안의 값은 국가 A에서 컴퓨터 1대, A 국가에서 라디오 1대, A 국가에서 TV 3대 등 각 국가에서 주문한 특정 제품의 수를 나타냅니다.