Como criar uma tabela de contingência em r


Uma tabela de contingência (às vezes chamada de “tabelas cruzadas”) é um tipo de tabela que resume o relacionamento entre duas variáveis categóricas.

Felizmente, é fácil criar uma tabela de contingência para variáveis em R usando a função de tabela dinâmica. Este tutorial mostra um exemplo de como fazer isso.

Exemplo: tabela de contingência em R

Digamos que temos o seguinte conjunto de dados que exibe informações sobre 20 pedidos de produtos diferentes, incluindo o tipo de produto adquirido, bem como o país em que o produto foi adquirido:

 #create data
df <- data.frame(order_num = 1:20,
                 product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)),
                 country= rep (c(' A ', ' B ', ' C ', ' D '), times =5))

#view data
df

   order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Para criar uma tabela de contingência, podemos simplesmente usar a função table() e fornecer as variáveis produto e país como argumentos:

 #create contingency table
table <- table(df$product, df$country)

#view contingency table
table

           ABCD
  Computer 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

Também podemos usar a função addmargins() para adicionar margens à tabela:

 #add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

            ABCD Sum
  Computer 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Sum 5 5 5 5 20

Veja como interpretar a tabela:

  • O valor no canto inferior direito indica o número total de produtos encomendados: 20.
  • Os valores do lado direito mostram as somas das linhas: No total, foram encomendados 5 computadores, 6 rádios e 9 televisores.
  • Os valores na parte inferior da tabela mostram as somas das colunas: um total de 5 produtos foram encomendados no país A, 5 no país B, 5 no país C e 5 no país D.
  • Os valores dentro da tabela indicam a quantidade de produtos específicos encomendados em cada país: 1 computador do país A, 1 rádio do país A, 3 televisores do país A, etc.

Recursos adicionais

Como calcular a média das colunas em R
Como somar colunas específicas em R
Como calcular a média de múltiplas colunas em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *