O que é um teste multinomial? (definição e #038; exemplo)


Um teste multinomial é usado para determinar se uma variável categórica segue uma distribuição hipotética.

Este teste usa as seguintes hipóteses nulas e alternativas:

H 0 : Uma variável categórica segue uma distribuição hipotética.

HA : Uma variável categórica não segue a distribuição hipotética.

Se o valor p do teste estiver abaixo de um determinado nível de significância (ex. α = 0,05), então podemos rejeitar a hipótese nula e concluir que a variável não segue a distribuição hipotética.

Este teste é usado quando uma variável pode levar k resultados diferentes. Um exemplo clássico de teste multinomial é quando queremos determinar se certos dados são justos. Quando você lança um dado, a probabilidade de ele cair em cada número (1 a 6) é 1/6.

Para testar se um dado é justo, podemos lançá-lo várias vezes e ver se o número de vezes que cai em números diferentes é significativamente diferente do que esperaríamos.

Os exemplos a seguir mostram como realizar um teste multinomial usando a linguagem de programação estatística R.

Exemplo 1: Dados Justos

Suponha que queiramos determinar se um dado é justo. Para testar isso, executamos 30 vezes e registramos a frequência de cada resultado. A tabela a seguir mostra os resultados:

Exemplo de teste multinomial

O seguinte código em R pode ser usado para realizar um teste multinomial:

 library (EMT)

#specify probability of each outcome
prob <- c(1/6, 1/6, 1/6, 1/6, 1/6, 1/6)

#specify frequency of each outcome from experiment
actual <- c(4, 5, 2, 9, 5, 5)

#perform multinomial test
multinomial. test (actual, prob) 

 Exact Multinomial Test, distance measure: p

    Events pObs p.value
    324632 0 0.4306

O valor p do teste é 0,4306 . Como este valor p não é inferior a 0,05, não rejeitaremos a hipótese nula. Portanto, não temos provas suficientes para dizer que os dados são injustos.

Exemplo 2: Vendas de produtos

Suponha que o dono de uma loja suponha que um número igual de clientes comprará cada um dos quatro produtos diferentes. Para testar isso, ele registra o número de clientes que compraram cada produto em uma determinada semana. A tabela a seguir mostra os resultados:

O seguinte código em R pode ser usado para realizar um teste multinomial neste conjunto de dados:

 library (EMT)

#specify probability of each outcome
prob <- c(1/4, 1/4, 1/4, 1/4)

#specify frequency of each outcome from experiment
actual <- c(40, 20, 30, 50)

#perform multinomial test
multinomial. test (actual, prob) 

 Exact Multinomial Test, distance measure: p

    Events pObs p.value
    477191 0 0.00226

O valor p do teste é 0,00226 . Como este valor p é inferior a 0,05, rejeitaremos a hipótese nula. Portanto, temos evidências suficientes para afirmar que as vendas não são iguais para cada produto.

Exemplo 3: bolinhas de gude em um saco

Tom afirma que a probabilidade de escolher uma bola de gude vermelha, verde ou roxa de um saco é de 0,2, 0,5 e 0,3, respectivamente. Para testar isso, seu amigo Mike enfia a mão no saco e tira uma bola de gude (com reposições) 100 vezes diferentes. A tabela a seguir mostra os resultados:

O seguinte código em R pode ser usado para realizar um teste multinomial neste conjunto de dados:

 library (EMT)

#specify probability of each outcome
prob <- c(.2, .5, .3)

#specify frequency of each outcome from experiment
actual <- c(40, 20, 30, 50)

#perform multinomial test
multinomial. test (actual, prob) 

 Exact Multinomial Test, distance measure: p

    Events pObs p.value
      5151 0.0037 0.3999

O valor p do teste é 0,3999 . Como esse valor p não é inferior a 0,05, não conseguiremos rejeitar a hipótese nula. Portanto, não temos evidências suficientes para afirmar que a distribuição das bolinhas de gude no saco seja diferente daquela especificada por Tom.

Recursos adicionais

Uma introdução à distribuição multinomial
Calculadora de distribuição multinomial

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *