Teste q de dixon: definição + exemplo
O Teste Q de Dixon , muitas vezes chamado simplesmente de Teste Q , é um teste estatístico usado para detectar valores discrepantes em um conjunto de dados.
A estatística do teste Q é:
Q = |x a – xb | /R
onde x a é o valor discrepante suspeito, x b é o ponto de dados mais próximo de x a e R é o intervalo do conjunto de dados. Na maioria dos casos, x a é o valor máximo do conjunto de dados, mas também pode ser o valor mínimo.
É importante notar que o teste Q geralmente é realizado em pequenos conjuntos de dados e assume que os dados são normalmente distribuídos. Também é importante observar que o teste Q só deve ser realizado uma vez para um determinado conjunto de dados.
Como realizar o teste Dixon Q manualmente
Suponha que temos o seguinte conjunto de dados:
1, 3, 5, 7, 8, 9, 13, 25
Podemos seguir o procedimento padrão de teste de hipótese de cinco etapas para realizar manualmente o teste Q de Dixon para determinar se o valor máximo neste conjunto de dados é um valor discrepante:
Passo 1. Estabeleça as hipóteses.
A hipótese nula (H0): O máximo não é um outlier.
A hipótese alternativa: (Ha): O máximo é um valor discrepante.
Passo 2. Determine um nível de significância a ser usado.
As escolhas comuns são 0,1, 0,05 e 0,01. Usaremos um nível de significância de 0,05 para este exemplo.
Etapa 3. Encontre a estatística de teste.
Q = |x a – xb | /R
Nesse caso, nosso valor máximo é x a = 25, nosso próximo valor mais próximo é x b = 13 e nosso intervalo é R = 25 – 1 = 24.
Assim, Q = |25 – 13| / 24 = 0,5 .
Em seguida, podemos comparar esta estatística de teste com os valores críticos do teste Q, que são mostrados abaixo para diferentes tamanhos de amostra (n) e níveis de confiança:
n 90% 95% 99%
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568
11 0,392 0,444 0,542
12 0,376 0,426 0,522
13 0,361 0,410 0,503
14 0,349 0,396 0,488
15 0,338 0,384 0,475
16 0,329 0,374 0,463
17 0,320 0,365 0,452
18 0,313 0,356 0,442
19 0,306 0,349 0,433
20 0,300 0,342 0,425
21 0,295 0,337 0,418
22 0,290 0,331 0,411
23 0,285 0,326 0,404
24 0,281 0,321 0,399
25 0,277 0,317 0,393
26 0,273 0,312 0,388
27 0,269 0,308 0,384
28 0,266 0,305 0,380
29 0,263 0,301 0,376
30 0,260 0,290 0,372
O valor crítico para uma amostra de 8 e um nível de confiança de 95% é 0,526 .
Passo 4. Rejeite ou não rejeite a hipótese nula.
Como nossa estatística de teste Q (0,5) é menor que o valor crítico (0,526), não conseguimos rejeitar a hipótese nula.
Etapa 5. Interprete os resultados.
Como não conseguimos rejeitar a hipótese nula, concluímos que o valor máximo de 25 não é um valor atípico neste conjunto de dados.
Como realizar o teste Q de Dixon em R
Para realizar o teste Q de Dixon no mesmo conjunto de dados em R, podemos usar a função dixon.test() da biblioteca de outliers , que usa a seguinte sintaxe:
dixon.test(dados, , tipo = 10, oposto = FALSO)
- dados: um vetor numérico de valores de dados
- type: O tipo de fórmula a ser usada para realizar o teste estatístico Q. Defina como 10 para usar a fórmula descrita anteriormente.
- oposto: Se FALSO, o teste determina se o valor máximo é um valor discrepante. Se for TRUE, o teste determinará se o valor mínimo é um valor discrepante. Isso é FALSO por padrão.
Nota : Encontre a documentação completa para dixon.test() aqui .
O código a seguir demonstra como realizar o teste Q de Dixon para determinar se o valor máximo no conjunto de dados é um valor discrepante.
#load the outliers library library(outliers) #create data data <- c(1, 3, 5, 7, 8, 9, 13, 25) #conduct Dixon's Q Test dixon.test(data, type = 10) # Dixon test for outliers # #data:data #Q = 0.5, p-value = 0.06913 #alternative hypothesis: highest value 25 is an outlier
A partir do resultado, podemos ver que a estatística de teste é Q = 0,5 e o valor p correspondente é 0,06913 . Assim, não rejeitamos a hipótese nula ao nível de significância de 0,05 e concluímos que 25 não é um valor atípico. Isso corresponde ao resultado que obtivemos manualmente.