Como executar o testador grubbs no excel
O teste de Grubbs é um teste estatístico que pode ser usado para identificar a presença de um outlier em um conjunto de dados. Para usar este teste, o conjunto de dados que você está analisando deve ter distribuição aproximadamente normal e, idealmente, deve conter pelo menos 7 observações.
Observação: se você acha que há vários valores discrepantes no conjunto de dados, você deve usar o teste extremo generalizado de lacuna entre alunos para valores discrepantes .
Se você acredita que o valor máximo no conjunto de dados é uma exceção, a estatística de teste será calculada da seguinte forma:
G = (x máx – x ) / s
Se você acredita que o valor mínimo no conjunto de dados é uma exceção, a estatística de teste será calculada da seguinte forma:
G = ( x – x min ) / s
E se você não tiver certeza se o valor máximo ou mínimo do conjunto de dados é um valor discrepante e quiser realizar um teste bicaudal, a estatística de teste é calculada da seguinte forma:
G = máx|x i – x | /s
onde x é a média amostral e s é o desvio padrão amostral.
O valor crítico do teste é calculado da seguinte forma:
G crítico = (n-1)t crítico / √[n(n-2 + t 2 crítico )]
onde t crítico é o valor crítico da distribuição t com n-2 graus de liberdade e o nível de significância é α/n para um teste unilateral e α/(2n) para um teste bilateral.
Exemplo: teste Grubbs no Excel
Determine se o valor 60 é ou não um valor discrepante no seguinte conjunto de dados:
Etapa 1: primeiro, precisamos ter certeza de que os dados estão distribuídos aproximadamente normalmente. Para fazer isso, podemos criar um histograma para verificar se a distribuição tem aproximadamente o formato de um sino. A captura de tela a seguir mostra como criar um histograma no Excel usando o Data Analysis ToolPak :
No histograma podemos ver que os dados estão distribuídos aproximadamente normalmente. Isto significa que podemos realizar o teste de Grubbs.
Etapa 2: a seguir, realizaremos o teste de Grubbs para determinar se o valor 60 é realmente um valor discrepante no conjunto de dados. A captura de tela abaixo mostra as fórmulas a serem usadas para realizar o teste de Grubbs:
A estatística de teste, G , na célula D4 é 3.603219 .
O valor crítico, G crítico , na célula D11 é 2,556581 . Como a estatística de teste é maior que o valor crítico, isso significa que o valor 60 é de fato um valor atípico neste conjunto de dados.
O que fazer se um outlier for identificado
Se o teste de Grubbs identificar um valor discrepante em seu conjunto de dados, você terá várias opções:
- Verifique novamente para ter certeza de que o valor não é um erro de digitação ou de entrada de dados. Às vezes, os valores que aparecem como valores discrepantes em conjuntos de dados são simplesmente erros de digitação cometidos por um indivíduo durante a entrada de dados. Volte e verifique se o valor foi inserido corretamente antes de tomar outras decisões.
- Atribua um novo valor ao outlier . Se o valor discrepante for resultado de um erro de digitação ou de entrada de dados, você pode decidir atribuir a ele um novo valor, como a média ou mediana do conjunto de dados.
- Remova o valor discrepante. Se o valor for realmente atípico, você poderá optar por removê-lo se ele tiver um impacto significativo em sua análise geral.
Não importa o que você decida fazer com o valor discrepante, certifique-se de anotá-lo ao apresentar as conclusões finais de sua análise.