Como encontrar facilmente valores discrepantes no planilhas google
Um outlier é uma observação anormalmente distante de outros valores em um conjunto de dados.
Muitas vezes definimos uma observação como um valor atípico se for 1,5 vezes o intervalo interquartil acima do terceiro quartil ou 1,5 vezes o intervalo interquartil abaixo do primeiro quartil.
Nota: O intervalo interquartil é a diferença entre o terceiro quartil (percentil 75) e o primeiro quartil (percentil 25) de um conjunto de dados. Mede a distribuição da média de 50% dos valores.
O exemplo passo a passo a seguir mostra como usar esta fórmula para encontrar valores discrepantes em um conjunto de dados no Planilhas Google.
Passo 1: Insira os dados
Primeiro, vamos inserir os valores do seguinte conjunto de dados no Planilhas Google:
Etapa 2: calcular o intervalo interquartil
A seguir, vamos calcular o primeiro quartil, o terceiro quartil e o intervalo interquartil do conjunto de dados:
Etapa 3: identificar valores discrepantes
Em seguida, podemos usar a seguinte fórmula para atribuir “1” a quaisquer valores discrepantes no conjunto de dados:
= IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )
Esta fórmula verifica se uma observação é 1,5 vezes o intervalo interquartil acima do terceiro quartil ou 1,5 vezes o intervalo interquartil abaixo do primeiro quartil.
Se alguma delas for verdadeira, a observação recebe um “1” para designá-la como um valor discrepante.
A captura de tela a seguir mostra como usar esta fórmula na prática:
Vemos que apenas um valor em nosso conjunto de dados é atípico: 164 .
Como lidar com outliers
Se um valor discrepante estiver presente em seus dados, você terá várias opções:
1. Certifique-se de que o valor discrepante não seja resultado de um erro de entrada de dados.
Às vezes, dados simples são salvos incorretamente. Se houver um valor discrepante, primeiro verifique se o valor foi inserido corretamente e se não houve um erro.
2. Atribua um novo valor ao valor discrepante .
Se o valor discrepante for o resultado de um erro de entrada de dados, você pode decidir atribuir-lhe um novo valor, como a média ou mediana do conjunto de dados.
3. Remova o valor discrepante.
Se o valor for realmente atípico, você poderá optar por removê-lo se ele tiver um impacto significativo em sua análise geral. Apenas certifique-se de mencionar em seu relatório final que você removeu um valor discrepante.
Recursos adicionais
Os tutoriais a seguir explicam como remover valores discrepantes em outros softwares estatísticos:
Como remover outliers em R
Como remover valores discrepantes em Python
Como remover valores discrepantes no SPSS