Como encontrar facilmente valores discrepantes no planilhas google


Um outlier é uma observação anormalmente distante de outros valores em um conjunto de dados.

Muitas vezes definimos uma observação como um valor atípico se for 1,5 vezes o intervalo interquartil acima do terceiro quartil ou 1,5 vezes o intervalo interquartil abaixo do primeiro quartil.

Nota: O intervalo interquartil é a diferença entre o terceiro quartil (percentil 75) e o primeiro quartil (percentil 25) de um conjunto de dados. Mede a distribuição da média de 50% dos valores.

O exemplo passo a passo a seguir mostra como usar esta fórmula para encontrar valores discrepantes em um conjunto de dados no Planilhas Google.

Passo 1: Insira os dados

Primeiro, vamos inserir os valores do seguinte conjunto de dados no Planilhas Google:

Etapa 2: calcular o intervalo interquartil

A seguir, vamos calcular o primeiro quartil, o terceiro quartil e o intervalo interquartil do conjunto de dados:

Etapa 3: identificar valores discrepantes

Em seguida, podemos usar a seguinte fórmula para atribuir “1” a quaisquer valores discrepantes no conjunto de dados:

 = IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )

Esta fórmula verifica se uma observação é 1,5 vezes o intervalo interquartil acima do terceiro quartil ou 1,5 vezes o intervalo interquartil abaixo do primeiro quartil.

Se alguma delas for verdadeira, a observação recebe um “1” para designá-la como um valor discrepante.

A captura de tela a seguir mostra como usar esta fórmula na prática:

Encontre valores discrepantes no Planilhas Google

Vemos que apenas um valor em nosso conjunto de dados é atípico: 164 .

Como lidar com outliers

Se um valor discrepante estiver presente em seus dados, você terá várias opções:

1. Certifique-se de que o valor discrepante não seja resultado de um erro de entrada de dados.

Às vezes, dados simples são salvos incorretamente. Se houver um valor discrepante, primeiro verifique se o valor foi inserido corretamente e se não houve um erro.

2. Atribua um novo valor ao valor discrepante .

Se o valor discrepante for o resultado de um erro de entrada de dados, você pode decidir atribuir-lhe um novo valor, como a média ou mediana do conjunto de dados.

3. Remova o valor discrepante.

Se o valor for realmente atípico, você poderá optar por removê-lo se ele tiver um impacto significativo em sua análise geral. Apenas certifique-se de mencionar em seu relatório final que você removeu um valor discrepante.

Recursos adicionais

Os tutoriais a seguir explicam como remover valores discrepantes em outros softwares estatísticos:

Como remover outliers em R
Como remover valores discrepantes em Python
Como remover valores discrepantes no SPSS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *