Como calcular pontuações z modificadas no excel
Nas estatísticas, um escore z modificado é calculado da seguinte forma:
Escore z modificado = 0,6745 (x i – x̃) / MAD
Ouro:
- x i : um único valor de dados
- x̃: A mediana do conjunto de dados
- MAD: o desvio absoluto mediano do conjunto de dados
Um escore z modificado é mais robusto do que um escore z regular porque usa a mediana em sua fórmula em oposição à média,que é conhecida por ser influenciada por valores discrepantes .
Iglewicz e Hoaglin recomendam que valores com escores z modificados menores que -3,5 ou maiores que 3,5 sejam rotulados como possíveis valores discrepantes.
O exemplo passo a passo a seguir mostra como calcular pontuações z modificadas para um determinado conjunto de dados no Excel.
Etapa 1: crie os dados
Primeiro, criaremos o seguinte conjunto de dados contendo 16 valores:
Etapa 2: calcular a mediana
A seguir, calcularemos a mediana do conjunto de dados:
A mediana acaba sendo 16 .
Etapa 3: Calcule a diferença absoluta entre cada valor e a mediana
A seguir, calcularemos a diferença absoluta entre cada valor e a mediana:
A diferença absoluta entre o primeiro valor dos dados e a mediana é 16.
Em seguida, clique na célula B2. Em seguida, passe o mouse sobre o canto inferior direito da célula até que uma pequena cruz ( + ) apareça.
Clique duas vezes na cruz para copiar e colar esta fórmula em todas as células restantes da coluna:
Passo 4: Calcule o desvio mediano absoluto
A seguir, usaremos a seguinte fórmula para calcular o desvio absoluto mediano do conjunto de dados:
O desvio mediano absoluto acaba sendo 8 .
Etapa 5: Encontre a pontuação Z modificada para cada valor de dados
Finalmente, podemos calcular o escore z modificado para cada valor de dados usando a seguinte fórmula:
Escore z modificado = 0,6745 (x i – x̃) / MAD
Por exemplo, a pontuação z modificada para o primeiro valor de dados é calculada da seguinte forma:
Em seguida, clique na célula C2. Em seguida, passe o mouse sobre o canto inferior direito da célula até que uma pequena cruz ( + ) apareça.
Clique duas vezes na cruz para copiar e colar esta fórmula em todas as células restantes da coluna:
Podemos ver que nenhum valor no conjunto de dados tem uma pontuação z modificada menor que -3,5 ou maior que 3,5, portanto, não estamos rotulando nenhum valor neste conjunto de dados como um valor atípico em potencial.
Como lidar com outliers
Se um valor discrepante estiver presente em seu conjunto de dados, você terá várias opções:
- Certifique-se de que o valor discrepante não seja resultado de um erro de entrada de dados. Às vezes, um indivíduo simplesmente insere o valor errado dos dados ao salvar os dados. Se houver um valor discrepante, primeiro verifique se o valor foi inserido corretamente e se não houve um erro.
- Atribua um novo valor ao outlier . Se o valor discrepante for o resultado de um erro de entrada de dados, você pode decidir atribuir a ele um novo valor, como a média ou mediana do conjunto de dados.
- Remova o valor discrepante. Se o valor for realmente atípico, você poderá optar por removê-lo se ele tiver um impacto significativo em sua análise geral. Apenas certifique-se de mencionar em seu relatório ou análise final que você removeu um valor discrepante.
Recursos adicionais
Como calcular pontuações Z no Excel
Como calcular o intervalo interquartil (IQR) no Excel
Como calcular médio porte no Excel