Como transformar dados no excel (log, raiz quadrada, raiz cúbica)
Muitos testes estatísticos assumem que os conjuntos de dados são normalmente distribuídos .
No entanto, esta suposição é frequentemente violada na prática. Uma maneira de resolver esse problema é transformar os valores no conjunto de dados usando uma das três transformações a seguir:
1. Log Transform: Transforme os valores de y em log(y) .
2. Transformação de raiz quadrada: transforme os valores de y em √y .
3. Transformação da raiz cúbica: transforme os valores de y em y 1/3 .
Ao realizar essas transformações, os dados geralmente se aproximam da distribuição normal. Os exemplos a seguir mostram como realizar essas transformações no Excel.
Transformação de log no Excel
Para aplicar uma transformação de log a um conjunto de dados no Excel, podemos usar a função =LOG10() .
A captura de tela a seguir mostra como aplicar uma transformação de log a um conjunto de dados no Excel:
Para determinar se essa transformação tornou o conjunto de dados distribuído de forma mais normal, podemos realizar um teste de normalidade Jarque-Bera no Excel .
A estatística de teste para este teste é definida como:
JB =(n/6) * (S 2 + ( C 2/4))
Ouro:
- n: o número de observações na amostra
- S: a assimetria da amostra
- C: a amostra lisonjeira
Sob a hipótese nula de normalidade, JB ~ X 2 (2).
Se o valor p que corresponde à estatística de teste estiver abaixo de um certo nível de significância (por exemplo, α = 0,05), então podemos rejeitar a hipótese nula e concluir que os dados não são normalmente distribuídos.
A captura de tela a seguir mostra como realizar um teste Jarque-Bera para dados brutos e dados transformados:
Observe que o valor p dos dados brutos é inferior a 0,05, indicando que não é normalmente distribuído.
Porém, o valor p dos dados transformados não é inferior a 0,05, portanto podemos assumir que é normalmente distribuído. Isso nos diz que a transformação do log funcionou.
Transformação de raiz quadrada no Excel
Para aplicar uma transformação de raiz quadrada a um conjunto de dados no Excel, podemos usar a função =SQRT() .
A captura de tela a seguir mostra como aplicar uma transformação de raiz quadrada a um conjunto de dados no Excel:
Observe que o valor p do teste de normalidade de Jarque-Bera para os dados transformados não é inferior a 0,05, indicando que a transformação da raiz quadrada foi eficaz.
Transformação de raiz cúbica no Excel
Para aplicar uma transformação de raiz cúbica a um conjunto de dados no Excel, podemos usar a função =DATA^(1/3) .
A captura de tela a seguir mostra como aplicar uma transformação de raiz cúbica a um conjunto de dados no Excel:
O valor p do teste de normalidade Jarque-Bera para os dados transformados não é inferior a 0,05, indicando que a transformação da raiz cúbica foi eficaz.
As três transformações de dados efetivamente tornaram os dados brutos distribuídos de forma mais normal.
Das três transformações, a transformação logarítmica produziu o valor p mais alto no teste de normalidade Jarque-Bera, dizendo-nos que provavelmente tornou os dados os dados “mais” normalmente distribuídos entre os três métodos de transformação.
Recursos adicionais
Como realizar uma transformação Box-Cox no Excel
Qual é a suposição de normalidade nas estatísticas?