Como normalizar dados entre 0 e 1
Para normalizar valores em um conjunto de dados entre 0 e 1, você pode usar a seguinte fórmula:
z i = (x i – min(x)) / (max(x) – min(x))
Ouro:
- z i : o i-ésimo valor normalizado no conjunto de dados
- x i : o i- ésimo valor do conjunto de dados
- min(x) : O valor mínimo no conjunto de dados
- max (x): o valor máximo no conjunto de dados
Por exemplo, suponha que temos o seguinte conjunto de dados:
O valor mínimo no conjunto de dados é 13 e o valor máximo é 71.
Para normalizar o primeiro valor de 13 , aplicaríamos a fórmula compartilhada anteriormente:
- z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0
Para normalizar o segundo valor de 16 , usaríamos a mesma fórmula:
- z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517
Para normalizar o terceiro valor de 19 , usaríamos a mesma fórmula:
- z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034
Podemos usar exatamente esta mesma fórmula para normalizar cada valor no conjunto de dados original entre 0 e 1:
Usando este método de normalização, as seguintes afirmações serão sempre verdadeiras:
- O valor normalizado para o valor mínimo no conjunto de dados será sempre 0.
- O valor normalizado para o valor máximo no conjunto de dados será sempre 1.
- Os valores normalizados para todos os outros valores no conjunto de dados estarão entre 0 e 1.
Quando normalizar os dados
Muitas vezes padronizamos variáveis quando estamos fazendo algum tipo de análise em que temos múltiplas variáveis medidas em escalas diferentes e queremos que cada uma das variáveis tenha o mesmo intervalo.
Isto evita que uma variável tenha influência indevida, especialmente se for medida em unidades diferentes (ou seja, se uma variável for medida em polegadas e outra em jardas).
Também é importante notar que usamos um método conhecido como normalização min-max neste tutorial para normalizar os valores dos dados.
Os dois métodos de normalização mais comuns são:
1. Normalização Mín-Máx.
- Objetivo: Converte cada valor de dados em um valor entre 0 e 100.
- Fórmula: Novo valor = (valor – min) / (máx – min) * 100
2. Normalização média
- Objetivo: Dimensiona valores de forma que a média de todos os valores seja 0 e padrão. dev. é 1.
- Fórmula: Novo valor = (valor – média) / (desvio padrão)
Recursos adicionais
Os tutoriais a seguir explicam como normalizar dados usando diferentes softwares estatísticos:
Como normalizar dados no Excel
Como normalizar dados em R
Como normalizar colunas em Python