Como normalizar dados entre 0 e 1


Para normalizar valores em um conjunto de dados entre 0 e 1, você pode usar a seguinte fórmula:

z i = (x i – min(x)) / (max(x) – min(x))

Ouro:

  • z i : o i-ésimo valor normalizado no conjunto de dados
  • x i : o i- ésimo valor do conjunto de dados
  • min(x) : O valor mínimo no conjunto de dados
  • max (x): o valor máximo no conjunto de dados

Por exemplo, suponha que temos o seguinte conjunto de dados:

O valor mínimo no conjunto de dados é 13 e o valor máximo é 71.

Para normalizar o primeiro valor de 13 , aplicaríamos a fórmula compartilhada anteriormente:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0

Para normalizar o segundo valor de 16 , usaríamos a mesma fórmula:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517

Para normalizar o terceiro valor de 19 , usaríamos a mesma fórmula:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034

Podemos usar exatamente esta mesma fórmula para normalizar cada valor no conjunto de dados original entre 0 e 1:

Normalizar dados entre 0 e 1

Usando este método de normalização, as seguintes afirmações serão sempre verdadeiras:

  • O valor normalizado para o valor mínimo no conjunto de dados será sempre 0.
  • O valor normalizado para o valor máximo no conjunto de dados será sempre 1.
  • Os valores normalizados para todos os outros valores no conjunto de dados estarão entre 0 e 1.

Quando normalizar os dados

Muitas vezes padronizamos variáveis quando estamos fazendo algum tipo de análise em que temos múltiplas variáveis medidas em escalas diferentes e queremos que cada uma das variáveis tenha o mesmo intervalo.

Isto evita que uma variável tenha influência indevida, especialmente se for medida em unidades diferentes (ou seja, se uma variável for medida em polegadas e outra em jardas).

Também é importante notar que usamos um método conhecido como normalização min-max neste tutorial para normalizar os valores dos dados.

Os dois métodos de normalização mais comuns são:

1. Normalização Mín-Máx.

  • Objetivo: Converte cada valor de dados em um valor entre 0 e 100.
  • Fórmula: Novo valor = (valor – min) / (máx – min) * 100

2. Normalização média

  • Objetivo: Dimensiona valores de forma que a média de todos os valores seja 0 e padrão. dev. é 1.
  • Fórmula: Novo valor = (valor – média) / (desvio padrão)

Recursos adicionais

Os tutoriais a seguir explicam como normalizar dados usando diferentes softwares estatísticos:

Como normalizar dados no Excel
Como normalizar dados em R
Como normalizar colunas em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *