Como normalizar dados entre 0 e 100
Para normalizar valores em um conjunto de dados entre 0 e 100, você pode usar a seguinte fórmula:
z i = (x i – min(x)) / (max(x) – min(x)) * 100
Ouro:
- z i : o i-ésimo valor normalizado no conjunto de dados
- x i : o i- ésimo valor do conjunto de dados
- min(x) : O valor mínimo no conjunto de dados
- max (x): o valor máximo no conjunto de dados
Por exemplo, suponha que temos o seguinte conjunto de dados:
O valor mínimo no conjunto de dados é 12 e o valor máximo é 68.
Para normalizar o primeiro valor de 12 , aplicaríamos a fórmula compartilhada anteriormente:
- z i = (x i – min(x)) / (máx(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Para normalizar o segundo valor de 19 , usaríamos a mesma fórmula:
- z i = (x i – min(x)) / (máx(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5
Para normalizar o terceiro valor de 21 , usaríamos a mesma fórmula:
- z i = (x i – min(x)) / (máx(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07
Podemos usar exatamente esta mesma fórmula para normalizar cada valor no conjunto de dados original entre 0 e 100:
Como normalizar dados entre qualquer intervalo
Na verdade, podemos usar esta fórmula para normalizar um conjunto de dados entre 0 e qualquer número:
z i = (x i – min(x)) / (max(x) – min(x)) * Q
onde Q é o número máximo desejado para seus valores de dados normalizados.
No exemplo anterior, escolhemos Q como 100, mas poderíamos facilmente normalizar um intervalo de valores de dados entre 0 e 1000 escolhendo Q como 1000:
Para normalizar o primeiro valor de 12 , aplicaríamos a fórmula:
- z i = (x i – min(x)) / (máx(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
Para normalizar o segundo valor de 19 , usaríamos a mesma fórmula:
- z i = (x i – min(x)) / (máx(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
Para normalizar o terceiro valor de 21 , usaríamos a mesma fórmula:
- z i = (x i – min(x)) / (máx(x) – min(x)) * 1.000 = (21 – 12) / (68 – 12) * 100 = 160,7
Podemos usar exatamente esta mesma fórmula para normalizar cada valor no conjunto de dados original entre 0 e 1000:
Quando normalizar os dados
Às vezes padronizamos variáveis quando estamos fazendo um determinado tipo de análise em que temos múltiplas variáveis medidas em escalas diferentes e queremos que cada uma das variáveis tenha o mesmo intervalo.
Isto evita que uma variável tenha influência indevida, especialmente se for medida em unidades diferentes (ou seja, se uma variável for medida em polegadas e outra em jardas).
Também é importante notar que usamos um método conhecido como normalização min-max neste tutorial para normalizar os valores dos dados.
Os dois métodos de normalização mais comuns são:
1. Normalização Mín-Máx.
- Objetivo: Converte cada valor de dados em um valor entre 0 e 100.
- Fórmula: Novo valor = (valor – min) / (máx – min) * 100
2. Normalização média
- Objetivo: Dimensiona valores de forma que a média de todos os valores seja 0 e padrão. dev. é 1.
- Fórmula: Novo valor = (valor – média) / (desvio padrão)
Recursos adicionais
Como normalizar dados entre 0 e 1
Como normalizar dados no Excel
Como normalizar dados em R
Como normalizar colunas em Python