Como normalizar dados entre 0 e 100


Para normalizar valores em um conjunto de dados entre 0 e 100, você pode usar a seguinte fórmula:

z i = (x i – min(x)) / (max(x) – min(x)) * 100

Ouro:

  • z i : o i-ésimo valor normalizado no conjunto de dados
  • x i : o i- ésimo valor do conjunto de dados
  • min(x) : O valor mínimo no conjunto de dados
  • max (x): o valor máximo no conjunto de dados

Por exemplo, suponha que temos o seguinte conjunto de dados:

O valor mínimo no conjunto de dados é 12 e o valor máximo é 68.

Para normalizar o primeiro valor de 12 , aplicaríamos a fórmula compartilhada anteriormente:

  • z i = (x i – min(x)) / (máx(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0

Para normalizar o segundo valor de 19 , usaríamos a mesma fórmula:

  • z i = (x i – min(x)) / (máx(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5

Para normalizar o terceiro valor de 21 , usaríamos a mesma fórmula:

  • z i = (x i – min(x)) / (máx(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07

Podemos usar exatamente esta mesma fórmula para normalizar cada valor no conjunto de dados original entre 0 e 100:

Normalizar dados entre 0 e 100

Como normalizar dados entre qualquer intervalo

Na verdade, podemos usar esta fórmula para normalizar um conjunto de dados entre 0 e qualquer número:

z i = (x i – min(x)) / (max(x) – min(x)) * Q

onde Q é o número máximo desejado para seus valores de dados normalizados.

No exemplo anterior, escolhemos Q como 100, mas poderíamos facilmente normalizar um intervalo de valores de dados entre 0 e 1000 escolhendo Q como 1000:

Para normalizar o primeiro valor de 12 , aplicaríamos a fórmula:

  • z i = (x i – min(x)) / (máx(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0

Para normalizar o segundo valor de 19 , usaríamos a mesma fórmula:

  • z i = (x i – min(x)) / (máx(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125

Para normalizar o terceiro valor de 21 , usaríamos a mesma fórmula:

  • z i = (x i – min(x)) / (máx(x) – min(x)) * 1.000 = (21 – 12) / (68 – 12) * 100 = 160,7

Podemos usar exatamente esta mesma fórmula para normalizar cada valor no conjunto de dados original entre 0 e 1000:

Normalizar dados entre dois números

Quando normalizar os dados

Às vezes padronizamos variáveis quando estamos fazendo um determinado tipo de análise em que temos múltiplas variáveis medidas em escalas diferentes e queremos que cada uma das variáveis tenha o mesmo intervalo.

Isto evita que uma variável tenha influência indevida, especialmente se for medida em unidades diferentes (ou seja, se uma variável for medida em polegadas e outra em jardas).

Também é importante notar que usamos um método conhecido como normalização min-max neste tutorial para normalizar os valores dos dados.

Os dois métodos de normalização mais comuns são:

1. Normalização Mín-Máx.

  • Objetivo: Converte cada valor de dados em um valor entre 0 e 100.
  • Fórmula: Novo valor = (valor – min) / (máx – min) * 100

2. Normalização média

  • Objetivo: Dimensiona valores de forma que a média de todos os valores seja 0 e padrão. dev. é 1.
  • Fórmula: Novo valor = (valor – média) / (desvio padrão)

Recursos adicionais

Como normalizar dados entre 0 e 1
Como normalizar dados no Excel
Como normalizar dados em R
Como normalizar colunas em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *