データを0から100の間で正規化する方法


データセット内の値を 0 から 100 の間で正規化するには、次の式を使用できます。

z i = (x i – 最小(x)) / (最大(x) – 最小(x)) * 100

金:

  • z i :データセット内のi 番目の正規化値
  • x i :データセットのi 番目の
  • min(x) : データセット内の最小値
  • max(x):データセット内の最大値

たとえば、次のデータセットがあるとします。

データセットの最小値は 12、最大値は 68 です。

最初の値12 を正規化するには、以前に共有した式を適用します。

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0

2 番目の値19 を正規化するには、同じ式を使用します。

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5

3 番目の値21 を正規化するには、同じ式を使用します。

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07

これとまったく同じ式を使用して、元のデータセットの各値を 0 から 100 の間で正規化できます。

データを0から100の間で正規化します

任意の範囲間でデータを正規化する方法

実際にこの式を使用して、0 から任意の数値までのデータセットを正規化できます。

z i = (x i – min(x)) / (max(x) – min(x)) * Q

ここで、 Q は正規化されたデータ値に必要な最大数です。

前の例では、Q を 100 に選択しましたが、Q を 1000 に選択することで、0 から 1000 の間のデータ値の範囲を簡単に正規化できます。

最初の値12を正規化するには、次の式を適用します。

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0

2 番目の値19 を正規化するには、同じ式を使用します。

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125

3 番目の値21 を正規化するには、同じ式を使用します。

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7

これとまったく同じ式を使用して、元のデータセットの各値を 0 ~ 1000 の間で正規化できます。

2 つの数値間のデータを正規化する

データを正規化する場合

複数の変数を異なるスケールで測定し、各変数の範囲を同じにする必要がある特定の種類の分析を行うときに、変数を標準化することがあります。

これにより、特に変数が異なる単位で測定される場合 (つまり、ある変数がインチで測定され、別の変数がヤードで測定される場合)、1 つの変数が不当な影響を与えることが防止されます。

このチュートリアルでは、データ値を正規化するためにmin-max 正規化と呼ばれる方法を使用したことにも注目してください。

最も一般的な正規化方法は次の 2 つです。

1. 最小値と最大値の正規化

  • 目的:各データ値を 0 ~ 100 の値に変換します。
  • 式:新しい値 = (値 – 最小) / (最大 – 最小) * 100

2. 平均の正規化

  • 目的:すべての値の平均が 0 および標準値になるように値をスケーリングします。開発者。は1です。
  • 計算式:新しい値 = (値 – 平均) / (標準偏差)

追加リソース

データを0と1の間で正規化する方法
Excel でデータを正規化する方法
R でデータを正規化する方法
Python で列を正規化する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です