データを -1 と 1 の間で正規化する方法
データセット内の値を -1 から 1 の間で正規化するには、次の式を使用できます。
z i = 2 * ((x i – x min ) / (x max – x min )) – 1
金:
- z i :データセット内のi 番目の正規化値
- x i :データセットのi 番目の値
- x min : データセット内の最小値
- x max :データセット内の最大値
たとえば、次のデータセットがあるとします。
データセットの最小値は 13 で、最大値は 71 です。
最初の値13 を正規化するには、以前に共有した式を適用します。
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
2 番目の値16 を正規化するには、同じ式を使用します。
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0.897
3 番目の値19 を正規化するには、同じ式を使用します。
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0.793
これとまったく同じ式を使用して、元のデータセットの各値を -1 から 1 の間で正規化できます。
正規化されたデータセットの各値は -1 から 1 の間になります。
この正規化方法を使用すると、次のステートメントは常に true になります。
- データセット内の最小値の正規化された値は常に -1 になります。
- データセット内の最大値の正規化された値は常に 1 になります。
- データセット内の他のすべての値の正規化された値は、-1 から 1 の間になります。
データを正規化する場合
複数の変数を異なるスケールで測定し、各変数の範囲を同じにする必要がある何らかのタイプの分析を行うときに、変数を標準化することがよくあります。
これにより、特に異なる単位で測定される場合 (つまり、ある変数がインチで測定され、別の変数がヤードで測定される場合)、1 つの変数が過度の影響を与えることがなくなります。
また、ここで使用した正規化方法は、可能なオプションの 1 つにすぎないことにも注意してください。
場合によっては、変数を 0 と 1 の間、さらには 0 と 100 の間で正規化することが合理的です。
追加リソース
次のチュートリアルでは、他のタイプの正規化を実行する方法について説明します。