データを0と1の間で正規化する方法
データセット内の値を 0 と 1 の間で正規化するには、次の式を使用できます。
z i = (x i – 最小(x)) / (最大(x) – 最小(x))
金:
- z i :データセット内のi 番目の正規化値
- x i :データセットのi 番目の値
- min(x) : データセット内の最小値
- max(x):データセット内の最大値
たとえば、次のデータセットがあるとします。
データセットの最小値は 13 で、最大値は 71 です。
最初の値13 を正規化するには、以前に共有した式を適用します。
- z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0
2 番目の値16 を正規化するには、同じ式を使用します。
- z i = (x i – 最小(x)) / (最大(x) – 最小(x)) = (16 – 13) / (71 – 13) = 0.0517
3 番目の値19 を正規化するには、同じ式を使用します。
- z i = (x i – 最小(x)) / (最大(x) – 最小(x)) = (19 – 13) / (71 – 13) = 0.1034
これとまったく同じ式を使用して、元のデータセットの各値を 0 と 1 の間で正規化できます。
この正規化方法を使用すると、次のステートメントは常に true になります。
- データセット内の最小値の正規化された値は常に 0 になります。
- データセット内の最大値の正規化された値は常に 1 になります。
- データセット内の他のすべての値の正規化された値は 0 から 1 の間になります。
データを正規化する場合
複数の変数を異なるスケールで測定し、各変数の範囲を同じにする必要がある何らかのタイプの分析を行うときに、変数を標準化することがよくあります。
これにより、特に変数が異なる単位で測定される場合 (つまり、ある変数がインチで測定され、別の変数がヤードで測定される場合)、1 つの変数が不当な影響を与えることが防止されます。
このチュートリアルでは、データ値を正規化するためにmin-max 正規化と呼ばれる方法を使用したことにも注目してください。
最も一般的な正規化方法は次の 2 つです。
1. 最小値と最大値の正規化
- 目的:各データ値を 0 ~ 100 の値に変換します。
- 式:新しい値 = (値 – 最小) / (最大 – 最小) * 100
2. 平均の正規化
- 目的:すべての値の平均が 0 および標準値になるように値をスケーリングします。開発者。は1です。
- 計算式:新しい値 = (値 – 平均) / (標準偏差)
追加リソース
次のチュートリアルでは、さまざまな統計ソフトウェアを使用してデータを正規化する方法について説明します。