Excel でデータを変換する方法 (対数、平方根、立方根)
多くの統計テストは、データ セットが正規分布していることを前提としています。
ただし、実際にはこの仮定が破られることがよくあります。この問題を解決する 1 つの方法は、次の 3 つの変換のいずれかを使用してデータセット内の値を変換することです。
1.対数変換: y 値をlog(y)に変換します。
2. 平方根変換: y の値を√yに変換します。
3. 立方根変換: y 値をy 1/3に変換します。
これらの変換を実行すると、データは通常、正規分布に近似します。次の例は、Excel でこれらの変換を実行する方法を示しています。
Excel でのログ変換
Excel のデータ セットにログ変換を適用するには、 =LOG10()関数を使用できます。
次のスクリーンショットは、Excel のデータ セットにログ変換を適用する方法を示しています。
この変換によりデータ セットがより正規分布になったかどうかを判断するには、 Excel で Jarque-Bera 正規性検定を実行します。
このテストのテスト統計量は次のように定義されます。
JB =(n/6) * (S 2 + (C 2 /4))
金:
- n:サンプル内の観測値の数
- S:サンプルの非対称性
- C:お世辞のサンプル
正規性の帰無仮説の下では、 JB ~ X 2 (2)。
検定統計量に対応するp 値が特定の有意水準 (例: α = 0.05) を下回る場合、帰無仮説は棄却され、データは正規分布していないと結論付けることができます。
次のスクリーンショットは、生データと変換されたデータに対して Jarque-Bera テストを実行する方法を示しています。
生データの p 値は 0.05 未満であり、正規分布ではないことを示していることに注意してください。
ただし、変換されたデータの p 値は 0.05 未満ではないため、正規分布していると仮定できます。これは、ログ変換が機能したことを示しています。
Excel での平方根変換
Excel で一連のデータに平方根変換を適用するには、 =SQRT()関数を使用できます。
次のスクリーンショットは、Excel のデータ セットに平方根変換を適用する方法を示しています。
変換されたデータの Jarque-Bera 正規性検定の p 値は 0.05 以上であり、平方根変換が有効であったことを示していることに注意してください。
Excel での立方根変換
Excel で立方根変換を一連のデータに適用するには、 =DATA^(1/3)関数を使用できます。
次のスクリーンショットは、Excel のデータ セットに立方根変換を適用する方法を示しています。
変換されたデータの Jarque-Bera 正規性検定の p 値は 0.05 以上であり、立方根変換が有効であったことを示しています。
3 つのデータ変換により、生データは効果的により正規分布になりました。
3 つの変換のうち、対数変換は Jarque-Bera 正規性検定で最も高い p 値をもたらし、これによりデータが 3 つの変換方法の中で「最も」正規分布したデータになった可能性が高いことがわかります。