Excel'de veri dönüştürme (log, karekök, küp kök)
Birçok istatistiksel test, veri setlerinin normal şekilde dağıldığını varsayar.
Ancak uygulamada bu varsayım sıklıkla ihlal edilmektedir. Bu sorunu çözmenin bir yolu, aşağıdaki üç dönüşümden birini kullanarak veri kümesindeki değerleri dönüştürmektir:
1. Log Dönüşümü: y değerlerini log(y)’ ye dönüştürün.
2. Karekök dönüşümü: y değerlerini √y’ye dönüştürün.
3. Küp kök dönüşümü: y değerlerini y 1/3’e dönüştürün.
Bu dönüşümler gerçekleştirilerek veriler genellikle normal dağılıma yaklaşır. Aşağıdaki örnekler bu dönüşümlerin Excel’de nasıl gerçekleştirileceğini göstermektedir.
Excel’de Günlük Dönüşümü
Excel’deki bir veri kümesine log dönüşümü uygulamak için =LOG10() fonksiyonunu kullanabiliriz.
Aşağıdaki ekran görüntüsü, Excel’deki bir veri kümesine günlük dönüşümünün nasıl uygulanacağını gösterir:
Bu dönüşümün veri setini daha normal dağıtıp dağıtmadığını belirlemek için Excel’de Jarque-Bera normallik testi yapabiliriz.
Bu test için test istatistiği şu şekilde tanımlanır:
JB =(n/6) * (S 2 + (C 2 /4))
Altın:
- n: numunedeki gözlem sayısı
- S: numunenin asimetrisi
- C: gurur verici örnek
Normallik sıfır hipotezi altında, JB~ X 2 (2).
Test istatistiğine karşılık gelen p değeri belirli bir anlamlılık düzeyinin altındaysa (örneğin α = 0,05), o zaman sıfır hipotezini reddedebilir ve verilerin normal dağılmadığı sonucuna varabiliriz.
Aşağıdaki ekran görüntüsü ham veriler ve dönüştürülmüş veriler için Jarque-Bera testinin nasıl gerçekleştirileceğini gösterir:
Ham verilerin p değerinin 0,05’ten küçük olduğunu ve bunun normal dağılmadığını gösterdiğini unutmayın.
Ancak dönüştürülen verinin p değeri 0,05’ten az olmadığından normal dağıldığını varsayabiliriz. Bu bize log dönüşümünün işe yaradığını gösteriyor.
Excel’de Karekök Dönüşümü
Excel’deki bir veri kümesine karekök dönüşümü uygulamak için =SQRT() işlevini kullanabiliriz.
Aşağıdaki ekran görüntüsü, Excel’deki bir veri kümesine karekök dönüşümünün nasıl uygulanacağını gösterir:
Dönüştürülen veriler için Jarque-Bera normallik testinin p değerinin 0,05’ten az olmadığına dikkat edin; bu, karekök dönüşümünün etkili olduğunu gösterir.
Excel’de Küp Kök Dönüşümü
Excel’deki bir veri kümesine küp kök dönüşümü uygulamak için =DATA^(1/3) işlevini kullanabiliriz.
Aşağıdaki ekran görüntüsü, Excel’deki bir veri kümesine küp kök dönüşümünün nasıl uygulanacağını gösterir:
Dönüştürülen veriler için Jarque-Bera normallik testinin p değerinin 0,05’ten az olmaması küp kök dönüşümünün etkili olduğunu göstermektedir.
Üç veri dönüşümü, ham verileri etkili bir şekilde daha normal bir şekilde dağıttı.
Üç dönüşümden logaritmik dönüşüm, Jarque-Bera normallik testinde en yüksek p-değerini verdi; bu da bize, bu dönüşümün, verileri muhtemelen üç yöntem dönüşümü arasında “en” normal dağılıma sahip veri haline getirdiğini söylüyor.
Ek kaynaklar
Excel’de Box-Cox dönüşümü nasıl gerçekleştirilir
İstatistikte normallik varsayımı nedir?