Grubbs tester'ı excel'de nasıl çalıştırabilirim?
Grubbs testi, bir veri setinde aykırı değerin varlığını belirlemek için kullanılabilecek istatistiksel bir testtir. Bu testi kullanmak için analiz ettiğiniz veri kümesinin yaklaşık olarak normal dağılıma sahip olması ve ideal olarak en az 7 gözlem içermesi gerekir.
Not: Veri setinde birden fazla aykırı değer olduğunu düşünüyorsanız bunun yerine aykırı değerler için genelleştirilmiş aşırı öğrenci farkı testini kullanmalısınız.
Veri kümesindeki maksimum değerin aykırı değer olduğuna inanıyorsanız test istatistiği şu şekilde hesaplanır:
G = (x maks – x ) / s
Veri kümesindeki minimum değerin aykırı değer olduğunu düşünüyorsanız test istatistiği şu şekilde hesaplanır:
G = ( x – x dk ) / s
Veri kümesinin maksimum değerinin mi yoksa minimum değerinin mi aykırı olduğundan emin değilseniz ve iki kuyruklu bir test yapmak istiyorsanız test istatistiği şu şekilde hesaplanır:
G = maks|x i – x | /S
burada x numune ortalaması ve s numune standart sapmasıdır.
Testin kritik değeri şu şekilde hesaplanır:
G kritik = (n-1)t kritik / √[n(n-2 + t 2 kritik )]
burada t kritik , n-2 serbestlik dereceli t dağılımının kritik değeridir ve anlamlılık düzeyi tek taraflı bir test için α/n ve iki taraflı bir test için α/(2n)’dir.
Örnek: Excel’de Grubbs testi
Aşağıdaki veri setinde 60 değerinin aykırı değer olup olmadığını belirleyin:
Adım 1: Öncelikle verilerin yaklaşık olarak normal dağıldığından emin olmamız gerekir. Bunu yapmak için dağılımın kabaca çan şeklinde olduğunu doğrulayacak bir histogram oluşturabiliriz. Aşağıdaki ekran görüntüsü, Veri Analizi Araç Paketi’ni kullanarak Excel’de nasıl histogram oluşturulacağını gösterir:
Histogramdan verilerin yaklaşık olarak normal dağıldığını görebiliriz. Bu Grubbs testini yapabileceğimiz anlamına geliyor.
Adım 2: Daha sonra, 60 değerinin veri kümesinde gerçekten aykırı olup olmadığını belirlemek için Grubbs testini gerçekleştireceğiz. Aşağıdaki ekran görüntüsü Grubbs testini gerçekleştirmek için kullanılacak formülleri göstermektedir:
D4 hücresindeki test istatistiği G 3,603219’dur .
D11 hücresindeki kritik değer G kritik 2,556581’dir . Test istatistiği kritik değerden büyük olduğundan bu, 60 değerinin bu veri setinde gerçekten de aykırı bir değer olduğu anlamına gelir.
Bir aykırı değer tespit edilirse ne yapılmalı
Grubbs testi veri kümenizde bir aykırı değer belirlerse birkaç seçeneğiniz vardır:
- Değerin bir yazım hatası veya veri girişi hatası olmadığından emin olmak için bir kez daha kontrol edin. Bazen veri setlerinde aykırı değerler olarak görünen değerler, basitçe bir kişinin veri girişi sırasında yaptığı yazım hatalarıdır. Daha fazla karar vermeden önce geri dönün ve değerin doğru şekilde girildiğini doğrulayın.
- Aykırı değere yeni bir değer atayın . Aykırı değerin bir yazım hatası veya veri girişi hatası sonucu olduğu ortaya çıkarsa, buna veri kümesinin ortalaması veya medyanı gibi yeni bir değer atamaya karar verebilirsiniz.
- Aykırı olanı kaldırın. Değer gerçekten aykırı bir değerse ve genel analiziniz üzerinde önemli bir etkisi olacaksa onu kaldırmayı seçebilirsiniz.
Aykırı değerle ne yapmaya karar verirseniz verin, analizinizin nihai sonuçlarını sunarken bunu not ettiğinizden emin olun.