Excel'de aykırı değerleri kolayca bulma


Aykırı değer , bir veri kümesindeki diğer değerlerden anormal derecede uzak olan bir gözlemdir .

Aykırı değerler sorunlu olabilir çünkü analizin sonuçlarını etkileyebilirler.

Aykırı değerleri bulmaya yönelik iki yöntemi göstermek için Excel’de aşağıdaki veri kümesini kullanacağız:

İlgili: Excel’de Aykırı Değerler Dışında Ortalama Nasıl Hesaplanır?

Yöntem 1: Çeyrekler arası aralığı kullanma

Çeyrekler arası aralık (IQR), bir veri setindeki 75. yüzdelik dilim (Q3) ile 25. yüzdelik dilim (Q1) arasındaki farktır. Değerlerin ortalama %50’sinin dağılımını ölçer.

Bir gözlemi, üçüncü çeyreğin (Q3) çeyrekler arası aralığın 1,5 katı üzerinde veya birinci çeyreğin (Q1) altındaki çeyrekler arası aralığın 1,5 katı ise aykırı değer olarak tanımlayabiliriz.

Aşağıdaki resimde Excel’de çeyrekler arası aralığın nasıl hesaplanacağı gösterilmektedir:

Daha sonra veri kümesindeki herhangi bir aykırı değere “1” atamak için yukarıda belirtilen formülü kullanabiliriz:

Excel'de aykırı değerleri bulma

Bu veri kümesinde yalnızca bir değerin ( 164 ) aykırı değer olduğunu görüyoruz.

Yöntem 2: Z puanlarını kullanın

Z-puanı, belirli bir değerin ortalamadan kaç standart sapma olduğunu gösterir. Z-puanını hesaplamak için aşağıdaki formülü kullanırız:

z = (X – μ) / σ

Altın:

  • X tek bir ham veri değeridir
  • μ nüfus ortalamasıdır
  • σ popülasyon standart sapmasıdır

Bir gözlemin z-puanı -3’ten küçük veya 3’ten büyükse aykırı değer olarak tanımlayabiliriz.

Aşağıdaki resimde Excel’de bir veri kümesinin ortalama ve standart sapmasının nasıl hesaplanacağı gösterilmektedir:

Daha sonra veri kümesindeki her bir değerin z-puanını bulmak için ortalamayı ve standart sapmayı kullanabiliriz:

Daha sonra z-score’u -3’ten küçük veya 3’ten büyük olan herhangi bir değere “1” atayabiliriz:

Z Puanlarını Kullanarak Excel'de Aykırı Değerleri Bulma

Bu yöntemi kullanarak veri setinde aykırı değerlerin olmadığını görüyoruz.

Not: Bazen 3 yerine 2,5’lik bir z puanı kullanılır. Bu durumda, 164’ün bireysel değeri 2,5’ten büyük bir z puanına sahip olduğundan aykırı değer olarak kabul edilir.

Z-puanı yöntemini kullanırken, hangi z-puanı değerini aykırı değer olarak değerlendirdiğinizi belirlemek için kendi muhakemenizi kullanın.

Aykırı değerler nasıl ele alınır?

Verilerinizde aykırı değer varsa birkaç seçeneğiniz vardır:

1. Aykırı değerin veri girişi hatasından kaynaklanmadığından emin olun.

Bazen bir kişi verileri kaydederken yanlış veri değerini girer. Aykırı değer mevcutsa öncelikle değerin doğru girildiğini ve bunun bir hata olmadığını doğrulayın.

2. Aykırı değeri kaldırın.

Değer gerçekten aykırı bir değerse ve genel analiziniz üzerinde önemli bir etkisi olacaksa onu kaldırmayı seçebilirsiniz. Son raporunuzda veya analizinizde aykırı bir değeri kaldırdığınızı mutlaka belirtin.

3. Aykırı değere yeni bir değer atayın .

Aykırı değer bir veri girişi hatasının sonucuysa, buna veri kümesinin ortalaması veya medyanı gibi yeni bir değer atamaya karar verebilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir