Atipik değerler (aykırı değerler)

Bu makalede aykırı değerlerin ne olduğu ve nasıl hesaplandıkları açıklanmaktadır. Ek olarak, herhangi bir veri örneği için aykırı değerleri çevrimiçi bir hesap makinesiyle hesaplayabilirsiniz.

Aykırı değerler nelerdir?

İstatistiklerde, aykırı değerler veya aykırı değerler olarak da adlandırılan aykırı değerler, veri kümesinin geri kalanından önemli ölçüde farklı olan değerlerdir. Başka bir deyişle aykırı değer, örnekteki diğer değerlerden son derece farklı olan anormal bir değerdir.

Bir örnekteki aykırı değerlerin belirlenmesi önemlidir çünkü bunlar istatistiksel ölçümlerin hesaplanmasını önemli ölçüde etkileyebilir.

Örneğin, [1, 3, 5, 2, 79, 4, 8, 6] veri serimiz varsa, 79 sayısı açıkça aykırıdır. Çünkü değeri diğer verilere göre son derece yüksektir. Bu durumda aykırı değer dahil ortalama 13,5, aykırı değer olmadan ortalama 4,14 olacaktır. Gördüğünüz gibi tek bir aykırı değer istatistiksel ölçümün sonucunu zaten önemli ölçüde etkiliyor.

 1, \ 3, \ 5, \ 2, \ 79, \ 4, \ 8, \ 6 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad \text{Valor at\'ipico: } 79

Tipik olarak aykırı değerler, verilerin geri kalanından izole edildikleri için dağılım grafiklerinde kolaylıkla ayırt edilebilirler. Aşağıdaki dağılım grafiğine bakın, aykırı değer diğer değerlerden çok ayrıdır:

aykırı değerlerin veya diğerlerinin dağılım grafiği

👉Herhangi bir veri seti için aykırı değerleri bulmak için aşağıdaki hesaplayıcıyı kullanabilirsiniz.

Aykırı değerler nasıl hesaplanır

Bir veri örneğinden aykırı değerleri hesaplamak için aşağıdaki adımlar izlenmelidir:

  1. Veri kümesinin çeyreklerini hesaplayın.
  2. Verilerin çeyrekler arası aralığını hesaplayın.
  3. Atipik değerler (aykırı değerler), aşağıdaki koşullardan birini karşılayan değerler olarak kabul edilecektir:

Aşağıdaki kutu grafiğinde , bu kritere göre grafiksel olarak gösterilen iki aykırı değeri görebilirsiniz:

kutu grafiği aykırı değerleri

Not: Verilerin aykırı değer olarak değerlendirileceği sınırları belirlemek için çeşitli kriterlerin bulunduğunu unutmayın. Bu makalede en çok kullanılanı olması nedeniyle Tukey testi kriteri referans alınmıştır.

Aykırı değerler örneği

Aykırı değerin tanımını göz önünde bulundurarak, bu bölümde bir veri serisindeki aykırı değerlerin nasıl tanımlanacağına dair pratik bir örnek göreceğiz.

  • Aşağıdaki istatistiksel veri setinden aykırı değerleri veya aykırı değerleri hesaplayın.

İlk olarak veri setinin üç çeyreğini hesaplıyoruz:

Q_1=4,06

Q_2=4,38

Q_3=4,66

Üç çeyreği bulduktan sonra çeyrekler arası aralığı, çeyrek 3 eksi çeyrek 1’i çıkararak buluruz:

IQR=Q_3-Q_1=4,66-4,06=0,6

Şimdi aykırı değerlerin belirlediği sınırları hesaplıyoruz. Bunu yapmak için yukarıdaki bölümde açıklanan formülleri kullanıyoruz:

Q_1-1,5\cdot IQR=4,06-1,5\cdot 0,6=3,16

Q_3+1,5\cdot IQR=4,66+1,5\cdot 0,6=5,56

Yani değerlerden herhangi biri 3,16’dan küçükse bu bir aykırı değerdir. Benzer şekilde, eğer bir değer 5,56’dan büyükse bu aynı zamanda bir aykırı değerdir.

Sonuç olarak, bu durumda iki uç değerimiz var çünkü 3,02, 3,16’dan küçük ve 5,71, 5,56’dan büyük.

\text{Valores at\'ipicos} =\Bigl\{3,02 \ ; \ 5,71\Bigr\}

Aykırı Değer Hesaplayıcı

Varsa aykırı değerleri hesaplamak için aşağıdaki hesap makinesine bir istatistiksel veri seti girin. Veriler bir boşlukla ayrılmalı ve ondalık ayırıcı olarak nokta kullanılarak girilmelidir.

Aykırı değerlerin nedenleri

Aykırı değerlerin birkaç olası nedeni vardır; en yaygın olanları şunlardır:

  • Ölçüm yapmak için kullanılan cihaz bozuldu veya kaza geçirdi.
  • Ölçülen parçada anormal bir nedenden dolayı kusur vardı.
  • Verilerin iletiminde veya transkripsiyonunda bir hata oluştu.
  • Bir insan hatası vardı. Alınan önlemler ne olursa olsun insan hataları tamamen kaçınılmaz değildir ve bu nedenle anormal değerler hala mevcut olabilir.

Bunlar en yaygın nedenlerdir, ancak nedenin herhangi bir şey olabileceği açıktır. Aynı şekilde çok sayıda gözlemle istatistiksel bir çalışma yapıldığında bazı aykırı değerlerin ortaya çıkmasının normal olduğu dikkate alınmalıdır.

Aykırı değerlerle ne yapmalı

Bir aykırı değerle karşılaştığımızda ortak soru onunla ne yapmamız gerektiğidir. Aykırı değerler örnekten çıkarılmalı mı?

Aykırı değerlerin her zaman ortadan kaldırılması gerektiğine inanılmaktadır çünkü bunlar, kümenin geri kalanına benzemeyen verilerdir. Ancak aykırı değerler bazı istatistiksel ölçümlerin sonuçlarını büyük ölçüde etkilese de bu onların her zaman ortadan kaldırılması gerektiği anlamına gelmez.

Genel olarak, aykırı değerlerin yalnızca anormalliğin nedeninin gerçekten haklı olduğunu bildiğimiz takdirde kaldırılması gerekir ve dolayısıyla bu aykırı değerler, üzerinde çalışılan şeyle eşleşmeyen gözlemlerdir.

Aşırı değerler istatistiksel ölçümleri daha fazla etkilediğinden, bu özellikle küçük örneklem boyutlarında önemlidir.

Örneğin, kalite kontrolü yapmak için bir ürünün bir parçasının uzunluğu ölçülüyorsa, mantıksal olarak birdenbire başka türde bir ürün ortaya çıkarsa ve aynı parça ölçülürse, ölçülen değer öncekilerden çok farklı olacak ve muhtemelen aykırı olmak. Bu durumda, nedeni bilindiğinden ve ölçülen verilerin analiz edilmesi amaçlanan popülasyonun bir parçası olmadığı bilindiğinden aykırı değer göz ardı edilebilir.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir