Çeyrekler arası aralık ve standart sapma: fark nedir?
Çeyrekler arası aralık ve standart sapma, bir veri kümesindeki değerlerin dağılımını ölçmenin iki yoludur.
Bu eğitimde her metriğin kısa bir açıklamasının yanı sıra ikisi arasındaki benzerlikler ve farklılıklar sunulmaktadır.
Çeyrekler arası aralık
Bir veri setinin çeyrekler arası aralığı (IQR), birinci çeyrek (25. yüzdelik dilim) ile üçüncü çeyreklik (75. yüzdelik dilim) arasındaki farktır. Değerlerin ortalama %50’sinin dağılımını ölçer.
IQR = Ç3 – Ç1
Örneğin aşağıdaki veri setine sahip olduğumuzu varsayalım:
Veri seti: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Çeyrekler arası aralık hesaplayıcıya göre bu veri kümesi için çeyrekler arası aralık (IQR) şu şekilde hesaplanır:
- Ç1: 12
- Ç3: 26,5
- IQR = Ç3 – Ç1 = 14,5
Bu bize veri kümesindeki değerlerin ortadaki %50’sinin 14,5 sapmaya sahip olduğunu söyler.
Standart sapma
Bir veri setinin standart sapması, bireysel değerlerin ortalama değerden tipik sapmasını ölçmenin bir yoludur. Aşağıdaki şekilde hesaplanır:
s = √(Σ(x ben – x ) 2 / (n-1))
Örneğin aşağıdaki veri setine sahip olduğumuzu varsayalım:
Veri seti: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Bu veri setinin standart sapmasının 9,25 olduğunu bulmak için hesap makinesi kullanabiliriz. Bu bize tipik değerin ortalamadan ne kadar uzakta olduğuna dair bir fikir verir.
Benzerlikler ve farklılıklar
Çeyrekler arası aralık ve standart sapma aşağıdaki benzerliği paylaşır:
- Her iki ölçüm de bir veri kümesindeki değerlerin dağılımını ölçer.
Bununla birlikte, çeyrekler arası aralık ve standart sapma aşağıdaki temel farka sahiptir:
- Çeyrekler arası aralık (IQR) aşırı aykırı değerlerden etkilenmez. Örneğin, bir veri kümesindeki aşırı küçük veya aşırı büyük bir değer, IQR hesaplamasını etkilemeyecektir çünkü IQR, veri kümesinin yalnızca 25. yüzdelik ve 75. yüzdelik değerlerini kullanır.
- Standart sapma aşırı aykırı değerlerden etkilenir . Örneğin, bir veri setindeki aşırı büyük bir değer, standart sapmanın formülünde bir veri setindeki her değeri kullanması nedeniyle çok daha büyük bir standart sapmaya neden olacaktır.
Her biri ne zaman kullanılmalı
Aşırı uç değerler olduğunda bir veri kümesindeki değerlerin dağılımını ölçmek için çeyrekler arası aralığı kullanmalısınız.
Tersine, aşırı aykırı değerler olmadığında değerlerin dağılımını ölçmek için standart sapmayı kullanmalısınız.
Nedenini açıklamak için aşağıdaki veri kümesini göz önünde bulundurun:
Veri seti: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Makalenin başlarında bu veri kümesi için aşağıdaki ölçümleri hesaplamıştık:
- IQR: 14,5
- Standart sapma: 9,25
Ancak veri kümesinin aşırı uç değerlere sahip olup olmadığını göz önünde bulundurun:
Veri seti: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Bu veri kümesi için aşağıdaki ölçümleri bulmak amacıyla bir hesap makinesi kullanabiliriz:
- IQR: 15
- Standart sapma: 85.02
Bir aykırı değer mevcut olduğunda çeyrekler arası aralığın çok az değiştiğini, standart sapmanın ise 9,25’ten 85,02’ye çıktığını unutmayın.
Ek kaynaklar
Merkezi eğilim ölçüleri: tanım ve örnekler
Dağılım ölçüleri: tanım ve örnekler
Çeyrekler arası aralığı kullanarak aykırı değerler nasıl bulunur?