P değeri vs. alfa: fark nedir?
Öğrencilerin istatistikte sıklıkla karıştırdığı iki terim p değeri ve alfadır .
Her iki terim de, bir hipotezi reddetmek veya reddetmek için kullandığımız resmi istatistiksel testler olan hipotez testinde kullanılır.
Örneğin, yeni bir hapın hastaların kan basıncını mevcut standart hapa göre daha fazla düşürdüğünü varsaydığımızı varsayalım.
Bunu test etmek için aşağıdaki boş ve alternatif hipotezleri tanımladığımız bir hipotez testi yapabiliriz:
Boş hipotez: Yeni hap ile standart hap arasında hiçbir fark yoktur.
Alternatif hipotez: Yeni hap ile standart hap arasında fark var .
Sıfır hipotezinin doğru olduğunu varsayarsak, testin p değeri bize en azından örnek verilerde gerçekte gözlemlediğimiz kadar büyük bir etki elde etme olasılığını söyler.
Örneğin, hipotez testi için p değerinin 0,02 olduğunu bulduğumuzu varsayalım.
Bu p değerini şu şekilde yorumlayabiliriz: Eğer yeni hap ile standart hap arasında gerçekten bir fark yoksa, bu hipotez testini uyguladığımız seferlerin %2’sinde veri örneğinde gözlemlenen etkiyi elde edeceğiz veya daha fazlası, sadece rastgele örnekleme hatası nedeniyle.
Bu bize, yeni hap ile standart hap arasında gerçekten bir fark olmasaydı, gerçekte yaptığımız veri örneklerini elde etmenin oldukça nadir olacağını söylüyor.
Dolayısıyla sıfır hipotezini reddetme ve yeni hap ile standart hap arasında bir fark olduğu sonucuna varma eğiliminde oluruz.
Ancak p değerimizin sıfır hipotezini reddedecek kadar düşük olup olmadığını belirlemek için hangi eşiği kullanmalıyız?
İşte alfanın devreye girdiği yer burası!
Alfa seviyesi
Bir hipotez testinin alfa düzeyi , p değerimizin sıfır hipotezini reddedecek kadar düşük olup olmadığını belirlemek için kullandığımız eşiktir. Genellikle 0,05’e ayarlanır, ancak bazen 0,01 veya 0,10’a da ayarlanır.
Örneğin, bir hipotez testinin alfa düzeyini 0,05’e ayarlayıp 0,02’lik bir p değeri elde edersek, p değeri alfa düzeyinden küçük olduğundan sıfır hipotezini reddederiz. Böylece alternatif hipotezin doğru olduğunu söylemek için yeterli kanıtımız olduğu sonucuna varırız.
Alfa seviyesinin aynı zamanda gerçek bir sıfır hipotezinin yanlışlıkla reddedilme olasılığını da tanımladığını belirtmek önemlidir.
Örneğin, yeni bir hap ile mevcut hap arasında kan basıncındaki ortalama düşüş açısından bir fark olup olmadığını test etmek istediğimizi varsayalım. Ve iki hap arasında hiçbir fark olmadığını varsayalım.
Bir hipotez testinin alfa düzeyini 0,05 olarak ayarlarsak, bu, hipotez test sürecini birkaç kez tekrarlarsak, vakaların yaklaşık %5’inde sıfır hipotezini yanlışlıkla reddetmeyi bekleyeceğimiz anlamına gelir. testler.
Alfa seviyesi nasıl seçilir
Daha önce de belirtildiği gibi, bir hipotez testinin alfa düzeyi için en yaygın seçim 0,05’tir. Ancak hatalı çıkarımların ciddi sonuçlara yol açtığı bazı durumlarda alfa düzeyini daha da aşağıya, belki 0,01’e ayarlayabiliriz.
Örneğin tıp alanında araştırmacıların alfa düzeyini 0,01 olarak ayarlaması yaygındır çünkü bir hipotez testinin sonuçlarının güvenilir olduğundan emin olmak isterler.
Tersine, pazarlama gibi alanlarda alfa düzeyini 0,10 gibi daha yükseğe ayarlamak daha yaygın olabilir çünkü hata yapmanın sonuçları ne ölüm ne de ölümdür.
Bir testin alfa düzeyinin artırılmasının anlamlı bir test sonucu bulma şansını artıracağı, ancak aynı zamanda gerçek bir sıfır hipotezini yanlışlıkla reddetme şansımızı da artıracağı unutulmamalıdır.
Özet:
İşte bu makalede öğrendiklerimiz:
1. Bir p değeri bize en azından örnek verilerde gerçekte gözlemlediğimiz kadar büyük bir etki elde etme olasılığını söyler.
2. Alfa düzeyi, doğru bir sıfır hipotezinin yanlışlıkla reddedilme olasılığıdır.
3. Bir hipotez testinin p değeri alfa seviyesinden küçükse sıfır hipotezini reddedebiliriz.
4. Bir testin alfa düzeyini artırmak, anlamlı bir test sonucu bulma şansımızı artırır, ancak aynı zamanda gerçek bir sıfır hipotezini yanlışlıkla reddetme şansımızı da artırır.
Ek kaynaklar
Hipotez Testine Giriş
Sıfır Hipotezi Nasıl Yazılır (5 Örnek)
Sol ve Sol Nasıl Tanımlanır? Doğru Test