P değerlerinin ve istatistiksel anlamlılığın açıklaması
İstatistiklerde p değerleri , t testleri, ki-kare testleri, regresyon analizi, ANOVA’lar ve diğer çeşitli istatistiksel yöntemler için hipotez testlerinde yaygın olarak kullanılır.
Bu kadar yaygın olmalarına rağmen insanlar çoğu zaman p değerlerini yanlış yorumluyor ve bu da bir analizin veya çalışmanın sonuçlarını yorumlarken hatalara yol açabiliyor.
Bu makalede p değerlerinin nasıl anlaşılacağı ve yorumlanacağı net ve pratik bir şekilde açıklanmaktadır.
Hipotez testi
P değerlerini anlamak için öncelikle hipotez testi kavramını anlamamız gerekir.
Test hipotezi, bir hipotezi reddetmek veya reddetmek için kullandığımız resmi bir istatistiksel testtir. Örneğin, yeni bir ilacın, yöntemin veya prosedürün mevcut bir ilaç, yöntem veya prosedüre göre belirli avantajlara sahip olduğunu varsayabiliriz.
Bunu test etmek için boş ve alternatif hipotez kullandığımız bir hipotez testi yapabiliriz:
Boş Hipotez – Yeni yöntemle eski yöntem arasında hiçbir etki veya fark yoktur.
Alternatif Hipotez – Yeni yöntemle eski yöntem arasında bir etki veya fark vardır.
Bir p değeri, örnek veriler göz önüne alındığında sıfır hipotezinin ne kadar güvenilir olduğunu gösterir. Spesifik olarak, sıfır hipotezinin doğru olduğunu varsayarsak, p değeri bize en azından örnek verilerde gerçekte gözlemlediğimiz kadar büyük bir etki elde etme olasılığını söyler.
Bir hipotez testinin p değeri yeterince düşükse sıfır hipotezini reddedebiliriz. Spesifik olarak, hipotez testi yaptığımızda baştan bir anlamlılık düzeyi seçmemiz gerekir. Anlamlılık düzeyleri için ortak seçenekler 0,01, 0,05 ve 0,10’dur.
P değerleri anlamlılık seviyemizin altındaysa sıfır hipotezini reddedebiliriz.
Aksi takdirde, p değeri anlamlılık seviyemize eşit veya ondan büyükse sıfır hipotezini reddetmede başarısız oluruz.
P değeri nasıl yorumlanır?
Bir p değerinin klasik tanımı şöyledir:
P değeri, sıfır hipotezinin doğru olduğu göz önüne alındığında, en az örnek istatistiğiniz kadar uç bir örnek istatistiği gözlemleme olasılığıdır.
Örneğin, bir fabrikanın ortalama ağırlığı 200 pound olan lastikler ürettiğini iddia ettiğini varsayalım. Bir denetçi, bu tesiste üretilen lastiklerin gerçek ortalama ağırlığının 200 pound farklı olduğunu öne sürüyor. Böylece bir hipotez testi yapar ve testin p değerinin 0,04 olduğunu bulur. Bu p değerini şu şekilde yorumlayabilirsiniz:
Fabrika gerçekten ortalama ağırlığı 200 pound olan lastikler üretiyorsa, tüm denetimlerin %4’ü, rastgele örnekleme hatası nedeniyle numunede gözlemlenen etkiyi veya daha fazlasını elde edecektir. Bu bize, fabrikanın ortalama ağırlığı 200 pound olan lastikleri gerçekten üretmesi durumunda denetçi tarafından elde edilen örnek verilerin elde edilmesinin oldukça nadir olacağını söylüyor.
Bu hipotez testinde kullanılan önem düzeyine bağlı olarak denetçi, bu tesiste üretilen lastiklerin gerçek ortalama ağırlığının gerçekte 200 pound olduğuna ilişkin sıfır hipotezini muhtemelen reddedecektir. Denetim sırasında elde ettiği veri örnekleri sıfır hipoteziyle pek tutarlı değil.
Bir P değeri nasıl yorumlanmamalı?
P değerleri hakkındaki en büyük yanılgı, gerçek bir sıfır hipotezini (Tip I hata olarak adlandırılır) reddederek hata yapma olasılığına eşit olmalarıdır.
P değerlerinin hata oranıyla eşleşmemesinin iki ana nedeni vardır:
1. P değerleri, sıfır hipotezinin doğru olduğu ve örnek veriler ile sıfır hipotezi arasındaki farkın sadece şansa bağlı olduğu varsayımına dayanarak hesaplanır. Yani p değerleri, hesaplamalar açısından %100 doğru olduğundan sıfır değerinin doğru veya yanlış olma olasılığını size söyleyemez.
2. Düşük bir p değeri, örnek verilerinizin sıfırın doğru olduğunu varsayma ihtimalinin düşük olduğunu gösterse de, bir p değeri size aşağıdaki durumlardan hangisinin daha muhtemel olduğunu söyleyemez:
- Sıfır değeri yanlış
- Sıfır değeri doğru ancak tuhaf bir örneğiniz var
Önceki örnekle karşılaştırıldığında, p değerini yorumlamanın doğru ve yanlış yolu şu şekildedir:
- Doğru yorum: Fabrikanın ortalama ağırlığı 200 pound olan lastikler ürettiğini varsayarsak, numunenizde gözlemlediğiniz farkı veya rastgele örnekleme nedeniyle denetimlerin %4’ünde daha uç bir farkı elde edersiniz.
- Yanlış yorum: Sıfır hipotezini reddederseniz hata yapma olasılığınız %4’tür.
P değerlerinin yorumlanmasına örnekler
Aşağıdaki örnekler, hipotez testi bağlamında p değerlerini yorumlamanın doğru yollarını göstermektedir.
örnek 1
Bir telefon şirketi müşterilerinin %90’ının hizmetlerinden memnun olduğunu iddia ediyor. Bu iddiayı test etmek için bağımsız bir araştırmacı, 200 müşteriden oluşan basit rastgele bir örneklem topladı ve onlara hizmetlerinden memnun olup olmadıklarını sordu ve %85’i evet dedi. Bu veri örneğiyle ilişkili p değeri 0,018 olarak bulundu.
P değerinin doğru yorumlanması: Müşterilerin %90’ının gerçekten hizmetlerinden memnun olduğunu varsayarsak, araştırmacı kendi örnekleminde gözlemlediği farkı veya rastgele örnekleme nedeniyle denetimlerin %1,8’inde daha uç bir farkı elde edecektir. hata. .
Örnek 2
Bir şirket telefonlar için yeni bir pil icat etti. Şirket, bu yeni pilin eski pilden en az 10 dakika daha uzun süre çalışacağını iddia ediyor. Bu iddiayı test etmek için bir araştırmacı 80 yeni pil ve 80 eski pilden oluşan basit rastgele bir örnek alır. Yeni piller 12 dakikalık standart sapmayla ortalama 120 dakika dayanırken, eski piller 15 dakikalık standart sapmayla ortalama 115 dakika çalışır. Popülasyon ortalamalarındaki fark testinden elde edilen p değeri 0,011’dir.
P değerinin doğru yorumlanması: Yeni pilin eski pille aynı süre veya daha kısa süre çalıştığını varsayarsak, araştırmacı, rastgele örnekleme hatası nedeniyle çalışmaların %1,1’inde gözlemlenen farkı veya daha uç bir farkı elde edecektir.