Varyans analizi (anova)

Bu makale istatistikte ANOVA olarak da bilinen varyans analizinin ne olduğunu açıklamaktadır. Böylece varyans analizinin nasıl yapılacağını, ANOVA tablosunun ne olduğunu ve adım adım çözülmüş bir alıştırmayı keşfedeceksiniz. Ayrıca varyans analizi gerçekleştirmek için uyulması gereken ön varsayımların neler olduğunu ve son olarak ANOVA analizinin avantaj ve dezavantajlarının neler olduğunu gösterir.

Varyans analizi (ANOVA) nedir?

İstatistikte, ANOVA (Varyans Analizi) olarak da adlandırılan varyans analizi , farklı örneklerin ortalamaları arasındaki varyansları karşılaştırmanıza olanak tanıyan bir tekniktir.

Varyans analizi (ANOVA), ikiden fazla popülasyonun ortalamaları arasında fark olup olmadığını analiz etmek için kullanılır. Böylece varyans analizi, örnek ortalamaları arasındaki değişkenliği analiz ederek iki veya daha fazla grubun popülasyon ortalamalarının farklı olup olmadığını belirlememize olanak tanır.

Dolayısıyla varyans analizinin sıfır hipotezi, analiz edilen tüm grupların ortalamalarının eşit olduğu yönündedir. Alternatif hipotez, araçlardan en az birinin farklı olduğunu savunur.

\begin{cases}H_0: \mu_1=\mu_2=\ldots=\mu_k=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=1,2,\ldots, k\end{cases}

Dolayısıyla, varyans analizi özellikle ikiden fazla grubun ortalamalarını karşılaştırmak için kullanışlıdır, çünkü bu tür bir analizle ortalamaları çiftler halinde karşılaştırmak yerine tüm grupların ortalamalarını aynı anda inceleyebilirsiniz. Aşağıda varyans analizinin avantaj ve dezavantajlarının neler olduğunu göreceğiz.

ANOVA tablosu

Varyans analizi, formülleri aşağıdaki gibi olan ANOVA tablosu adı verilen bir tabloda özetlenmiştir:

varyans analizi veya ANOVA formülleri

Altın:

  • n_i

    örneklem büyüklüğü i’dir.

  • N

    toplam gözlem sayısıdır.

  • k

    varyans analizindeki farklı grupların sayısıdır.

  • y_{ij}

    i grubunun j değeridir.

  • \overline{y}_{i}

    i grubunun ortalamasıdır.

  • \overline{y}

    Bu, analiz edilen tüm verilerin ortalamasıdır.

Varyans Analizi Örneği (ANOVA)

ANOVA kavramını anlamayı tamamlamak için adım adım bir örnek çözerek varyans analizinin nasıl yapıldığını görelim.

  • Dört öğrencinin üç farklı dersten (A, B ve C) aldıkları puanları karşılaştırmak için istatistiksel bir çalışma yapılır. Aşağıdaki tablo, her öğrencinin maksimum 20 puana sahip bir testte aldığı puanları detaylandırmaktadır. Her öğrencinin her derste aldığı puanları karşılaştırmak için bir varyans analizi yapın.

Bu varyans analizinin sıfır hipotezi, üç deneğin puanlarının ortalamalarının eşit olmasıdır. Öte yandan sıfır hipotezi bu yollardan bazılarının farklı olduğu yönündedir.

\begin{cases}H_0: \mu_A=\mu_B=\mu_C=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=A, B, C\end{cases}

Varyans analizini gerçekleştirmek için yapılacak ilk şey, her bir konunun ortalamasını ve verilerin toplam ortalamasını hesaplamaktır:

\overline{y}_A=\cfrac{14+12+14+10}{4}=12,5

\overline{y}_B=\cfrac{13+14+10+14}{4}=12,75

\overline{y}_C=\cfrac{19+17+16+19}{4}=17,75

\overline{y}=\cfrac{14+12+14+10+13+14+10+14+19+17+16+19}{12}=14,33

Ortalamaların değerini öğrendikten sonra, yukarıda görülen varyans analizi (ANOVA) formüllerini kullanarak kareler toplamlarını hesaplarız:

\begin{aligned}\displaystyle SS_F&=\sum_{i=1}^k n_i(\overline{y}_i-\overline{y})^2\\[2ex] SS_F&= 4\cdot (12,5-14,33)^2+4\cdot (12,75-14,33)^2+4\cdot (17,75-14,33)^2\\[2ex] SS_F&=70,17\end{aligned}

\begin{aligned}\displaystyle SS_E=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y}_i)^2\\[2ex] \displaystyle SS_E=\ &(14-12,5)^2+(12-12,5)^2+(14-12,5)^2+(10-12,5)^2+\\&+(13-12,75)^2+(14-12,75)^2+(10-12,75)^2+(14-12,75)^2+\\&+(19-17,75)^2+(17-17,75)^2+(16-17,75)^2+(19-17,75)^2\\[2ex] SS_E=\ &28,50\end{aligned}

\begin{aligned}\displaystyle SS_T=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y})^2\\[2ex] \displaystyle SS_T= \ &(14-14,33)^2+(12-14,33)^2+(14-14,33)^2+(10-14,33)^2+\\&+(13-14,33)^2+(14-14,33)^2+(10-14,33)^2+(14-14,33)^2+\\&+(19-14,33)^2+(17-14,33)^2+(16-14,33)^2+(19-14,33)^2\\[2ex] SS_T= \ &98,67\end{aligned}

Daha sonra faktörün serbestlik derecelerini, hatayı ve toplamı belirleriz:

GL_F=k-1=3-1=2

GL_E=N-k=12-3=9

GL_F=N-1=12-1=11

Şimdi, faktörün ve hatanın karelerinin toplamını ilgili serbestlik derecelerine bölerek ortalama karesel hataları hesaplıyoruz:

MSE_F=\cfrac{SS_F}{GL_F}=\cfrac{70,17}{2}=35,08

MSE_R=\cfrac{SS_R}{GL_R}=\cfrac{28,50}{9}=3,17

Ve son olarak bir önceki adımda hesapladığımız iki hatayı bölerek F istatistiğinin değerini hesaplıyoruz:

F=\cfrac{MSE_F}{MSE_R}=\cfrac{35,09}{3,17}=11,08

Kısaca örnek verilere ilişkin ANOVA tablosu şu şekilde görünecektir:

varyans analizi örneği (ANOVA)

ANOVA tablosundaki tüm değerler hesaplandıktan sonra geriye sadece elde edilen sonuçların yorumlanması kalıyor. Bunu yapmak için, karşılık gelen serbestlik derecelerine sahip bir Snedecor F dağılımında F istatistiğinden daha büyük bir değer elde etme olasılığını bulmamız gerekir, yani testin p değerini belirlememiz gerekir:

P[F>11,08]=0,004″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”172″ style=”vertical-align: -5px;”></p>
</p>
<p> Bu nedenle, anlamlılık düzeyini α=0,05 (en yaygın olanı) alırsak, testin p değeri anlamlılık düzeyinden düşük olduğundan sıfır hipotezini reddetmeli ve alternatif hipotezi kabul etmeliyiz. Bu, incelenen grupların araçlarının en azından bazılarının diğerlerinden farklı olduğu anlamına gelir.</p>
</p>
<p class=0,004 < 0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \text{Se rechaza } H_0

Şu anda sadece birkaç saniye içinde varyans analizi yapabilen birçok bilgisayar programının mevcut olduğunu belirtmek gerekir. Ancak hesaplamaların arkasındaki teoriyi bilmek de önemlidir.

Varyans Analizi Varsayımları (ANOVA)

Varyans analizi (ANOVA) gerçekleştirmek için aşağıdaki koşulların karşılanması gerekir:

  • Bağımsızlık : Gözlenen değerler birbirinden bağımsızdır. Gözlemlerin bağımsızlığını sağlamanın bir yolu örnekleme sürecine rastgelelik eklemektir.
  • Homoskedastisite : Varyanslarda homojenlik olmalıdır, yani artıkların değişkenliği sabittir.
  • Normallik : Artıkların normal dağılması, yani normal dağılım izlemesi gerekmektedir.
  • Süreklilik : Bağımlı değişken sürekli olmalıdır.

Varyans Analizi Türleri (ANOVA)

Üç tür varyans analizi (ANOVA) vardır:

  • Tek yönlü varyans analizi (one-way ANOVA) : Varyans analizinde tek faktör yani tek bağımsız değişken vardır.
  • İki yönlü varyans analizi (two-way ANOVA) : Varyans analizinde iki faktör bulunduğundan iki bağımsız değişken ve aralarındaki etkileşim analiz edilir.
  • Çok Değişkenli Varyans Analizi (MANOVA) : Varyans analizinde birden fazla bağımlı değişken bulunur. Amaç, bağımlı değişkenler değiştiğinde bağımsız değişkenlerin değerlerinin değişip değişmediğini belirlemektir.

Varyans Analizinin (ANOVA) Avantajları ve Dezavantajları

Son olarak varyans analizini ne zaman kullanmamızın uygun olduğunu ve ayrıca bu tür istatistiksel analizin sınırlarının neler olduğunu göreceğiz.

Varyans analizinin (ANOVA) temel avantajı, aynı anda ikiden fazla grubun karşılaştırılmasına olanak sağlamasıdır. Yalnızca bir veya iki örneğin ortalamasını analiz edebildiğiniz t testinin aksine, varyans analizi, birden fazla popülasyonun aynı ortalamaya sahip olup olmadığını belirlemek için kullanılır.

Ancak varyans analizi bize hangi çalışma grubunun farklı bir ortalamaya sahip olduğunu söylemez; yalnızca önemli ölçüde farklı ortalamaların olup olmadığını veya tüm ortalamaların benzer olup olmadığını bilmemizi sağlar.

Benzer şekilde, varyans analizinin diğer bir dezavantajı, ANOVA analizini gerçekleştirmek için önceki dört varsayımın (yukarıya bakın) karşılanması gerektiğidir, aksi takdirde varılan sonuçlar yanlış olabilir. Bu nedenle istatistiksel veri setinin bu dört gereksinimi karşıladığı her zaman doğrulanmalıdır.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir