Varianzanalyse (anova)

In diesem Artikel wird erklärt, was Varianzanalyse, auch ANOVA genannt, in der Statistik ist. So erfahren Sie, wie Sie eine Varianzanalyse durchführen, was die ANOVA-Tabelle ist und wie die Übung Schritt für Schritt gelöst wird. Darüber hinaus zeigt es, welche Vorannahmen bei der Durchführung einer Varianzanalyse berücksichtigt werden müssen und welche Vor- und Nachteile die ANOVA-Analyse hat.

Was ist eine Varianzanalyse (ANOVA)?

In der Statistik ist die Varianzanalyse , auch ANOVA (Analysis of Variance) genannt, eine Technik, die es Ihnen ermöglicht, die Varianzen zwischen den Mittelwerten verschiedener Stichproben zu vergleichen.

Mithilfe der Varianzanalyse (ANOVA) wird analysiert, ob zwischen den Mittelwerten von mehr als zwei Grundgesamtheiten ein Unterschied besteht. Somit können wir mithilfe der Varianzanalyse bestimmen, ob die Populationsmittelwerte von zwei oder mehr Gruppen unterschiedlich sind, indem wir die Variabilität zwischen den Stichprobenmittelwerten analysieren.

Die Nullhypothese der Varianzanalyse lautet daher, dass die Mittelwerte aller analysierten Gruppen gleich sind. Während die Alternativhypothese besagt, dass mindestens eines der Mittel unterschiedlich ist.

\begin{cases}H_0: \mu_1=\mu_2=\ldots=\mu_k=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=1,2,\ldots, k\end{cases}

Daher ist die Varianzanalyse besonders nützlich, um die Mittelwerte von mehr als zwei Gruppen zu vergleichen, da Sie mit dieser Art der Analyse die Mittelwerte aller Gruppen gleichzeitig untersuchen können, anstatt die Mittelwerte paarweise zu vergleichen. Im Folgenden werden wir sehen, welche Vor- und Nachteile die Varianzanalyse hat.

ANOVA-Tabelle

Die Varianzanalyse wird in einer Tabelle namens ANOVA-Tabelle zusammengefasst, deren Formeln wie folgt lauten:

Varianzanalyse oder ANOVA-Formeln

Gold:

  • n_i

    ist die Stichprobengröße i.

  • N

    ist die Gesamtzahl der Beobachtungen.

  • k

    ist die Anzahl der verschiedenen Gruppen in der Varianzanalyse.

  • y_{ij}

    ist der Wert j der Gruppe i.

  • \overline{y}_{i}

    ist der Mittelwert der Gruppe i.

  • \overline{y}

    Dies ist der Durchschnitt aller analysierten Daten.

Beispiel einer Varianzanalyse (ANOVA)

Um das Konzept der ANOVA vollständig zu verstehen, sehen wir uns an, wie man eine Varianzanalyse durchführt, indem man ein Beispiel Schritt für Schritt löst.

  • Es wird eine statistische Studie durchgeführt, um die von vier Schülern in drei verschiedenen Fächern (A, B und C) erzielten Ergebnisse zu vergleichen. In der folgenden Tabelle sind die von jedem Schüler bei einem Test erzielten Ergebnisse mit einer Höchstpunktzahl von 20 aufgeführt. Führen Sie eine Varianzanalyse durch, um die von jedem Schüler in jedem Fach erzielten Ergebnisse zu vergleichen.

Die Nullhypothese dieser Varianzanalyse ist, dass die Mittelwerte der Ergebnisse der drei Probanden gleich sind. Andererseits besagt die Nullhypothese, dass einige dieser Mittelwerte unterschiedlich sind.

\begin{cases}H_0: \mu_A=\mu_B=\mu_C=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=A, B, C\end{cases}

Um die Varianzanalyse durchzuführen, müssen zunächst der Mittelwert jedes Subjekts und der Gesamtmittelwert der Daten berechnet werden:

\overline{y}_A=\cfrac{14+12+14+10}{4}=12,5

\overline{y}_B=\cfrac{13+14+10+14}{4}=12,75

\overline{y}_C=\cfrac{19+17+16+19}{4}=17,75

\overline{y}=\cfrac{14+12+14+10+13+14+10+14+19+17+16+19}{12}=14,33

Sobald wir den Wert der Mittelwerte kennen, berechnen wir die Summen der Quadrate mithilfe der oben gezeigten Formeln der Varianzanalyse (ANOVA):

\begin{aligned}\displaystyle SS_F&=\sum_{i=1}^k n_i(\overline{y}_i-\overline{y})^2\\[2ex] SS_F&= 4\cdot (12,5-14,33)^2+4\cdot (12,75-14,33)^2+4\cdot (17,75-14,33)^2\\[2ex] SS_F&=70,17\end{aligned}

\begin{aligned}\displaystyle SS_E=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y}_i)^2\\[2ex] \displaystyle SS_E=\ &(14-12,5)^2+(12-12,5)^2+(14-12,5)^2+(10-12,5)^2+\\&+(13-12,75)^2+(14-12,75)^2+(10-12,75)^2+(14-12,75)^2+\\&+(19-17,75)^2+(17-17,75)^2+(16-17,75)^2+(19-17,75)^2\\[2ex] SS_E=\ &28,50\end{aligned}

\begin{aligned}\displaystyle SS_T=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y})^2\\[2ex] \displaystyle SS_T= \ &(14-14,33)^2+(12-14,33)^2+(14-14,33)^2+(10-14,33)^2+\\&+(13-14,33)^2+(14-14,33)^2+(10-14,33)^2+(14-14,33)^2+\\&+(19-14,33)^2+(17-14,33)^2+(16-14,33)^2+(19-14,33)^2\\[2ex] SS_T= \ &98,67\end{aligned}

Dann bestimmen wir die Freiheitsgrade des Faktors, des Fehlers und der Summe:

GL_F=k-1=3-1=2

GL_E=N-k=12-3=9

GL_F=N-1=12-1=11

Wir berechnen nun die mittleren quadratischen Fehler, indem wir die Summen der Quadrate des Faktors und des Fehlers durch ihre jeweiligen Freiheitsgrade dividieren:

MSE_F=\cfrac{SS_F}{GL_F}=\cfrac{70,17}{2}=35,08

MSE_R=\cfrac{SS_R}{GL_R}=\cfrac{28,50}{9}=3,17

Und schließlich berechnen wir den Wert der F-Statistik, indem wir die beiden im vorherigen Schritt berechneten Fehler dividieren:

F=\cfrac{MSE_F}{MSE_R}=\cfrac{35,09}{3,17}=11,08

Kurz gesagt würde die ANOVA-Tabelle für die Beispieldaten so aussehen:

Beispiel einer Varianzanalyse (ANOVA)

Nachdem alle Werte der ANOVA-Tabelle berechnet wurden, müssen nur noch die erhaltenen Ergebnisse interpretiert werden. Dazu müssen wir die Wahrscheinlichkeit ermitteln, in einer Snedecor-F-Verteilung mit den entsprechenden Freiheitsgraden einen Wert zu erhalten, der größer als die F-Statistik ist, d. h. wir müssen den p-Wert des Tests bestimmen:

P[F>11,08]=0,004″ title=“Rendered by QuickLaTeX.com“ height=“18″ width=“172″ style=“vertical-align: -5px;“></p>
</p>
<p> Wenn wir also ein Signifikanzniveau von α=0,05 (das häufigste) annehmen, müssen wir die Nullhypothese ablehnen und die Alternativhypothese akzeptieren, da der p-Wert des Tests niedriger als das Signifikanzniveau ist. Dies bedeutet, dass sich zumindest einige Mittelwerte der untersuchten Gruppen von anderen unterscheiden.</p>
</p>
<p class=0,004 < 0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \text{Se rechaza } H_0

Es ist zu beachten, dass es derzeit mehrere Computerprogramme gibt, die eine Varianzanalyse in nur wenigen Sekunden durchführen können. Allerdings ist es auch wichtig, die Theorie hinter den Berechnungen zu kennen.

Annahmen der Varianzanalyse (ANOVA)

Um eine Varianzanalyse (ANOVA) durchführen zu können, müssen folgende Bedingungen erfüllt sein:

  • Unabhängigkeit : Die beobachteten Werte sind unabhängig voneinander. Eine Möglichkeit, die Unabhängigkeit von Beobachtungen sicherzustellen, besteht darin, dem Stichprobenverfahren Zufälligkeit hinzuzufügen.
  • Homoskedastizität : Die Varianzen müssen homogen sein, d. h. die Variabilität der Residuen ist konstant.
  • Normalität : Die Residuen sollten normalverteilt sein, d. h. sie sollten einer Normalverteilung folgen.
  • Kontinuität : Die abhängige Variable muss kontinuierlich sein.

Arten der Varianzanalyse (ANOVA)

Es gibt drei Arten der Varianzanalyse (ANOVA) :

  • Einfaktorielle Varianzanalyse (einfaktorielle ANOVA) : Bei der Varianzanalyse gibt es nur einen Faktor, dh es gibt nur eine unabhängige Variable.
  • Zwei-Wege-Varianzanalyse (Zwei-Wege-ANOVA) : Die Varianzanalyse hat zwei Faktoren, sodass zwei unabhängige Variablen und die Wechselwirkung zwischen ihnen analysiert werden.
  • Multivariate Varianzanalyse (MANOVA) : Bei der Varianzanalyse gibt es mehr als eine abhängige Variable. Das Ziel besteht darin, festzustellen, ob die unabhängigen Variablen ihren Wert ändern, wenn die abhängigen Variablen variieren.

Vor- und Nachteile der Varianzanalyse (ANOVA)

Abschließend werden wir sehen, wann es für uns sinnvoll ist, die Varianzanalyse zu verwenden, und auch, wo die Grenzen dieser Art der statistischen Analyse liegen.

Der Hauptvorteil der Varianzanalyse (ANOVA) besteht darin, dass sie den gleichzeitigen Vergleich von mehr als zwei Gruppen ermöglicht. Im Gegensatz zum T-Test , bei dem Sie nur den Mittelwert einer oder zweier Stichproben analysieren können, wird die Varianzanalyse verwendet, um zu bestimmen, ob mehrere Populationen denselben Mittelwert haben oder nicht.

Die Varianzanalyse sagt uns jedoch nicht, welche Studiengruppe einen anderen Mittelwert hat, sondern nur, ob es deutlich unterschiedliche Mittelwerte gibt oder ob alle Mittelwerte ähnlich sind.

Ein weiterer Nachteil der Varianzanalyse besteht darin, dass vier vorherige Annahmen (siehe oben) erfüllt sein müssen, um die ANOVA-Analyse durchzuführen, andernfalls könnten die gezogenen Schlussfolgerungen falsch sein. Daher sollte immer überprüft werden, ob der statistische Datensatz diese vier Anforderungen erfüllt.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert