Was sind pearson-residuen? (definition & #038; beispiel)
Pearson-Residuen werden in einemChi-Quadrat-Unabhängigkeitstest verwendet, um die Differenz zwischen der beobachteten Zellzahl und der erwarteten Zellzahl in einer Kontingenztabelle zu analysieren.
Die Formel zur Berechnung eines Pearson-Residuums lautet:
r ij = (O ij – E ij ) / √ E ij
Gold:
- r ij : Das Pearson-Residuum für die Zelle der i- ten Spalte und der j- ten Zeile
- O ij : Der für die Zelle der i -ten Spalte und der j- ten Zeile beobachtete Wert
- E ij : Der erwartete Wert für die Zelle der i -ten Spalte und j- ten Zeile
Ein ähnliches Maß ist das standardisierte (bereinigte) Pearson-Residuum , das wie folgt berechnet wird:
r ij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )
Gold:
- r ij : Das Pearson-Residuum für die Zelle der i- ten Spalte und der j- ten Zeile
- O ij : Der für die Zelle der i -ten Spalte und der j- ten Zeile beobachtete Wert
- E ij : Der erwartete Wert für die Zelle der i -ten Spalte und j- ten Zeile
- p i+ : Die Zeilensumme dividiert durch die Gesamtsumme
- p + j : Die Spaltensumme dividiert durch die Gesamtsumme
Standardisierte Pearson-Residuen sind normalverteilt mit einem Mittelwert von 0 und einer Standardabweichung von 1. Standardisierte Pearson-Residuen mit einem Absolutwert über bestimmten Schwellenwerten (z. B. 2 oder 3) weisen auf eine mangelnde Anpassung hin.
Das folgende Beispiel zeigt, wie Pearson-Residuen in der Praxis berechnet werden.
Beispiel: Berechnung von Pearson-Residuen
Angenommen, die Forscher möchten einen Chi-Quadrat-Unabhängigkeitstest verwenden, um festzustellen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt oder nicht.
Sie beschließen, eine einfache Zufallsstichprobe von 500 Wählern zu ziehen und sie nach ihrer Präferenz für eine politische Partei zu befragen.
Die folgende Kontingenztabelle stellt die Ergebnisse der Umfrage dar:
Republikaner | Demokrat | Unabhängig | Gesamt | |
Männlich | 120 | 90 | 40 | 250 |
Weiblich | 110 | 95 | 45 | 250 |
Gesamt | 230 | 185 | 85 | 500 |
Bevor wir die Pearson-Residuen berechnen, müssen wir zunächst die erwarteten Anzahlen für jede Zelle in der Kontingenztabelle berechnen. Dazu können wir die folgende Formel verwenden:
Erwarteter Wert = (Summe der Zeilen * Summe der Spalten) / Summe der Tabelle.
Der erwartete Wert für republikanische Männer beträgt beispielsweise: (230*250) / 500 = 115 .
Wir können diese Formel wiederholen, um den erwarteten Wert für jede Tabellenzelle zu erhalten:
Republikaner | Demokrat | Unabhängig | Gesamt | |
Männlich | 115 | 92,5 | 42,5 | 250 |
Weiblich | 115 | 92,5 | 42,5 | 250 |
Gesamt | 230 | 185 | 85 | 500 |
Dann können wir das Pearson-Residuum für jede Zelle in der Tabelle berechnen.
Beispielsweise würde das Pearson-Residuum für die Zelle mit republikanischen Männern wie folgt berechnet:
- r ij = (O ij – E ij ) / √ E ij
- r ij = (120 – 115) / √ 115
- r ij = 0,466
Wir können diese Formel wiederholen, um das Pearson-Residuum für jede Zelle in der Tabelle zu erhalten:
Republikaner | Demokrat | Unabhängig | |
Männlich | 0,446 | -0,259 | -0,383 |
Weiblich | -0,446 | 0,259 | 0,383 |
Dann können wir das standardisierte Pearson-Residuum für jede Zelle in der Tabelle berechnen.
Beispielsweise würde das standardisierte Pearson-Residuum für die Zelle mit republikanischen Männern wie folgt berechnet:
- r ij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
- r ij = (120 – 115) / √ 115(1-250/500)(1-230/500)
- r ij = 0,897
Wir können diese Formel wiederholen, um das standardisierte Pearson-Residuum für jede Zelle in der Tabelle zu erhalten:
Republikaner | Demokrat | Unabhängig | |
Männlich | 0,897 | -0,463 | -0,595 |
Weiblich | -0,897 | 0,463 | 0,595 |
Wir können sehen, dass keines der standardisierten Pearson-Residuen einen absoluten Wert größer als 3 aufweist, was darauf hindeutet, dass keine der Zellen zu einem signifikanten Mangel an Anpassung beiträgt.
Wenn wir diesen Online-Rechner verwenden, um einen Chi-Quadrat-Unabhängigkeitstest durchzuführen, werden wir feststellen, dass der p-Wert des Tests 0,649198 beträgt.
Da dieser p-Wert nicht weniger als 0,05 beträgt, liegen uns keine ausreichenden Belege dafür vor, dass ein Zusammenhang zwischen Geschlecht und Parteipräferenz besteht.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie mit unterschiedlicher Statistiksoftware einen Chi-Quadrat-Unabhängigkeitstest durchführen:
Eine Einführung in den Chi-Quadrat-Unabhängigkeitstest
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in Excel durch
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in R durch
Chi-Quadrat-Test des Unabhängigkeitsrechners