Wat zijn pearson-residuen? (definitie & #038; voorbeeld)
Pearson-residuen worden gebruikt in een chikwadraattest van onafhankelijkheid om het verschil tussen het waargenomen celaantal en het verwachte celaantal in een contingentietabel te analyseren.
De formule voor het berekenen van een Pearson-residu is:
rij = (O ij – E ij ) / √ E ij
Goud:
- rij : Het Pearson-residu voor de cel van de i -de kolom en de j- de rij
- O ij : De waargenomen waarde voor de cel van de i -de kolom en de j- de rij
- E ij : De verwachte waarde voor de cel van de i -de kolom en de j- de rij
Een soortgelijke maatstaf is het gestandaardiseerde (aangepaste) Pearson-residu , dat als volgt wordt berekend:
rij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )
Goud:
- rij : Het Pearson-residu voor de cel van de i -de kolom en de j- de rij
- O ij : De waargenomen waarde voor de cel van de i -de kolom en de j- de rij
- E ij : De verwachte waarde voor de cel van de i -de kolom en de j- de rij
- p i+ : Het rijtotaal gedeeld door het eindtotaal
- p + j : Het kolomtotaal gedeeld door het eindtotaal
Gestandaardiseerde Pearson-residuen zijn normaal verdeeld met een gemiddelde van 0 en een standaarddeviatie van 1. Elk gestandaardiseerd Pearson-residu met een absolute waarde boven bepaalde drempels (bijvoorbeeld 2 of 3) duidt op een gebrek aan fit.
Het volgende voorbeeld laat zien hoe u Pearson-residuen in de praktijk kunt berekenen.
Voorbeeld: Berekening van Pearson-residuen
Stel dat de onderzoekers een chi-kwadraattoets voor onafhankelijkheid willen gebruiken om te bepalen of gender wel of niet geassocieerd is met voorkeur voor een politieke partij.
Ze besluiten een eenvoudige willekeurige steekproef van 500 kiezers te nemen en hen te vragen naar hun politieke partijvoorkeur.
De volgende kruistabel geeft de resultaten van het onderzoek weer:
Republikeins | Democraat | Onafhankelijk | Totaal | |
Mannelijk | 120 | 90 | 40 | 250 |
Vrouwelijk | 110 | 95 | 45 | 250 |
Totaal | 230 | 185 | 85 | 500 |
Voordat we de Pearson-residuen berekenen, moeten we eerst de verwachte aantallen voor elke cel in de kruistabel berekenen. Om dit te doen, kunnen we de volgende formule gebruiken:
Verwachte waarde = (som van rijen * som van kolommen) / som van tabel.
De verwachte waarde voor Republikeinse mannen is bijvoorbeeld: (230*250) / 500 = 115 .
We kunnen deze formule herhalen om de verwachte waarde voor elke tabelcel te krijgen:
Republikeins | Democraat | Onafhankelijk | Totaal | |
Mannelijk | 115 | 92,5 | 42,5 | 250 |
Vrouwelijk | 115 | 92,5 | 42,5 | 250 |
Totaal | 230 | 185 | 85 | 500 |
Vervolgens kunnen we het Pearson-residu voor elke cel in de tabel berekenen.
Het Pearson-residu voor de cel met Republikeinse mannen zou bijvoorbeeld als volgt worden berekend:
- rij = (O ij – E ij ) / √ E ij
- rij = (120 – 115) / √ 115
- rij = 0,466
We kunnen deze formule herhalen om het Pearson-residu voor elke cel in de tabel te verkrijgen:
Republikeins | Democraat | Onafhankelijk | |
Mannelijk | 0,446 | -0,259 | -0,383 |
Vrouwelijk | -0,446 | 0,259 | 0,383 |
Vervolgens kunnen we voor elke cel in de tabel het gestandaardiseerde Pearson-residu berekenen.
Het gestandaardiseerde Pearson-residu voor de cel met Republikeinse mannen zou bijvoorbeeld als volgt worden berekend:
- rij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
- rij = (120 – 115) / √ 115(1-250/500)(1-230/500)
- rij = 0,897
We kunnen deze formule herhalen om het gestandaardiseerde Pearson-residu voor elke cel in de tabel te verkrijgen:
Republikeins | Democraat | Onafhankelijk | |
Mannelijk | 0,897 | -0,463 | -0,595 |
Vrouwelijk | -0,897 | 0,463 | 0,595 |
We kunnen zien dat geen van de gestandaardiseerde Pearson-residuen een absolute waarde groter dan 3 heeft, wat aangeeft dat geen van de cellen bijdraagt aan een significant gebrek aan fit.
Als we deze online calculator gebruiken om een chikwadraattest van onafhankelijkheid uit te voeren, zullen we ontdekken dat de p-waarde van de test 0,649198 is.
Omdat deze p-waarde niet kleiner is dan 0,05, hebben we niet voldoende bewijs om te zeggen dat er een verband bestaat tussen geslacht en politieke partijvoorkeur.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u een chi-kwadraattest van onafhankelijkheid kunt uitvoeren met behulp van verschillende statistische software:
Een inleiding tot de Chi-Square Onafhankelijkheidstest
Hoe u een Chi-Square-onafhankelijkheidstest uitvoert in Excel
Hoe voer je een chi-kwadraat-onafhankelijkheidstest uit in R
Chi-kwadraattest van de onafhankelijkheidscalculator