Wat zijn pearson-residuen? (definitie & #038; voorbeeld)


Pearson-residuen worden gebruikt in een chikwadraattest van onafhankelijkheid om het verschil tussen het waargenomen celaantal en het verwachte celaantal in een contingentietabel te analyseren.

De formule voor het berekenen van een Pearson-residu is:

rij = (O ij – E ij ) / √ E ij

Goud:

  • rij : Het Pearson-residu voor de cel van de i -de kolom en de j- de rij
  • O ij : De waargenomen waarde voor de cel van de i -de kolom en de j- de rij
  • E ij : De verwachte waarde voor de cel van de i -de kolom en de j- de rij

Een soortgelijke maatstaf is het gestandaardiseerde (aangepaste) Pearson-residu , dat als volgt wordt berekend:

rij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )

Goud:

  • rij : Het Pearson-residu voor de cel van de i -de kolom en de j- de rij
  • O ij : De waargenomen waarde voor de cel van de i -de kolom en de j- de rij
  • E ij : De verwachte waarde voor de cel van de i -de kolom en de j- de rij
  • p i+ : Het rijtotaal gedeeld door het eindtotaal
  • p + j : Het kolomtotaal gedeeld door het eindtotaal

Gestandaardiseerde Pearson-residuen zijn normaal verdeeld met een gemiddelde van 0 en een standaarddeviatie van 1. Elk gestandaardiseerd Pearson-residu met een absolute waarde boven bepaalde drempels (bijvoorbeeld 2 of 3) duidt op een gebrek aan fit.

Het volgende voorbeeld laat zien hoe u Pearson-residuen in de praktijk kunt berekenen.

Voorbeeld: Berekening van Pearson-residuen

Stel dat de onderzoekers een chi-kwadraattoets voor onafhankelijkheid willen gebruiken om te bepalen of gender wel of niet geassocieerd is met voorkeur voor een politieke partij.

Ze besluiten een eenvoudige willekeurige steekproef van 500 kiezers te nemen en hen te vragen naar hun politieke partijvoorkeur.

De volgende kruistabel geeft de resultaten van het onderzoek weer:

Republikeins Democraat Onafhankelijk Totaal
Mannelijk 120 90 40 250
Vrouwelijk 110 95 45 250
Totaal 230 185 85 500

Voordat we de Pearson-residuen berekenen, moeten we eerst de verwachte aantallen voor elke cel in de kruistabel berekenen. Om dit te doen, kunnen we de volgende formule gebruiken:

Verwachte waarde = (som van rijen * som van kolommen) / som van tabel.

De verwachte waarde voor Republikeinse mannen is bijvoorbeeld: (230*250) / 500 = 115 .

We kunnen deze formule herhalen om de verwachte waarde voor elke tabelcel te krijgen:

Republikeins Democraat Onafhankelijk Totaal
Mannelijk 115 92,5 42,5 250
Vrouwelijk 115 92,5 42,5 250
Totaal 230 185 85 500

Vervolgens kunnen we het Pearson-residu voor elke cel in de tabel berekenen.

Het Pearson-residu voor de cel met Republikeinse mannen zou bijvoorbeeld als volgt worden berekend:

  • rij = (O ij – E ij ) / √ E ij
  • rij = (120 – 115) / √ 115
  • rij = 0,466

We kunnen deze formule herhalen om het Pearson-residu voor elke cel in de tabel te verkrijgen:

Republikeins Democraat Onafhankelijk
Mannelijk 0,446 -0,259 -0,383
Vrouwelijk -0,446 0,259 0,383

Vervolgens kunnen we voor elke cel in de tabel het gestandaardiseerde Pearson-residu berekenen.

Het gestandaardiseerde Pearson-residu voor de cel met Republikeinse mannen zou bijvoorbeeld als volgt worden berekend:

  • rij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
  • rij = (120 – 115) / √ 115(1-250/500)(1-230/500)
  • rij = 0,897

We kunnen deze formule herhalen om het gestandaardiseerde Pearson-residu voor elke cel in de tabel te verkrijgen:

Republikeins Democraat Onafhankelijk
Mannelijk 0,897 -0,463 -0,595
Vrouwelijk -0,897 0,463 0,595

We kunnen zien dat geen van de gestandaardiseerde Pearson-residuen een absolute waarde groter dan 3 heeft, wat aangeeft dat geen van de cellen bijdraagt aan een significant gebrek aan fit.

Als we deze online calculator gebruiken om een chikwadraattest van onafhankelijkheid uit te voeren, zullen we ontdekken dat de p-waarde van de test 0,649198 is.

Omdat deze p-waarde niet kleiner is dan 0,05, hebben we niet voldoende bewijs om te zeggen dat er een verband bestaat tussen geslacht en politieke partijvoorkeur.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u een chi-kwadraattest van onafhankelijkheid kunt uitvoeren met behulp van verschillende statistische software:

Een inleiding tot de Chi-Square Onafhankelijkheidstest
Hoe u een Chi-Square-onafhankelijkheidstest uitvoert in Excel
Hoe voer je een chi-kwadraat-onafhankelijkheidstest uit in R
Chi-kwadraattest van de onafhankelijkheidscalculator

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert