De vier hypothesen geformuleerd in een t-test


Een t-test met twee steekproeven wordt gebruikt om te testen of de gemiddelden van twee populaties gelijk zijn of niet.

Bij dit type test worden de volgende aannames gedaan over de gegevens:

1. Onafhankelijkheid: de waarnemingen van de ene steekproef zijn onafhankelijk van de waarnemingen van de andere steekproef.

2. Normaliteit: Beide steekproeven hebben een ongeveer normale verdeling.

3. Homogeniteit van varianties: De twee steekproeven hebben ongeveer dezelfde variantie.

4. Willekeurige bemonstering: Beide monsters zijn verkregen met behulp van de willekeurige bemonsteringsmethode.

Als een of meer van deze aannames worden geschonden, kunnen de resultaten van de t-test met twee steekproeven onbetrouwbaar of zelfs misleidend zijn.

In deze zelfstudie geven we uitleg over elke aanname, hoe u kunt bepalen of aan de aanname is voldaan en wat u moet doen als deze wordt geschonden.

Hypothese 1: Onafhankelijkheid

Bij een t-test met twee steekproeven wordt ervan uitgegaan dat waarnemingen uit het ene monster onafhankelijk zijn van waarnemingen uit het andere monster.

Dit is een cruciale aanname, want als dezelfde individuen in beide steekproeven voorkomen, is het niet geldig om conclusies te trekken over de verschillen tussen de steekproeven.

Hoe deze hypothese te verifiëren

De eenvoudigste manier om deze aanname te testen is door te verifiëren dat elke waarneming slechts één keer in elke steekproef voorkomt en dat de waarnemingen in elke steekproef door middel van willekeurige steekproeven zijn verzameld.

Wat te doen als deze veronderstelling niet wordt gerespecteerd

Als niet aan deze aanname wordt voldaan, zijn de t-testresultaten met twee steekproeven volledig ongeldig. In dit scenario kunt u het beste twee nieuwe monsters verzamelen met behulp van een willekeurige steekproefmethode en ervoor zorgen dat elk individu in het ene monster niet tot het andere monster behoort.

Hypothese 2: normaliteit

Bij een t-test met twee steekproeven wordt ervan uitgegaan dat de twee steekproeven ongeveer normaal verdeeld zijn.

Dit is een cruciale aanname, want als de steekproeven niet normaal verdeeld zijn, is het niet geldig om de p-waarden uit de test te gebruiken om conclusies te trekken over verschillen tussen steekproeven.

Hoe deze hypothese te verifiëren

Als de steekproefomvang klein is (n < 50), kunnen we een Shapiro-Wilk-test gebruiken om te bepalen of elke steekproefomvang normaal verdeeld is. Als de p-waarde van de test onder een bepaald significantieniveau ligt, zijn de gegevens waarschijnlijk niet normaal verdeeld.

Als de steekproefomvang groot is, is het beter om een QQ-plot te gebruiken om visueel te controleren of de gegevens normaal verdeeld zijn.

Als de datapunten grofweg langs een rechte diagonale lijn in een QQ-plot liggen, volgt de dataset waarschijnlijk een normale verdeling.

Wat te doen als deze veronderstelling niet wordt gerespecteerd

Als deze aanname wordt geschonden, kunnen we een Mann-Whitney U-test uitvoeren, die wordt beschouwd als het niet-parametrische equivalent van de t-test met twee steekproeven en er niet van uitgaat dat de twee steekproeven normaal verdeeld zijn.

Hypothese 3: Homogeniteit van verschillen

Bij een t-test met twee steekproeven wordt ervan uitgegaan dat de twee steekproeven ongeveer gelijke varianties hebben.

Hoe deze hypothese te verifiëren

We gebruiken de volgende vuistregel om te bepalen of de varianties tussen de twee steekproeven gelijk zijn: Als de verhouding van de grootste variantie tot de kleinste variantie kleiner is dan 4, dan kunnen we aannemen dat de varianties ongeveer gelijk zijn en beide steekproeven gebruiken. -test.

Stel bijvoorbeeld dat monster 1 een variantie van 24,5 heeft en monster 2 een variantie van 15,2. De verhouding tussen de grootste steekproefvariantie en de kleinste steekproefvariantie wordt als volgt berekend:

Verhouding: 24,5 / 15,2 = 1,61

Omdat deze verhouding kleiner is dan 4, zou men kunnen aannemen dat de verschillen tussen de twee groepen ongeveer gelijk zijn.

Wat te doen als deze veronderstelling niet wordt gerespecteerd

Als deze aanname wordt geschonden, kunnen we de t-test van Welch uitvoeren, wat een niet-parametrische versie is van de t-test met twee steekproeven en er niet van uitgaat dat de twee steekproeven gelijke varianties hebben.

Veronderstelling 4: Willekeurige steekproeftrekking

Bij een t-test met twee steekproeven wordt ervan uitgegaan dat beide monsters zijn verkregen met behulp van een willekeurige steekproefmethode.

Hoe deze hypothese te verifiëren

Er bestaat geen formele statistische test die we kunnen gebruiken om deze hypothese te testen. In plaats daarvan moeten we er eenvoudigweg voor zorgen dat beide steekproeven zijn verkregen met behulp van een willekeurige steekproefmethode , zodat elk individu in de populatie van belang een gelijke kans heeft om in de ene of de andere steekproef te worden opgenomen.

Wat te doen als deze veronderstelling niet wordt gerespecteerd

Als niet aan deze veronderstelling wordt voldaan, is het onwaarschijnlijk dat onze twee steekproeven representatief zijn voor de populatie van belang. In dit geval kunnen we de resultaten van de t-test met twee steekproeven niet op betrouwbare wijze generaliseren naar de totale populatie .

In dit scenario kunt u het beste twee nieuwe monsters verzamelen met behulp van een willekeurige bemonsteringsmethode.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert