Wat is het verschil tussen een t-test en een anova?


In deze tutorial wordt het verschil uitgelegd tussen een t-test en een ANOVA , en ook wanneer u elke test moet gebruiken.

T-test

Een t-test wordt gebruikt om te bepalen of er al dan niet een statistisch significant verschil bestaat tussen de gemiddelden van twee groepen . Er zijn twee soorten t-toetsen:

1. T-test van onafhankelijke monsters. Dit wordt gebruikt als we het verschil tussen de gemiddelden van twee groepen willen vergelijken en de groepen volledig onafhankelijk van elkaar zijn.

Onderzoekers willen bijvoorbeeld misschien weten of dieet A of dieet B mensen helpt meer af te vallen. 100 willekeurig toegewezen mensen worden toegewezen aan dieet A. Nog eens 100 willekeurig toegewezen mensen worden toegewezen aan dieet B. Na drie maanden registreren onderzoekers het totale gewichtsverlies van elke persoon. Om te bepalen of het gemiddelde gewichtsverlies tussen de twee groepen significant verschillend is, kunnen onderzoekers een onafhankelijke t-test uitvoeren.

2. T-test van gepaarde monsters . Dit wordt gebruikt als we het verschil tussen de gemiddelden van twee groepen willen vergelijken en waarbij elke waarneming van de ene groep in verband kan worden gebracht met een waarneming van de andere groep.

Laten we bijvoorbeeld zeggen dat twintig leerlingen in een klas een toets maken, vervolgens een bepaalde handleiding bestuderen en vervolgens de toets opnieuw maken. Om het verschil tussen de eerste en de tweede toetsscore te vergelijken, gebruiken we een gepaarde t-toets, omdat voor elke leerling de eerste toetsscore kan worden gekoppeld aan de tweede toetsscore.

Wil een t-test geldige resultaten opleveren, dan moet aan de volgende aannames worden voldaan:

  • Willekeurig: Er moet een willekeurige steekproef of willekeurig experiment worden gebruikt om gegevens voor beide monsters te verzamelen.
  • Normaal: De steekproefverdeling is normaal of ongeveer normaal.

Als aan deze aannames wordt voldaan, is het mogelijk om een t-test te gebruiken om het verschil tussen de gemiddelden van twee groepen te testen.

ANOVA

Een ANOVA (variantieanalyse) wordt gebruikt om te bepalen of er al dan niet een statistisch significant verschil bestaat tussen de gemiddelden van drie of meer groepen . De meest gebruikte ANOVA-testen in de praktijk zijn one-way ANOVA en two-way ANOVA:

One-way ANOVA: Wordt gebruikt om te testen of er al dan niet een statistisch significant verschil bestaat tussen de gemiddelden van drie of meer groepen wanneer de groepen op basis van één factor kunnen worden opgesplitst.

Voorbeeld: Je verdeelt een klas van 90 studenten willekeurig in drie groepen van 30. Elke groep gebruikt een maand lang een andere studietechniek ter voorbereiding op een examen. Aan het einde van de maand leggen alle studenten hetzelfde examen af. Je wilt weten of studietechniek invloed heeft op de examenscores. Je voert dus een one-way ANOVA uit om te bepalen of er een statistisch significant verschil is tussen de gemiddelde scores van de drie groepen.

Tweerichtings-ANOVA: wordt gebruikt om te testen of er al dan niet een statistisch significant verschil bestaat tussen de gemiddelden van drie of meer groepen, wanneer de groepen op twee factoren kunnen worden gesplitst.

Voorbeeld: U wilt bepalen of het trainingsniveau (geen training, lichte training, krachtige training) en geslacht (man, vrouw) invloed hebben op het gewichtsverlies. In dit geval zijn de twee factoren die u bestudeert lichaamsbeweging en geslacht, en is uw antwoordvariabele gewichtsverlies (gemeten in kilo’s). U kunt een tweeweg-ANOVA uitvoeren om te bepalen of lichaamsbeweging en geslacht invloed hebben op het gewichtsverlies en om te bepalen of er een interactie bestaat tussen lichaamsbeweging en geslacht op gewichtsverlies.

Wil een ANOVA geldige resultaten opleveren, dan moet aan de volgende aannames worden voldaan:

  • Normaliteit – alle populaties die we bestuderen volgen een normale verdeling. Als we bijvoorbeeld de examenscores van drie verschillende groepen studenten willen vergelijken, moeten de examenscores van de eerste groep, de tweede groep en de derde groep allemaal normaal verdeeld zijn.
  • Gelijke variantie – de populatievarianties in elke groep zijn gelijk of ongeveer gelijk.
  • Onafhankelijkheid – de observaties van elke groep moeten onafhankelijk van elkaar zijn. Meestal zorgt een gerandomiseerd ontwerp hiervoor.

Als aan deze aannames wordt voldaan, is het mogelijk om een ANOVA te gebruiken om het verschil tussen de gemiddelden van drie of meer groepen te testen.

Begrijp de verschillen tussen elke test

Het belangrijkste verschil tussen een t-test en een ANOVA is hoe beide tests hun teststatistieken berekenen om te bepalen of er een statistisch significant verschil tussen groepen is.

Een t-test met onafhankelijke monsters gebruikt de volgende teststatistiek:

teststatistiek t = [ ( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

waarbij x 1 en x 2 de steekproefgemiddelden zijn voor groepen 1 en 2, d het hypothetische verschil is tussen de twee gemiddelden (vaak nul), s 1 2 en s 2 2 de steekproefvarianties zijn voor groepen 1 en 2, en n 1 en n 2 zijn de steekproefomvang voor respectievelijk groep 1 en 2.

Een paired samples t-test gebruikt de volgende teststatistiek:

teststatistiek t = d / (s d / √n)

waarbij d het gemiddelde verschil tussen de twee groepen is, sd de standaardafwijking van de verschillen is , en n de steekproefomvang voor elke groep is (merk op dat beide groepen dezelfde steekproefomvang zullen hebben).

Een ANOVA gebruikt de volgende teststatistiek:

teststatistiek F = s 2 b / s 2 w

waarbij s 2 b de variantie tussen de steekproeven is en s 2 w de variantie binnen de steekproef.

Een t-test meet de verhouding tussen het gemiddelde verschil tussen twee groepen en de algehele standaarddeviatie van de verschillen. Als deze verhouding hoog genoeg is, is dit voldoende bewijs dat er een significant verschil bestaat tussen de twee groepen.

Een ANOVA daarentegen meet de verhouding tussen de variantie tussen groepen en de variantie binnen groepen. Als deze verhouding hoog genoeg is, levert deze, net als de t-test, voldoende bewijs dat de drie groepen niet hetzelfde gemiddelde hebben.

Een ander belangrijk verschil tussen een t-test en een ANOVA is dat de t-test ons kan vertellen of twee groepen wel of niet hetzelfde gemiddelde hebben. Een ANOVA vertelt ons daarentegen of drie groepen allemaal hetzelfde gemiddelde hebben, maar vertelt ons niet expliciet welke groepen verschillende gemiddelden van elkaar hebben.

Om erachter te komen welke groepen van elkaar verschillen, zijn post-hoctesten noodzakelijk.

Begrijp wanneer u elke test moet gebruiken

Als we in de praktijk de gemiddelden van twee groepen willen vergelijken , gebruiken we een t-toets. Wanneer we de gemiddelden van drie of meer groepen willen vergelijken, gebruiken we een ANOVA.

De onderliggende reden dat we niet eenvoudigweg meerdere t-toetsen gebruiken om de gemiddelden van drie of meer groepen te vergelijken, gaat terug op het begrijpen van het Type I-foutenpercentage. Stel dat we de gemiddelden van drie groepen willen vergelijken : groep A, groep B en groep C. Je zou in de verleiding kunnen komen om de volgende drie t-toetsen uit te voeren:

  • Een t-test om het verschil in gemiddelden tussen groep A en groep B te vergelijken
  • Een t-test om het verschil in gemiddelden tussen groep A en groep C te vergelijken
  • Een t-test om het verschil in gemiddelden tussen groep B en groep C te vergelijken

Voor elke t-toets bestaat de kans dat we een Type I-fout maken, wat de kans is dat we de nulhypothese verwerpen terwijl deze feitelijk waar is. Deze kans bedraagt doorgaans 5%. Dit betekent dat wanneer we meerdere t-tests uitvoeren, dit foutenpercentage toeneemt. Bijvoorbeeld:

  • De kans dat we een Type I-fout maken met een enkele t-test is 1 – 0,95 = 0,05 .
  • De kans dat we een Type I-fout maken met twee t-toetsen is 1 – (0,95 2 ) = 0,0975 .
  • De kans dat we een Type I-fout maken met twee t-toetsen is 1 – (0,95 3 ) = 0,1427 .

Dit foutenpercentage is onaanvaardbaar hoog. Gelukkig controleert een ANOVA deze fouten, zodat de Type I-fout slechts 5% blijft. Hierdoor kunnen we er meer vertrouwen in hebben dat een statistisch significant testresultaat daadwerkelijk zinvol is en niet slechts een resultaat is dat we hebben verkregen door het uitvoeren van veel tests.

Als we dus willen begrijpen of er een verschil is tussen de gemiddelden van drie of meer groepen, moeten we een ANOVA gebruiken, zodat onze resultaten statistisch geldig en betrouwbaar zijn.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert