Hoe u een chikwadraat-goodness-of-fit-test uitvoert in r


Een chikwadraat-goodness-of-fit-test wordt gebruikt om te bepalen of een categorische variabele al dan niet een hypothetische verdeling volgt.

In deze tutorial wordt uitgelegd hoe u een chikwadraat-goodness-of-fit-test uitvoert in R.

Voorbeeld: Chi-kwadraat goodness-of-fit-test in R

Een winkeleigenaar vertelt dat er elke dag van de week evenveel klanten naar zijn winkel komen. Om deze hypothese te testen, registreert een onderzoeker het aantal klanten dat in een bepaalde week de winkel binnenkomt en ontdekt het volgende:

  • Maandag: 50 klanten
  • Dinsdag: 60 klanten
  • Woensdag: 40 klanten
  • Donderdag: 47 klanten
  • Vrijdag: 53 klanten

Volg de volgende stappen om een chikwadraat-goodness-of-fit-test uit te voeren in R om te bepalen of de gegevens consistent zijn met de claim van de winkeleigenaar.

Stap 1: Creëer de gegevens.

Eerst maken we twee tabellen met onze waargenomen frequenties en ons verwachte aantal klanten voor elke dag:

 observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) #must add up to 1

Stap 2: Voer de chikwadraat-goodness-of-fit-test uit.

Vervolgens kunnen we de chi-kwadraat fit-test uitvoeren met behulp van de functie chisq.test() , die de volgende syntaxis gebruikt:

chisq.test(x, p)

Goud:

  • x: Een numerieke vector van waargenomen frequenties.
  • p: een numerieke vector met verwachte verhoudingen.

De volgende code laat zien hoe u deze functie in ons voorbeeld kunt gebruiken:

 #perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)

	Chi-squared test for given probabilities

data: observed
X-squared = 4.36, df = 4, p-value = 0.3595

De Chi-kwadraat-teststatistiek is 4,36 en de overeenkomstige p-waarde is 0,3595 .

Merk op dat de p-waarde overeenkomt met een Chi-kwadraatwaarde met n-1 vrijheidsgraden (dof), waarbij n het aantal verschillende categorieën is. In dit geval is df = 5-1 = 4.

U kunt de chikwadraat-naar-p-waardecalculator gebruiken om te bevestigen dat de p-waarde die overeenkomt met X 2 = 4,36 met df = 4 0,35947 is.

Bedenk dat een chikwadraat-goodness-of-fit-test de volgende nul- en alternatieve hypothesen gebruikt:

  • H 0 : (nulhypothese) Een variabele volgt een hypothetische verdeling.
  • H 1 : (alternatieve hypothese) Een variabele volgt geen hypothetische verdeling.

Omdat de p-waarde (0,35947) niet kleiner is dan 0,05, slagen we er niet in de nulhypothese te verwerpen. Dit betekent dat we niet genoeg bewijs hebben om te zeggen dat de werkelijke distributie van klanten verschilt van die gerapporteerd door de winkeleigenaar.

Aanvullende bronnen

Hoe voer je een chi-kwadraat-onafhankelijkheidstest uit in R
Hoe de P-waarde van een chikwadraatstatistiek in R te berekenen
Hoe de kritische chi-kwadraatwaarde in R te vinden

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert