Jak obliczyć wartość p statystyki chi-kwadrat w r


Za każdym razem, gdy wykonasz test Chi-kwadrat, otrzymasz statystykę testu Chi-kwadrat. Następnie można znaleźć wartość p odpowiadającą tej statystyce testowej, aby określić, czy wyniki testu są statystycznie istotne, czy nie.

Aby znaleźć wartość p odpowiadającą statystyce testu Chi-kwadrat w R, możesz użyć funkcji pchisq() , która wykorzystuje następującą składnię:

pchisq(q, df, dolny.ogon = PRAWDA)

Złoto:

  • q: Statystyka testu Chi-kwadrat
  • df: Stopnie swobody
  • less.tail: Jeśli PRAWDA, zwracane jest lewe prawdopodobieństwo q w rozkładzie Chi-kwadrat. Jeśli FAŁSZ, zwracane jest prawdopodobieństwo na prawo od q w rozkładzie chi-kwadrat. Wartość domyślna to PRAWDA.

Poniższe przykłady pokazują, jak w praktyce wykorzystać tę funkcję.

Przykład 1: Test dobroci dopasowania chi-kwadrat

Właściciel sklepu twierdzi, że w każdym dniu tygodnia do jego sklepu przychodzi taka sama liczba klientów. Aby przetestować tę hipotezę, niezależny badacz rejestruje liczbę klientów, którzy przychodzą do sklepu w danym tygodniu i stwierdza, co następuje:

  • Poniedziałek: 50 klientów
  • Wtorek: 60 klientów
  • Środa: 40 klientów
  • Czwartek: 47 klientów
  • Piątek: 53 klientów

Po przeprowadzeniu testu dobroci dopasowania chi-kwadrat badacz stwierdza, co następuje:

Statystyka testu chi-kwadrat (X 2 ): 4,36

Stopnie swobody: (df): 4

Aby znaleźć wartość p związaną ze statystyką testu Chi-kwadrat i stopniami swobody, możemy użyć następującego kodu w R:

 #find p-value for the Chi-Square test statistic
pchisq(q=4.36, df=4, lower.tail= FALSE )

[1] 0.3594721

Wartość p wynosi 0,359 . Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że prawdziwy rozkład klientów różni się od tego podawanego przez właściciela sklepu.

Przykład 2: Test niezależności chi-kwadrat

Naukowcy chcą wiedzieć, czy płeć jest powiązana z preferencją partii politycznej. Biorą prostą losową próbę 500 wyborców i pytają ich o preferencje dotyczące partii politycznych. Po przeprowadzeniu testu niezależności chi-kwadrat stwierdzają, co następuje:

Statystyka testu chi-kwadrat ( X2 ): 0,8642

Stopnie swobody: (df): 2

Aby znaleźć wartość p związaną ze statystyką testu Chi-kwadrat i stopniami swobody, możemy użyć następującego kodu w R:

 #find p-value for the Chi-Square test statistic
pchisq(q=0.8642, df=2, lower.tail= FALSE )

[1] 0.6491445

Wartość p wynosi 0,649 . Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że istnieje związek między płcią a preferencjami partii politycznych.

Powiązane: Jak wykonać test niezależności chi-kwadrat w R

Pełną dokumentację funkcji pchisq() znajdziesz tutaj .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *