Excel: jak interpretować wartości p w wynikach regresji


Wielokrotną regresję liniową stosuje się do ilościowego określenia związku między dwiema lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi .

Ilekroć przeprowadzamy wielokrotną regresję liniową, zawsze interesują nas wartości p w wyniku, aby określić, czy związek między zmiennymi predykcyjnymi a zmienną odpowiedzi jest istotny statystycznie.

W tym samouczku wyjaśniono, jak interpretować wartości p na wyjściu modelu regresji liniowej wielokrotnej w programie Excel.

Przykład: interpretacja wartości P w wynikach regresji w programie Excel

Załóżmy, że chcemy wiedzieć, czy liczba godzin spędzonych na nauce i liczba zdanych egzaminów przygotowawczych wpływają na ocenę, jaką student otrzymuje z określonego egzaminu wstępnego na studia.

Aby zbadać tę zależność, możemy przeprowadzić wielokrotną regresję liniową, wykorzystując przestudiowane godziny i egzaminy przygotowawcze przyjęte jako zmienne predykcyjne, a wyniki egzaminów jako zmienną odpowiedzi.

Poniższy zrzut ekranu przedstawia wynik regresji tego modelu w programie Excel:

Wyniki wielokrotnej regresji liniowej w programie Excel

Istnieją trzy wartości p, na które powinniśmy zwrócić uwagę w wyniku:

  • Wartość P całego modelu
  • Wartość P pierwszej zmiennej predykcyjnej (godziny)
  • Wartość P drugiej zmiennej predykcyjnej (badania przygotowawcze)

Oto jak interpretować każdą wartość p:

Wartość P całego modelu

Wartość p dla całego modelu można znaleźć w kolumnie oznaczonej F Istotność w wyniku.

Widzimy, że ta wartość p wynosi 0,00 .

Ponieważ wartość ta jest mniejsza niż 0,05, możemy stwierdzić, że model regresji jako całość jest istotny statystycznie.

Innymi słowy, połączenie przepracowanych godzin i zdanych egzaminów przygotowawczych ma statystycznie istotny związek z oceną końcową z egzaminu.

Wartość P pierwszej zmiennej predykcyjnej (godziny)

Wartość p dla pierwszej zmiennej predykcyjnej, godzin, wynosi 0,00.

Ponieważ wartość ta jest mniejsza niż 0,05, możemy stwierdzić, że badane godziny są istotne statystycznie.

Innymi słowy, liczba godzin studiów studenta ma istotny statystycznie związek z oceną z egzaminu końcowego.

Wartość P drugiej zmiennej predykcyjnej (badania przygotowawcze)

Wartość p dla drugiej zmiennej predykcyjnej, czyli badań przygotowawczych, wynosi 0,52.

Ponieważ wartość ta jest nie mniejsza niż 0,05, można stwierdzić, że liczba zdanych egzaminów przygotowawczych nie jest istotna statystycznie.

Innymi słowy, liczba egzaminów przygotowawczych, które student zdaje, nie ma istotnego statystycznie związku z oceną uzyskaną z egzaminu końcowego.

Ponieważ zmienna ta nie jest istotna statystycznie, możemy podjąć decyzję o usunięciu jej z modelu, gdyż nie zapewnia ona istotnej poprawy całego modelu.

W tym przypadku moglibyśmy przeprowadzić prostą regresję liniową, wykorzystując jedynie badane godziny jako zmienną predykcyjną.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w programie Excel:

Jak wykonać prostą regresję liniową w programie Excel
Jak wykonać wielokrotną regresję liniową w programie Excel
Jak wykonać regresję wielomianową w programie Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *