Jak wykonać prostą regresję liniową w programie excel
Prosta regresja liniowa to metoda, której możemy użyć do zrozumienia związku między zmienną objaśniającą x i zmienną odpowiedzi y.
W tym samouczku wyjaśniono, jak wykonać prostą regresję liniową w programie Excel.
Przykład: Prosta regresja liniowa w Excelu
Załóżmy, że chcemy zrozumieć związek pomiędzy liczbą godzin, jakie student przygotowuje się do egzaminu, a oceną, jaką otrzymuje z egzaminu.
Aby zbadać tę zależność, możemy przeprowadzić prostą regresję liniową, wykorzystując przestudiowane godziny jako zmienną objaśniającą i wyniki egzaminów jako zmienną odpowiedzi.
Wykonaj poniższe kroki w programie Excel, aby przeprowadzić prostą regresję liniową.
Krok 1: Wprowadź dane.
Wprowadź następujące dane dotyczące liczby godzin nauki i uzyskanej oceny z egzaminu dla 20 uczniów:
Krok 2: Wizualizuj dane.
Przed wykonaniem prostej regresji liniowej pomocne jest utworzenie wykresu rozrzutu danych, aby upewnić się, że rzeczywiście istnieje liniowa zależność pomiędzy przestudiowanymi godzinami a wynikami egzaminu.
Podświetl dane w kolumnach A i B. Na górnej wstążce programu Excel przejdź do karty Wstaw . W grupie Grafika kliknij opcję Wstaw punkt rozproszenia (X, Y) i kliknij pierwszą opcję oznaczoną Rozproszenie . Spowoduje to automatyczne utworzenie następującej chmury punktów:
Liczba przepracowanych godzin jest pokazana na osi X, a wyniki egzaminu na osi Y. Widzimy, że pomiędzy tymi dwiema zmiennymi istnieje liniowa zależność: więcej godzin nauki wiąże się z wyższymi wynikami z egzaminów.
Aby określić ilościowo związek między tymi dwiema zmiennymi, możemy przeprowadzić prostą regresję liniową.
Krok 3: Wykonaj prostą regresję liniową.
Na górnej wstążce programu Excel przejdź do karty Dane i kliknij opcję Analiza danych . Jeśli nie widzisz tej opcji, musisz najpierw zainstalować bezpłatne oprogramowanie Analysis ToolPak .
Po kliknięciu Analiza danych pojawi się nowe okno. Wybierz opcję Regresja i kliknij OK.
W polu Zakres wejściowy Y wypełnij tablicę wartości zmiennej odpowiedzi. W polu Zakres wejściowy X wypełnij tablicę wartości zmiennej objaśniającej.
Zaznacz pole obok Etykiet , aby program Excel wiedział, że uwzględniliśmy nazwy zmiennych w zakresach wejściowych.
W polu Zakres wyjściowy wybierz komórkę, w której chcesz wyświetlić wynik regresji.
Następnie kliknij OK .
Następujące dane wyjściowe pojawią się automatycznie:
Krok 4: Zinterpretuj wynik.
Oto jak zinterpretować najbardziej odpowiednie liczby w wyniku:
R Kwadrat: 0,7273 . Nazywa się to współczynnikiem determinacji. Jest to proporcja wariancji zmiennej odpowiedzi, którą można wyjaśnić za pomocą zmiennej objaśniającej. W tym przykładzie 72,73% różnic w wynikach egzaminów można wytłumaczyć liczbą przepracowanych godzin.
Błąd standardowy: 5.2805 . Jest to średnia odległość pomiędzy obserwowanymi wartościami a linią regresji. W tym przykładzie zaobserwowane wartości odbiegają średnio o 5,2805 jednostki od linii regresji.
F: 47,9952 . Jest to ogólna statystyka F dla modelu regresji, obliczona jako MS regresji/MS resztowe.
Znaczenie F: 0,0000 . Jest to wartość p powiązana z ogólną statystyką F. To mówi nam, czy model regresji jest statystycznie istotny, czy nie. Innymi słowy, mówi nam, czy zmienna objaśniająca ma statystycznie istotny związek ze zmienną odpowiedzi. W tym przypadku wartość p jest mniejsza niż 0,05, co wskazuje, że istnieje statystycznie istotny związek pomiędzy przepracowanymi godzinami a oceną uzyskaną z egzaminu.
Współczynniki: Współczynniki dają nam liczby potrzebne do napisania oszacowanego równania regresji. W tym przykładzie oszacowane równanie regresji wygląda następująco:
wynik egzaminu = 67,16 + 5,2503*(godziny)
Współczynnik godzin interpretujemy w ten sposób, że za każdą dodatkową przestudiowaną godzinę wynik egzaminu powinien wzrosnąć średnio o 5,2503 . Interpretujemy współczynnik wyrazu tak, że oczekiwany wynik egzaminu dla studenta studiującego zero godzin wynosi 67,16 .
Możemy użyć tego szacunkowego równania regresji do obliczenia oczekiwanego wyniku egzaminu dla studenta na podstawie liczby godzin nauki.
Na przykład student studiujący trzy godziny powinien uzyskać wynik egzaminu 82,91 :
wynik egzaminu = 67,16 + 5,2503*(3) = 82,91
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w programie Excel:
Jak utworzyć wykres resztowy w programie Excel
Jak skonstruować przedział przewidywania w programie Excel
Jak utworzyć wykres QQ w programie Excel