Jak wykonać prostą regresję liniową w programie excel


Prosta regresja liniowa to metoda, której możemy użyć do zrozumienia związku między zmienną objaśniającą x i zmienną odpowiedzi y.

W tym samouczku wyjaśniono, jak wykonać prostą regresję liniową w programie Excel.

Przykład: Prosta regresja liniowa w Excelu

Załóżmy, że chcemy zrozumieć związek pomiędzy liczbą godzin, jakie student przygotowuje się do egzaminu, a oceną, jaką otrzymuje z egzaminu.

Aby zbadać tę zależność, możemy przeprowadzić prostą regresję liniową, wykorzystując przestudiowane godziny jako zmienną objaśniającą i wyniki egzaminów jako zmienną odpowiedzi.

Wykonaj poniższe kroki w programie Excel, aby przeprowadzić prostą regresję liniową.

Krok 1: Wprowadź dane.

Wprowadź następujące dane dotyczące liczby godzin nauki i uzyskanej oceny z egzaminu dla 20 uczniów:

Surowe dane w Excelu

Krok 2: Wizualizuj dane.

Przed wykonaniem prostej regresji liniowej pomocne jest utworzenie wykresu rozrzutu danych, aby upewnić się, że rzeczywiście istnieje liniowa zależność pomiędzy przestudiowanymi godzinami a wynikami egzaminu.

Podświetl dane w kolumnach A i B. Na górnej wstążce programu Excel przejdź do karty Wstaw . W grupie Grafika kliknij opcję Wstaw punkt rozproszenia (X, Y) i kliknij pierwszą opcję oznaczoną Rozproszenie . Spowoduje to automatyczne utworzenie następującej chmury punktów:

Wykres rozrzutu w Excelu

Liczba przepracowanych godzin jest pokazana na osi X, a wyniki egzaminu na osi Y. Widzimy, że pomiędzy tymi dwiema zmiennymi istnieje liniowa zależność: więcej godzin nauki wiąże się z wyższymi wynikami z egzaminów.

Aby określić ilościowo związek między tymi dwiema zmiennymi, możemy przeprowadzić prostą regresję liniową.

Krok 3: Wykonaj prostą regresję liniową.

Na górnej wstążce programu Excel przejdź do karty Dane i kliknij opcję Analiza danych . Jeśli nie widzisz tej opcji, musisz najpierw zainstalować bezpłatne oprogramowanie Analysis ToolPak .

Opcja analizy danych w programie Excel

Po kliknięciu Analiza danych pojawi się nowe okno. Wybierz opcję Regresja i kliknij OK.

Opcja regresji w pakiecie narzędzi do analizy danych programu Excel

W polu Zakres wejściowy Y wypełnij tablicę wartości zmiennej odpowiedzi. W polu Zakres wejściowy X wypełnij tablicę wartości zmiennej objaśniającej.

Zaznacz pole obok Etykiet , aby program Excel wiedział, że uwzględniliśmy nazwy zmiennych w zakresach wejściowych.

W polu Zakres wyjściowy wybierz komórkę, w której chcesz wyświetlić wynik regresji.

Następnie kliknij OK .

Regresja w Excelu

Następujące dane wyjściowe pojawią się automatycznie:

Prosta regresja liniowa w programie Excel

Krok 4: Zinterpretuj wynik.

Oto jak zinterpretować najbardziej odpowiednie liczby w wyniku:

R Kwadrat: 0,7273 . Nazywa się to współczynnikiem determinacji. Jest to proporcja wariancji zmiennej odpowiedzi, którą można wyjaśnić za pomocą zmiennej objaśniającej. W tym przykładzie 72,73% różnic w wynikach egzaminów można wytłumaczyć liczbą przepracowanych godzin.

Błąd standardowy: 5.2805 . Jest to średnia odległość pomiędzy obserwowanymi wartościami a linią regresji. W tym przykładzie zaobserwowane wartości odbiegają średnio o 5,2805 jednostki od linii regresji.

F: 47,9952 . Jest to ogólna statystyka F dla modelu regresji, obliczona jako MS regresji/MS resztowe.

Znaczenie F: 0,0000 . Jest to wartość p powiązana z ogólną statystyką F. To mówi nam, czy model regresji jest statystycznie istotny, czy nie. Innymi słowy, mówi nam, czy zmienna objaśniająca ma statystycznie istotny związek ze zmienną odpowiedzi. W tym przypadku wartość p jest mniejsza niż 0,05, co wskazuje, że istnieje statystycznie istotny związek pomiędzy przepracowanymi godzinami a oceną uzyskaną z egzaminu.

Współczynniki: Współczynniki dają nam liczby potrzebne do napisania oszacowanego równania regresji. W tym przykładzie oszacowane równanie regresji wygląda następująco:

wynik egzaminu = 67,16 + 5,2503*(godziny)

Współczynnik godzin interpretujemy w ten sposób, że za każdą dodatkową przestudiowaną godzinę wynik egzaminu powinien wzrosnąć średnio o 5,2503 . Interpretujemy współczynnik wyrazu tak, że oczekiwany wynik egzaminu dla studenta studiującego zero godzin wynosi 67,16 .

Możemy użyć tego szacunkowego równania regresji do obliczenia oczekiwanego wyniku egzaminu dla studenta na podstawie liczby godzin nauki.

Na przykład student studiujący trzy godziny powinien uzyskać wynik egzaminu 82,91 :

wynik egzaminu = 67,16 + 5,2503*(3) = 82,91

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w programie Excel:

Jak utworzyć wykres resztowy w programie Excel
Jak skonstruować przedział przewidywania w programie Excel
Jak utworzyć wykres QQ w programie Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *