Regresja wielomianowa w arkuszach google (krok po kroku)
Analiza regresji służy do ilościowego określenia związku między jedną lub większą liczbą zmiennych predykcyjnych a zmienną odpowiedzi .
Najpopularniejszym rodzajem analizy regresji jest prosta regresja liniowa , stosowana, gdy zmienna predykcyjna i zmienna odpowiedzi mają liniową zależność.
Czasami jednak związek między zmienną predykcyjną a zmienną odpowiedzi jest nieliniowy.
W takich przypadkach sensowne jest zastosowanie regresji wielomianowej , która może wyjaśnić nieliniową zależność między zmiennymi.
W tym samouczku przedstawiono krok po kroku przykład przeprowadzania regresji wielomianowej w Arkuszach Google.
Krok 1: Utwórz dane
Najpierw utwórzmy fałszywy zbiór danych z następującymi wartościami:
Krok 2: Utwórz wykres rozrzutu
Następnie utworzymy wykres rozrzutu w celu wizualizacji danych.
Najpierw zaznacz komórki A2:B11 w następujący sposób:
Następnie kliknij kartę Wstaw , a następnie w menu rozwijanym kliknij opcję Wykres :
Domyślnie Arkusze Google wstawią wykres rozrzutu:
Krok 3: Znajdź równanie regresji wielomianowej
Następnie kliknij dwukrotnie w dowolnym miejscu wykresu rozrzutu, aby wyświetlić okno edytora wykresów po prawej stronie:
Następnie kliknijSeria . Następnie przewiń w dół i zaznacz pole obok Linia trendu i zmień Typ na Wielomian . W polu Etykieta wybierz opcję Użyj równania , a następnie zaznacz pole obok opcji Pokaż R2 .
Spowoduje to wyświetlenie nad wykresem rozrzutu następującej formuły:
Widzimy, że dopasowane równanie regresji wielomianowej ma postać:
y = 9,45 + 2,1x – 0,0188x 2
R-kwadrat dla tego modelu wynosi 0,718 .
Przypomnijmy, że R kwadrat mówi nam, jaki procent zmienności zmiennej odpowiedzi można wyjaśnić za pomocą zmiennych predykcyjnych. Im wyższa wartość, tym lepszy model.
Następnie zmień stopień wielomianu na 3 w edytorze wykresów:
Spowoduje to wyświetlenie nad wykresem rozrzutu następującej formuły:
Zmienia to dopasowane równanie regresji wielomianowej na:
y = 37,2 – 14,2x + 2,64x 2 – 0,126x 3
R-kwadrat dla tego modelu wynosi 0,976 .
Należy zauważyć, że współczynnik R-kwadrat tego modelu jest znacznie wyższy niż współczynnik R-kwadrat modelu regresji wielomianowej o stopniu 2. Sugeruje to, że ten model regresji znacznie lepiej radzi sobie z uchwyceniem trendu danych bazowych.
Jeśli zmienisz stopień wielomianu na 4, R kwadrat ledwo wzrośnie do 0,981 . Sugeruje to, że do uchwycenia trendu w tych danych wystarczy model regresji wielomianowej stopnia 3.
Możemy użyć dopasowanego równania regresji, aby znaleźć oczekiwaną wartość zmiennej odpowiedzi przy danej wartości zmiennej predykcyjnej. Na przykład, jeśli x = 4, to oczekiwana wartość y będzie wynosić:
y = 37,2 – 14,2(4) + 2,64(4) 2 – 0,126(4) 3 = 14,576
Na tej stronie znajdziesz inne samouczki dotyczące Arkuszy Google.