Jak wykonać ancova w pythonie


ANCOVA („analiza kowariancji”) służy do określenia, czy istnieje statystycznie istotna różnica między średnimi trzech lub więcej niezależnych grup, po uwzględnieniu jednej lub większej liczby współzmiennych .

W tym samouczku wyjaśniono, jak wykonać ANCOVA w Pythonie.

Przykład: ANCOVA w Pythonie

Nauczycielka chce wiedzieć, czy trzy różne techniki uczenia się wpływają na wyniki egzaminu, ale chce wziąć pod uwagę aktualną ocenę, jaką uczeń ma już w klasie.

Wykona ANCOVA przy użyciu następujących zmiennych:

  • Zmienna czynnikowa: badanie techniczne
  • Współzmienna: aktualny wynik
  • Zmienna odpowiedzi: wynik egzaminu

Wykonaj następujące kroki, aby wykonać ANCOVA na tym zbiorze danych:

Krok 1: Wprowadź dane.

Najpierw utworzymy pandę DataFrame do przechowywania naszych danych:

 import numpy as np
import pandas as pd

#create data
df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5),
                   'current_grade': [67, 88, 75, 77, 85,
                                     92, 69, 77, 74, 88, 
                                     96, 91, 88, 82, 80],
                   'exam_score': [77, 89, 72, 74, 69,
                                  78, 88, 93, 94, 90,
                                  85, 81, 83, 88, 79]})
#view data 
df

   technical current_grade exam_score
0 A 67 77
1 A 88 89
2 A 75 72
3 A 77 74
4 A 85 69
5 B 92 78
6 B 69 88
7 B 77 93
8 B 74 94
9 B 88 90
10 C 96 85
11 C 91 81
12 C 88 83
13 C 82 88
14 C 80 79

Krok 2: Wykonaj ANCOVA.

Następnie wykonamy ANCOVA przy użyciu funkcji ancova() z biblioteki pingwina:

 pip install penguin 
from penguin import ancova

#perform ANCOVA
ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ')


        Source SS DF F p-unc np2
0 technical 390.575130 2 4.80997 0.03155 0.46653
1 current_grade 4.193886 1 0.10329 0.75393 0.00930
2 Residual 446.606114 11 NaN NaN NaN

Krok 3: Interpretacja wyników.

Z tabeli ANCOVA widzimy, że wartość p (p-unc = „nieskorygowana wartość p”) dla techniki badania wynosi 0,03155 . Ponieważ wartość ta jest mniejsza niż 0,05, możemy odrzucić hipotezę zerową, że każda z technik badania prowadzi do tej samej średniej oceny z egzaminu, nawet po uwzględnieniu aktualnej oceny studenta z zajęć .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *