Jak wykonać test levene’a w pythonie


Test Levene’a służy do określenia, czy dwie lub więcej grup ma równe wariancje. Jest powszechnie stosowany, ponieważ wiele testów statystycznych zakłada, że grupy mają równe wariancje, a test Levene’a pozwala określić, czy to założenie jest spełnione.

W tym samouczku wyjaśniono, jak wykonać test Levene’a w Pythonie.

Przykład: test Levene’a w Pythonie

Naukowcy chcą wiedzieć, czy trzy różne nawozy prowadzą do różnych poziomów wzrostu roślin. Losowo wybierają 30 różnych roślin i dzielą je na trzy grupy po 10, stosując do każdej grupy inny nawóz. Po miesiącu mierzą wysokość każdej rośliny.

Wykonaj poniższe kroki, aby wykonać test Levene’a w języku Python w celu ustalenia, czy trzy grupy mają równe wariancje.

Krok 1: Wprowadź dane.

Najpierw utworzymy trzy tabele do przechowywania wartości danych:

 group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8]
group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8]
group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]

Krok 2: Wykonaj test Levene’a.

Następnie wykonamy test Levene’a wykorzystując funkcję levane() z biblioteki SciPy, która wykorzystuje następującą składnię:

levene(próbka1, próbka2, …, środek=’mediana’)

Złoto:

  • próbka1, próbka2 itd.: Nazwy próbek.
  • pośrodku: Metoda stosowana w teście Levene’a. Wartość domyślna to „mediana”, ale inne opcje obejmują „średnią” i „przyciętą”.

Jak wspomniano w dokumentacji , w rzeczywistości można zastosować trzy różne odmiany testu Levene’a. Zalecane zastosowania to:

  • „mediana”: zalecana w przypadku rozkładów skośnych.
  • „średnia”: zalecana dla rozkładów symetrycznych z umiarkowanym ogonem.
  • „przycięty”: zalecany dla dystrybucji o grubych ogonach.

Poniższy kod ilustruje sposób przeprowadzenia testu Levene’a, używając zarówno średniej , jak i mediany jako środka:

 import scipy.stats as stats

#Levene's test centered at the median
stats.levene(group1, group2, group3, center='median')

(statistic=0.1798, pvalue=0.8364)

#Levene's test centered at the mean
stats.levene(group1, group2, group3, center='mean')

(statistic=0.5357, pvalue=0.5914)

W obu metodach wartość p jest nie mniejsza niż 0,05. Oznacza to, że w obu przypadkach nie uda nam się odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że różnice we wzroście roślin pomiędzy trzema nawozami są znacząco różne.

Innymi słowy, trzy grupy mają równe wariancje. Gdybyśmy przeprowadzili test statystyczny (np. jednokierunkową ANOVA ), który zakłada, że każda grupa ma równą wariancję, wówczas założenie to zostałoby spełnione.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *