Як виконати тест levene на python
Критерій Левена використовується для визначення того, чи мають дві чи більше групи рівні дисперсії. Він зазвичай використовується, оскільки багато статистичних тестів припускають, що групи мають однакові дисперсії, а тест Левена дозволяє визначити, чи виконується це припущення.
Цей підручник пояснює, як виконати тест Levene у Python.
Приклад: тест Levene на Python
Дослідники хочуть знати, чи призводять три різні добрива до різного рівня росту рослин. Вони випадковим чином вибирають 30 різних рослин і ділять їх на три групи по 10 рослин, вносячи в кожну групу різні добрива. Через місяць вимірюють висоту кожної рослини.
Виконайте наступні кроки, щоб виконати тест Левена в Python, щоб визначити, чи три групи мають однакові дисперсії.
Крок 1: Введіть дані.
Спочатку ми створимо три таблиці для зберігання значень даних:
group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8] group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8] group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]
Крок 2: Виконайте тест Левена.
Далі ми виконаємо тест Levene за допомогою функції levane() із бібліотеки SciPy, яка використовує такий синтаксис:
levene(зразок1, зразок2, …, центр=’медіана’)
золото:
- зразок1, зразок2 тощо: імена зразків.
- у центрі: метод для тесту Левена. За замовчуванням встановлено «середній», але інші варіанти включають «середнє» та «урізане».
Як зазначено в документації , насправді існує три різні варіанти тесту Левена, які можна використовувати. Рекомендовані способи використання:
- «медіана»: рекомендовано для спотворених розподілів.
- «середнє»: рекомендовано для симетричних розподілів із помірним хвостом.
- ‘обрізаний’: рекомендовано для розповсюджень із важкими хвостами.
Наступний код ілюструє, як виконати тест Левена, використовуючи як середнє значення , так і медіану як центр:
import scipy.stats as stats #Levene's test centered at the median stats.levene(group1, group2, group3, center='median') (statistic=0.1798, pvalue=0.8364) #Levene's test centered at the mean stats.levene(group1, group2, group3, center='mean') (statistic=0.5357, pvalue=0.5914)
В обох методах р-значення не менше 0,05. Це означає, що в обох випадках нам не вдасться відхилити нульову гіпотезу. Це означає, що ми не маємо достатніх доказів, щоб стверджувати, що різниця у зростанні рослин між трьома добривами значно відрізняється.
Іншими словами, три групи мають рівні дисперсії. Якби ми провели статистичний тест (наприклад, односторонній дисперсійний аналіз ), який припускає, що кожна група має однакову дисперсію, тоді це припущення буде виконано.