Як запустити тестер граббса в excel
Тест Ґраббса — це статистичний тест, який можна використовувати для виявлення викиду в наборі даних. Щоб використовувати цей тест, набір даних, який ви аналізуєте, має бути приблизно нормально розподілений і, в ідеалі, повинен містити принаймні 7 спостережень.
Примітка. Якщо ви вважаєте, що в наборі даних є кілька викидів, вам слід замість цього використовувати узагальнений крайній тест розриву студентів для викидів .
Якщо ви вважаєте, що максимальне значення в наборі даних є викидом, тестова статистика обчислюється таким чином:
G = (x max – x ) / с
Якщо ви вважаєте, що мінімальне значення в наборі даних є викидом, тестова статистика обчислюється таким чином:
G = ( x – x min ) / с
І якщо ви не впевнені, чи є максимальне чи мінімальне значення набору даних викидом, і ви хочете виконати двобічний тест, статистика тесту обчислюється таким чином:
G = max|x i – x | /с
де x — вибіркове середнє значення, а s — вибіркове стандартне відхилення.
Критичне значення тесту розраховується наступним чином:
G критичний = (n-1)t критичний / √[n(n-2 + t 2 критичний )]
де tcritical є критичним значенням t-розподілу з n-2 ступенями свободи, а рівень значущості становить α/n для одностороннього тесту та α/(2n) для двостороннього тесту.
Приклад: тест Граббса в Excel
Визначте, чи є значення 60 викидом у такому наборі даних:
Крок 1: спочатку нам потрібно переконатися, що дані розподілені приблизно нормально. Для цього ми можемо створити гістограму, щоб переконатися, що розподіл має приблизно дзвоноподібну форму. На наступному знімку екрана показано, як створити гістограму в Excel за допомогою Data Analysis ToolPak :
З гістограми ми бачимо, що дані розподілені приблизно нормально. Це означає, що ми можемо провести тест Граббса.
Крок 2: Далі ми виконаємо тест Граббса, щоб визначити, чи справді значення 60 є викидом у наборі даних. На знімку екрана нижче показані формули для виконання тесту Граббса:
Тестовий показник G у клітинці D4 становить 3,603219 .
Критичне значення G critical у комірці D11 дорівнює 2,556581 . Оскільки тестова статистика більша за критичне значення, це означає, що значення 60 справді є викидом у цьому наборі даних.
Що робити, якщо виявлено викид
Якщо тест Граббса визначає викид у вашому наборі даних, у вас є кілька варіантів:
- Перевірте ще раз, щоб переконатися, що значення не є опечаткою чи помилкою введення даних. Іноді значення, які відображаються як викиди в наборах даних, є просто помилками, зробленими особою під час введення даних. Поверніться назад і переконайтеся, що значення було введено правильно, перш ніж приймати подальші рішення.
- Призначте нове значення викиду . Якщо викид виявляється результатом друкарської помилки або помилки введення даних, ви можете вирішити призначити йому нове значення, наприклад середнє або медіане набору даних.
- Видаліть викид. Якщо значення справді викидається, ви можете видалити його, якщо воно матиме значний вплив на загальний аналіз.
Незалежно від того, що ви вирішите зробити з викидом, обов’язково візьміть це до уваги, коли представлятимете остаточні висновки свого аналізу.