Як легко знайти викиди в таблицях google


Викид — це спостереження, яке аномально віддалено від інших значень у наборі даних.

Ми часто визначаємо спостереження як викид, якщо воно в 1,5 рази перевищує інтерквартильний діапазон вище третього квартиля або в 1,5 рази перевищує інтерквартильний діапазон нижче першого квартиля.

Примітка. Міжквартильний діапазон – це різниця між третім квартилем (75-й процентиль) і першим квартилем (25-й процентиль) набору даних. Він вимірює розподіл середніх 50% значень.

У наступному покроковому прикладі показано, як використовувати цю формулу для пошуку викидів у наборі даних у Google Таблицях.

Крок 1: Введіть дані

Спочатку давайте введемо значення з наступного набору даних у Google Таблиці:

Крок 2: Обчисліть інтерквартильний діапазон

Далі обчислимо перший квартиль, третій квартиль і інтерквартильний діапазон набору даних:

Крок 3: Визначте викиди

Тоді ми можемо використати таку формулу, щоб призначити «1» будь-яким викидам у наборі даних:

 = IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )

Ця формула перевіряє, чи є спостереження в 1,5 рази більшим за інтерквартильний діапазон вище третього квартиля чи в 1,5 рази перевищує інтерквартильний діапазон нижче першого квартиля.

Якщо будь-яке з них є істинним, спостереженню присвоюється «1», щоб позначити його як викид.

На наступному знімку екрана показано, як використовувати цю формулу на практиці:

Знайдіть викиди в Google Таблицях

Ми бачимо, що лише одне значення в нашому наборі даних виявляється викидом: 164 .

Як працювати з викидами

Якщо у ваших даних присутній викид, у вас є кілька варіантів:

1. Переконайтеся, що викид не є результатом помилки введення даних.

Іноді прості дані зберігаються неправильно. Якщо присутній викид, спочатку переконайтеся, що значення введено правильно і що це не помилка.

2. Призначте нове значення викиду .

Якщо викид є результатом помилки введення даних, ви можете вирішити призначити йому нове значення, наприклад середнє або медіана набору даних.

3. Видаліть викид.

Якщо значення дійсно викидається, ви можете видалити його, якщо воно матиме значний вплив на загальний аналіз. Просто не забудьте зазначити у своєму остаточному звіті, що ви усунули викид.

Додаткові ресурси

У наступних посібниках пояснюється, як видалити викиди в іншому статистичному програмному забезпеченні:

Як видалити викиди в R
Як видалити викиди в Python
Як видалити викиди в SPSS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *