Як обчислити відстань махаланобіса в spss
Відстань Махаланобіса — це відстань між двома точками в багатовимірному просторі. Його часто використовують для виявлення викидів у статистичному аналізі, що включає кілька змінних.
У цьому посібнику пояснюється, як обчислити відстань Махаланобіса в SPSS.
Приклад: відстань Махаланобіса в SPSS
Припустімо, що ми маємо наступний набір даних, який відображає іспитові бали 20 студентів, а також кількість годин, які вони витратили на навчання, кількість практичних іспитів, які вони склали, і їх поточну оцінку за курс:
Ми можемо використати наступні кроки, щоб обчислити відстань Махаланобіса для кожного спостереження в наборі даних, щоб визначити, чи є будь-які багатовимірні викиди.
Крок 1: виберіть параметр «Лінійна регресія».
Натисніть вкладку «Аналіз» , потім «Регресія» , потім «Лінійна» :
Крок 2: Виберіть опцію Mahalanobis.
Перетягніть оцінку змінної відповіді в поле з позначкою «Залежна». Перетягніть інші три змінні предиктора в поле з позначкою Independent(s). Потім натисніть кнопку Зберегти . Переконайтеся, що в новому вікні, що з’явиться, поставлено прапорець біля Mahalanobis . Потім натисніть Продовжити . Потім натисніть OK .
Після натискання кнопки OK відстань Махаланобіса для кожного спостереження в наборі даних з’явиться в новому стовпці під назвою MAH_1 :
Ми бачимо, що деякі відстані набагато більші за інші. Щоб визначити, чи є будь-яка з відстаней статистично значущою, нам потрібно обчислити їхні p-значення.
Крок 3: Обчисліть p-значення кожної відстані Махаланобіса.
Перейдіть на вкладку «Трансформація» , а потім натисніть «Обчислити змінну» .
У полі «Цільова змінна» виберіть нове ім’я для змінної, яку ви створюєте. Ми думаємо про «pvalue». У полі Числовий вираз введіть наступне:
1 – CDF.CHISQ(MAH_1, 3)
Потім натисніть OK .
Це дасть значення p, яке відповідає значенню хі-квадрат із 3 ступенями свободи. Ми використовуємо 3 ступені свободи, оскільки в нашій регресійній моделі є 3 змінні-прогностики.
Крок 4: Інтерпретуйте p-значення.
Після того, як ви натиснете OK , p-значення для кожної відстані Махаланобіса буде відображено в новому стовпці:
За замовчуванням SPSS відображає лише p-значення з двома знаками після коми. Ви можете збільшити кількість десяткових знаків, клацнувши Display Variables у нижній частині SPSS і збільшивши число в стовпці Decimal Places:
Коли ви повернетеся до перегляду даних , ви побачите, що кожне значення p відображається з п’ятьма знаками після коми. Будь-яке значення p менше 0,001 вважається викидом.
Ми бачимо, що перше спостереження є єдиним викидом у наборі даних, оскільки воно має p-значення менше 0,001:
Як працювати з викидами
Якщо у ваших даних присутній викид, у вас є кілька варіантів:
1. Переконайтеся, що викид не є результатом помилки введення даних.
Іноді особа просто вводить неправильне значення даних під час збереження даних. Якщо присутній викид, спочатку переконайтеся, що значення даних було введено правильно та це не помилка.
2. Видаліть викид.
Якщо значення дійсно викидається, ви можете видалити його, якщо воно матиме значний вплив на загальний аналіз. Просто не забудьте зазначити у своєму остаточному звіті чи аналізі, що ви усунули викид.