Що таке дихотомічні змінні? (визначення & #038; приклад)


Дихотомічна змінна — це тип змінної, яка приймає лише два можливі значення.

Ось кілька прикладів дихотомічних змінних:

  • Стать: чоловіча або жіноча
  • Підкидання монети: орла або решка
  • Тип нерухомості: Житлова або Комерційна
  • Статус спортсмена: Професіонал або Любитель
  • Результати іспиту: склав або не склав

Ці типи змінних постійно виникають на практиці. Наприклад, розглянемо наступний набір даних, який містить 10 спостережень і 4 змінні:

Змінні стать і виграний чемпіонат є дихотомічними, оскільки кожна з них може приймати лише два можливі значення:

Приклади дихотомічних змінних

Однак змінні Division і Average Points не є дихотомічними, оскільки вони можуть приймати кілька значень.

Бонусна порада:

Ви можете пам’ятати, що дихотомічні змінні можуть приймати лише два значення, пам’ятаючи, що префікс «di» є грецьким словом, що означає «два», «двічі» або «подвійний».

Як створити дихотомічні змінні

Слід зазначити, що ми можемо створити дихотомічну змінну з безперервної змінної, просто відокремивши значення на основі певного порогу.

Наприклад, у попередньому наборі даних ми могли перетворити змінну Average Points на дихотомічну змінну, класифікувавши гравців із середнім показником вище 15 як «хороших бомбардирів», а тих із середнім показником нижче 15 як «поганих бомбардирів»:

Перетворення безперервної змінної на дихотомічну змінну

Як візуалізувати дихотомічні змінні

Зазвичай ми візуалізуємо дихотомічні змінні за допомогою простої гістограми, щоб представити частоти кожного значення, яке вони можуть прийняти.

Наприклад, наступна гістограма показує частоти кожної статі в попередньому наборі даних:

Ми також можемо відобразити частоти у відсотках на осі y:

Це дозволяє нам легко побачити, що 70% від загальної кількості спортсменів у наборі даних – чоловіки, а 30% – жінки.

Як аналізувати дихотомічні змінні

Існує кілька способів аналізу дихотомічних змінних. Два найпоширеніші методи включають:

1. Однопропорційний z-тест

Однопропорційний z-тест визначає, чи дорівнює спостережувана пропорція теоретичній пропорції.

Наприклад, ми могли б використати цей тест, щоб визначити, чи дорівнює справжня частка чоловіків-спортсменів у певній сукупності 50%.

2. Точково-бісеріальна кореляція

Точково-бісерійна кореляція використовується для вимірювання зв’язку між дихотомічною змінною та безперервною змінною.

Цей тип кореляції приймає значення від -1 до 1, де:

  • -1 вказує на абсолютно негативну кореляцію між двома змінними
  • 0 означає відсутність кореляції між двома змінними
  • 1 вказує на абсолютно позитивну кореляцію між двома змінними

Наприклад, ми могли б обчислити бісерійну кореляцію між статтю та середніми очками за гру, щоб зрозуміти, наскільки тісно пов’язані ці дві змінні.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *