Рандомізація в статистиці: визначення та приклад
У сфері статистики рандомізація відноситься до акту випадкового розподілу суб’єктів дослідження в різні групи лікування.
Наприклад, припустімо, що дослідники наймуть 100 суб’єктів для участі в дослідженні, у якому вони сподіваються зрозуміти, чи дві різні таблетки мають різний вплив на артеріальний тиск.
Вони можуть вирішити використати генератор випадкових чисел, щоб випадковим чином призначити кожному суб’єкту приймати таблетку №1 або таблетку №2.
Переваги рандомізації
Метою рандомізації є контрольприхованих змінних – змінних, які безпосередньо не включені в аналіз, але все ж певним чином впливають на аналіз.
Наприклад, якщо дослідники вивчають вплив двох різних таблеток на артеріальний тиск, такі приховані змінні можуть вплинути на аналіз:
- Одяг смокінг
- дієта
- вправи
Випадково розподіляючи суб’єктів по групах лікування, ми максимізуємо ймовірність того, що приховані змінні однаково вплинуть на обидві групи лікування.
Це означає, що будь-яку різницю в артеріальному тиску можна пояснити типом таблетки, а не ефектом прихованої змінної.
Рандомізація блоків
Розширення рандомізації відоме як блокова рандомізація . Це процес спочатку поділу суб’єктів на блоки, а потім використання рандомізації для призначення суб’єктів у межах блоків на різні види лікування.
Наприклад, якщо дослідники хочуть знати, чи дві різні таблетки по-різному впливають на артеріальний тиск, вони можуть спочатку розділити всіх суб’єктів на два блоки за статтю: чоловіки чи жінки.
Потім у кожному блоці вони можуть використовувати рандомізацію, щоб випадковим чином призначити суб’єктам використовувати таблетку №1 або таблетку №2.
Перевага цього підходу полягає в тому, що дослідники можуть безпосередньо контролювати будь-який вплив статі на артеріальний тиск, оскільки ми знаємо, що чоловіки та жінки, швидше за все, по-різному реагуватимуть на кожну таблетку.
Використовуючи стать як блок, ми можемо усунути цю змінну як потенційне джерело варіації. Якщо між двома таблетками є різниця в артеріальному тиску, ми можемо знати, що стать не є основною причиною цих відмінностей.
Додаткові ресурси
Блокування в статистиці: визначення та приклад
Рандомізація переставлених блоків: визначення та приклад
Приховані змінні: визначення та приклади