Рандомизация в статистике: определение и пример
В области статистики рандомизация означает случайное распределение субъектов исследования по различным группам лечения.
Например, предположим, что исследователи набирают 100 человек для участия в исследовании, в котором они надеются понять, оказывают ли две разные таблетки разное влияние на кровяное давление.
Они могут решить использовать генератор случайных чисел, чтобы случайным образом назначить каждому испытуемому прием таблетки №1 или таблетки №2.
Преимущества рандомизации
Целью рандомизации является контроль скрытых переменных – переменных, которые не включены в анализ напрямую, но тем не менее каким-то образом влияют на анализ.
Например, если исследователи изучают влияние двух разных таблеток на кровяное давление, на анализ могут повлиять следующие скрытые переменные:
- Смокинговая одежда
- Диета
- Упражнение
Случайным образом распределяя субъектов по группам лечения, мы максимизируем вероятность того, что скрытые переменные одинаково повлияют на обе группы лечения.
Это означает, что любую разницу в артериальном давлении можно отнести к типу таблетки, а не к эффекту скрытой переменной.
Блокировать рандомизацию
Расширение рандомизации известно как блочная рандомизация . Это процесс сначала разделения субъектов на блоки, а затем использования рандомизации для назначения субъектам внутри блоков различных методов лечения.
Например, если исследователи хотят знать, по-разному ли две разные таблетки влияют на артериальное давление, они могут сначала разделить всех испытуемых на два блока в зависимости от пола: мужчины или женщины.
Затем в каждом блоке они могут использовать рандомизацию, чтобы случайным образом назначить испытуемых для использования таблетки №1 или таблетки №2.
Преимущество этого подхода заключается в том, что исследователи могут напрямую контролировать любое влияние пола на кровяное давление, поскольку мы знаем, что мужчины и женщины, вероятно, по-разному реагируют на каждую таблетку.
Используя гендер в качестве блока, мы можем исключить эту переменную как потенциальный источник вариаций. Если между двумя таблетками существуют различия в артериальном давлении, то мы можем знать, что пол не является основной причиной этих различий.
Дополнительные ресурсы
Блокировка в статистике: определение и пример
Рандомизация переставленных блоков: определение и пример
Скрытые переменные: определение и примеры