Как выполнить начальную загрузку в excel (с примером)
Начальная загрузка — это метод, который можно использовать для построения доверительного интервала для статистики , когда размер выборки невелик и основное распределение неизвестно.
Основной процесс начальной загрузки выглядит следующим образом:
- Возьмите k повторных выборок с заменой из заданного набора данных.
- Для каждого образца рассчитайте интересующую статистику.
- Это дает k различных оценок для данной статистики, которые затем можно использовать для расчета доверительного интервала для статистики.
В следующем пошаговом примере показано, как выполнить загрузку в Excel.
Шаг 1: Введите исходные данные
Сначала введем значения из набора данных:
Шаг 2. Создайте примеры начальной загрузки
Далее мы будем использовать следующую формулу для создания примеров начальной загрузки:
=INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)
Мы можем ввести эту формулу в ячейку D2 , чтобы случайным образом выбрать значение из исходного набора данных.
Затем мы можем перетащить эту формулу на 10 ячеек вправо, чтобы сгенерировать наш первый образец начальной загрузки.
Затем мы можем перетащить эту формулу на 300 строк, чтобы создать 300 загрузочных выборок:
Примечание . Bootstrap использует выборку с заменой , что означает, что значение из исходного набора данных может появляться в данной выборке несколько раз.
Шаг 3. Рассчитайте интересующую статистику для каждого образца.
Затем мы можем рассчитать интересующую статистику для каждого образца.
Например, мы могли бы рассчитать среднее значение, медиану, стандартное отклонение, межквартильный размах и т. д. для каждого образца.
Для этого конкретного примера мы рассчитаем медианное значение для каждого образца:
Мы можем видеть:
- Первая выборка начальной загрузки имеет медианное значение 14 .
- Вторая выборка начальной загрузки имеет медианное значение 16 .
- Третий бутстреп-образец имеет медианное значение 13,5 .
И так далее.
Шаг 4. Рассчитайте доверительный интервал начальной загрузки.
Наконец, мы можем рассчитать 95%-ный доверительный интервал начальной загрузки для медианы, найдя значения в процентиле 2,5% и процентиле 97,5% в столбце N.
Для этого мы можем использовать следующие формулы:
=PERCENTILE( N2:N301 , 0.025) =PERCENTILE( N2:N301 , 0.975)
На следующем снимке экрана показано, как использовать эти формулы на практике:
Из результата мы видим, что 95% доверительный интервал начальной загрузки для медианного значения исходного набора данных равен [10,475, 19,7625] .
Обратите внимание, что в этом примере мы решили сгенерировать 300 самонастраиваемых выборок, каждая с размером выборки n = 10, но вы можете создать столько самонастраиваемых выборок, сколько захотите.
При использовании статистического программного обеспечения обычно генерируются предварительно настроенные выборки, которые затем можно использовать для построения доверительного интервала.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в Excel:
Как рассчитать доверительные интервалы в Excel
Как рассчитать интервалы прогнозирования в Excel
Как рассчитать интервалы допуска в Excel