Что такое выборочное распределение?
Представьте себе, что существует популяция из 10 000 дельфинов, и средний вес дельфина в этой популяции составляет 300 фунтов.
Если мы возьмем простую случайную выборку из 50 дельфинов из этой популяции, мы можем обнаружить, что средний вес дельфинов в этой выборке составляет 305 фунтов.
Затем, если мы возьмем еще одну простую случайную выборку из 50 дельфинов, мы можем обнаружить, что средний вес дельфинов в этой выборке составляет 295 фунтов.
Всякий раз, когда мы берем простую случайную выборку из 50 дельфинов, вполне вероятно, что средний вес дельфинов в выборке близок к среднему по популяции 300 фунтам, но не точно 300 фунтам.
Давайте представим, что мы берем 200 простых случайных выборок по 50 дельфинов из этой популяции и создаем гистограмму среднего веса каждой выборки:
В большинстве образцов средний вес будет близок к 300 фунтам. В редких случаях мы можем взять в выборку маленьких дельфинов, средний вес которых составляет всего 250 фунтов. Или мы могли бы взять образец, полный дельфинов-афалин, средний вес которых составляет 350 фунтов. В целом распределение выборочных средних будет примерно нормальным, с центром распределения, расположенным в истинном центре генеральной совокупности.
Такое распределение выборочных средних известно как выборочное распределение среднего и имеет следующие свойства:
хх = ц
где μ x — выборочное среднее, а μ — среднее по генеральной совокупности.
σx = σ/√n
где σ x — стандартное отклонение выборки, σ — стандартное отклонение генеральной совокупности, а n — размер выборки.
Например, мы знаем, что в этой популяции дельфинов средний вес равен ц = 300. Таким образом, среднее значение выборочного распределения составляет ц х = 300 .
Предположим, мы также знаем, что стандартное отклонение населения составляет 18 фунтов. Таким образом, стандартное отклонение выборки составляет σ x = 18/ √50 = 2,546 .
Выборочное распределение доли
Рассмотрим ту же популяцию из 10 000 дельфинов. Предположим, 10% дельфинов черные, а остальные серые. Предположим, мы возьмем простую случайную выборку из 50 дельфинов и обнаружим, что 14% дельфинов в этой выборке черные. Затем мы берем еще одну простую случайную выборку из 50 дельфинов и обнаруживаем, что 8% дельфинов в этой выборке черные.
Представьте, что мы берем 200 простых случайных выборок по 50 дельфинов из этой популяции и создаем гистограмму доли черных дельфинов в каждой выборке:
В большинстве выборок доля черных дельфинов будет близка к фактической популяции в 10%. Распределение выборочной доли черных дельфинов будет примерно нормальным, с центром распределения, расположенным в истинном центре популяции.
Такое распределение выборочных долей известно как выборочное распределение долей и обладает следующими свойствами:
µp = P
где p — доля выборки, а P — доля населения.
σ p = √ (P)(1-P)/n
где P — доля населения, а n — размер выборки.
Например, мы знаем, что в этой популяции дельфинов истинная доля черных дельфинов составляет 10% = 0,1. Таким образом, среднее значение выборочного распределения пропорциональности составляет µ p = 0,1 .
Предположим, мы также знаем, что стандартное отклонение населения составляет 18 фунтов. Таким образом, стандартное отклонение выборки составляет σ p = √ (P)(1-P) / n = √ (.1)(1-.1) / 50 = .042 .
Установить нормальность
Чтобы использовать приведенные выше формулы, распределение выборки должно быть нормальным.
Согласно центральной предельной теореме , выборочное распределение выборочного среднего является приблизительно нормальным, если размер выборки достаточно велик, даже если распределение совокупности не является нормальным . В большинстве случаев мы считаем размер выборки в 30 и более достаточно большим.
Выборочное распределение доли выборки является примерно нормальным, если ожидаемое количество успешных и неудачных попыток не менее 10.
Примеры
Мы можем использовать выборочные распределения для расчета вероятностей.
Пример 1: Определенная машина создает файлы cookie. Распределение веса этих файлов cookie смещено вправо со средним значением 10 унций и стандартным отклонением 2 унции. Если мы возьмем простую случайную выборку из 100 штук печенья, произведенных этой машиной, какова вероятность того, что средний вес печенья в этой выборке составит менее 9,8 унций?
Шаг 1: Установите нормальную жизнь.
Нам необходимо убедиться, что распределение выборочных средних является нормальным. Поскольку размер нашей выборки больше или равен 30, в соответствии с центральной предельной теоремой мы можем предположить, что выборочное распределение выборочных средних является нормальным.
Шаг 2: Найдите среднее и стандартное отклонение выборочного распределения.
хх = ц
σx = σ/√n
мкм х = 10 унций
σ x = 2/ √100 = 2/10 = 0,2 унции
Шаг 3. Используйте калькулятор площади Z-показателя , чтобы определить вероятность того, что средний вес печенья в этом образце составит менее 9,8 унций.
Введите следующие числа в калькулятор площади Z-оценки. Вы можете оставить поле «Необработанный балл 2» пустым, поскольку в этом примере мы находим только одно число.
Поскольку мы хотим узнать вероятность того, что средний вес печенья в этом образце будет меньше 9,8 унций, нас интересует область слева от 9,8. Калькулятор сообщает нам, что эта вероятность равна 0,15866 .
Пример 2: Согласно общешкольному исследованию, 87% учеников конкретной школы предпочитают пиццу мороженому. Предположим, мы возьмем простую случайную выборку из 200 студентов. Какова вероятность того, что доля студентов, предпочитающих пиццу, составит менее 85%?
Шаг 1: Установите нормальную жизнь.
Напомним, что выборочное распределение доли выборки является примерно нормальным, если ожидаемое количество «успехов» и «неуспехов» не менее 10.
В этом случае ожидаемое количество студентов, которые предпочтут пиццу, составит 87% * 200 студентов = 174 студента. Ожидаемое количество студентов, которые не предпочтут пиццу, составляет 13% * 200 студентов = 26 студентов. Поскольку оба этих числа не меньше 10, можно предположить, что выборочное распределение доли студентов, которые предпочтут пиццу, примерно нормальное.
Шаг 2: Найдите среднее и стандартное отклонение выборочного распределения.
µp = P
σ p = √ (P)(1-P)/n
цп = 0,87
σ р = √ (0,87)(1-0,87)/200 = 0,024
Шаг 3. Используйте калькулятор площади Z-показателя , чтобы определить вероятность того, что доля учащихся, предпочитающих пиццу, составляет менее 85%.
Введите следующие числа в калькулятор площади Z-оценки. Вы можете оставить поле «Необработанный балл 2» пустым, поскольку в этом примере мы находим только одно число.
Поскольку мы хотим знать вероятность того, что доля студентов, предпочитающих пиццу, составляет менее 85%, нас интересует область слева от 0,85. Калькулятор сообщает нам, что эта вероятность равна 0,20233 .