Доля выборки относительно выборочного среднего: разница
В статистике часто используются два термина: доля выборки и среднее значение выборки .
Вот разница между этими двумя терминами:
Доля выборки: доля наблюдений в выборке, имеющих определенную характеристику.
Часто отмечается p̂, он рассчитывается следующим образом:
р = х / п
Золото:
- x: количество наблюдений в выборке с определенной характеристикой.
- n: Общее количество наблюдений в выборке.
Выборочное среднее: Среднее значение в выборке.
Часто отмечаемый x , он рассчитывается следующим образом:
х = Σx я /n
Золото:
- Σ: Символ, означающий «сумма».
- x i : значение i-го наблюдения в выборке.
- n: Размер выборки
Пропорция образца к среднему значению выборки: когда использовать каждый
Доля выборки и среднее значение выборки используются по разным причинам:
Пропорция выборки: используется для понимания доли наблюдений в выборке, имеющих определенную характеристику.
Например, мы могли бы использовать пропорцию выборки в каждом из следующих сценариев:
- Политика. Исследователи могут опросить 500 человек в определенном городе, чтобы понять, какая доля жителей поддерживает определенного кандидата на предстоящих выборах.
- Биология: Биологи могут собрать данные о 100 морских черепахах, чтобы понять, какая часть из них пострадала от загрязнения.
- Спорт: репортер может опросить 1000 баскетболистов колледжа, чтобы понять, какая часть из них стреляет левой рукой.
Среднее значение выборки: используется для понимания среднего значения выборки.
Например, мы могли бы использовать выборочное среднее в каждом из следующих сценариев:
- Демографические данные: экономисты могут собрать данные о 5000 домохозяйствах в определенном городе, чтобы оценить среднегодовой доход домохозяйства.
- Ботаника: Ботаник может измерить 50 растений одного и того же вида, чтобы оценить среднюю высоту растения в дюймах.
- Питание: Диетолог может опросить 100 человек в больнице, чтобы оценить среднее количество калорий, которые жители потребляют в день.
В зависимости от интересующего вас вопроса, для ответа на вопрос может иметь смысл использовать пропорцию выборки или среднее значение выборки.
Использование доли выборки и среднего значения выборки для оценки параметров совокупности
Доля выборки и среднее значение выборки используются для оценки параметров совокупности .
Пример пропорции для оценки
Мы используем долю выборки для оценки доли населения. Например, нам может быть интересно понять, какая доля жителей определенного города поддерживает новый закон.
Поскольку опрос всех 20 000 жителей города был бы слишком дорогостоящим и трудоемким, мы вместо этого опрашиваем 500 и рассчитываем долю жителей в выборке, которые поддерживают новый закон.
Затем мы используем эту выборочную пропорцию как лучшую оценку доли жителей всего города, принявших новый закон. Однако поскольку наша доля в выборке вряд ли будет точно соответствовать доле населения, мы часто используем доверительный интервал для пропорции — диапазон значений, который, по нашему мнению, содержит истинную долю населения с определенным уровнем достоверности.
Пример среднего значения в качестве оценки
Мы используем выборочное среднее значение для оценки среднего значения совокупности. Например, нас может заинтересовать понимание средней высоты определенного вида растений.
Поскольку измерить высоту всех 10 000 растений в определенном регионе было бы слишком дорого и отнимало бы много времени, вместо этого мы измеряем высоту 150 растений и используем выборочное среднее значение в качестве наилучшей оценки среднего значения генеральной совокупности.
Однако поскольку наше выборочное среднее вряд ли точно будет соответствовать генеральному среднему, мы часто используем для среднего значения доверительный интервал — диапазон значений, который, по нашему мнению, содержит истинное генеральное среднее с определенным уровнем достоверности.
Дополнительные ресурсы
Доверительный интервал для калькулятора пропорций
Доверительный интервал для среднего калькулятора