Середнє значення вибірки проти середнього значення сукупності: у чому різниця?
Часто в статистиці ми хочемо відповісти на такі запитання, як:
- Який середній дохід домогосподарства в певному місті?
- Яка середня вага певного виду черепах?
- Яка середня відвідуваність ігор студентського футболу?
У кожному сценарії ми хочемо відповісти на запитання про генеральну сукупність , яка представляє всі можливі окремі елементи, які ми хочемо виміряти.
Однак замість збору даних про кожну особу в популяції ми збираємо дані про вибірку популяції, яка представляє частину загальної популяції.
Наприклад, ми можемо захотіти знати середню вагу певного виду черепах із загальною популяцією 800 черепах.
Оскільки пошук і зважування кожної черепахи в популяції займе надто багато часу, ми збираємо просту випадкову вибірку з 30 черепах і вимірюємо їх вагу:

Потім ми могли б використати середню вагу цієї вибірки черепах, щоб оцінити середню вагу всіх черепах у популяції.
Як розрахувати вибіркове середнє
Формула для обчислення вибіркового середнього, яку часто позначають x , виглядає наступним чином:
x = Σx i / n
золото:
- Σ: складний грецький символ, що означає «сума»
- x i : значення i-го спостереження в наборі даних
- n: розмір вибірки
Наприклад, припустімо, що ми збираємо зразок із 10 черепах із такою вагою (у фунтах):
- 70, 80, 80, 85, 90, 95, 110, 120, 140, 150
Вибіркове середнє буде розраховано таким чином:
- х = (70+ 80+80+85+90+95+110+120+140+150) / 10 = 102
Чому вибіркове середнє неупереджене
На статистичному жаргоні ми б сказали, що середнє значення вибірки є статистикою , тоді як середнє значення сукупності є параметром .
Ось різниця між двома термінами:
Статистика — це число, яке описує певні характеристики вибірки.
Параметр — це число, яке описує характеристику сукупності.
Параметр — це значення, яке ми насправді хочемо виміряти, але статистика — це значення, яке ми використовуємо для оцінки значення параметра, оскільки статистику отримати набагато легше.
Коли ми використовуємо такий метод, як проста випадкова вибірка, щоб отримати вибірку, ми говоримо, що вибіркове середнє є неупередженою оцінкою середнього сукупності.
Іншими словами, у нас немає підстав вважати, що вибіркове середнє буде недооцінювати або переоцінювати справжнє середнє значення сукупності.
Причина полягає в тому, що коли ми використовуємо такий метод, як проста випадкова вибірка, кожен член генеральної сукупності має однакові шанси потрапити до вибірки, що означає, що вибірка, швидше за все, буде «міні-версією» загальної генеральної сукупності. .
Ми б сказали, що вибірка є репрезентативною для загальної сукупності , тобто вибіркове середнє має бути хорошою оцінкою середнього для сукупності, припускаючи, що розмір вибірки достатньо великий.
Про використання довірчих інтервалів із вибірковим середнім
Незважаючи на те, що середнє значення вибірки забезпечує неупереджену оцінку середнього значення сукупності, воно навряд чи точно збігається із середнім значенням сукупності.
Наприклад, якщо ми хочемо використати зразок черепах для оцінки середньої ваги популяції черепах, ми можемо вибрати зразок, наповнений черепахами з низькою вагою, або, можливо, зразок, наповнений важкими черепахами.
Щоб охопити цю невизначеність навколо нашої оцінки середнього значення сукупності, ми можемо створити довірчий інтервал .
Довірчий інтервал – це діапазон значень, який, ймовірно, містить параметр сукупності з певним рівнем довіри.
Наприклад, ми можемо зібрати зразок із 30 черепах і виявити, що середня вага цього зразка становить 102 фунти. Якщо ми потім побудуємо 95% довірчий інтервал, ми можемо виявити, що інтервал:
95% довірчий інтервал = [98,5, 105,5]
Ми б інтерпретували це так, що існує 95% ймовірність того, що довірчий інтервал [98,5, 105,5] містить справжню середню вагу популяції черепах.
Цей довірчий інтервал є більш корисним, ніж просте середнє значення вибірки, оскільки він дає нам діапазон значень, у межах якого, ймовірно, буде знаходитися справжнє середнє значення сукупності.
Додаткові ресурси
Населення проти зразок: яка різниця?
Статистика проти. параметри: в чому різниця?
Вступ до довірчих інтервалів