Що таке кластерна дисперсія? (визначення & #038; приклад)


У статистиці кластерна дисперсія просто відноситься до середнього значення двох або більше кластерних дисперсій.

Ми використовуємо слово «об’єднаний», щоб вказати, що ми «об’єднуємо» дві або більше групових дисперсій для отримання єдиного числа для спільної дисперсії між групами.

На практиці об’єднану дисперсію найчастіше використовують у двовибірковому t-критерії , який використовується для визначення того, чи рівні середні значення двох сукупностей.

Об’єднана дисперсія між двома вибірками зазвичай позначається як sp 2 і обчислюється наступним чином:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

Коли два розміри вибірки (n 1 і n 2 ) рівні, формула спрощується таким чином:

s p 2 = (s 1 2 + s 2 2 ) / 2

Коли розраховувати кластерний розрив

Коли ми хочемо порівняти два середні значення генеральної сукупності, ми потенційно можемо використати два статистичні тести:

1. T-критерій двох вибірок : цей тест передбачає, що дисперсії між двома вибірками приблизно однакові. Якщо ми використовуємо цей тест, ми обчислюємо загальну дисперсію.

2. Т-критерій Велча : цей тест не передбачає , що дисперсії між двома вибірками є приблизно рівними. Якщо ми використовуємо цей тест, ми не обчислюємо загальну дисперсію. Натомість ми використовуємо іншу формулу.

Щоб визначити, який тест використовувати, ми використовуємо таке емпіричне правило:

Загальне правило: якщо відношення найбільшої дисперсії до найменшої дисперсії менше 4, тоді ми можемо припустити, що дисперсії приблизно рівні, і використовувати двовибірковий t-критерій.

Наприклад, припустимо, що зразок 1 має дисперсію 24,5, а зразок 2 має дисперсію 15,2. Відношення найбільшої дисперсії вибірки до найменшої дисперсії вибірки буде розраховано таким чином:

Співвідношення: 24,5 / 15,2 = 1,61

Оскільки це співвідношення менше 4, можна припустити, що відмінності між двома групами приблизно рівні. Отже, ми використаємо двовибірковий t-критерій, що означає, що ми обчислимо об’єднану дисперсію.

Приклад розрахунку групового відхилення

Припустімо, ми хочемо знати, чи однакова середня вага двох різних видів черепах. Щоб перевірити це, ми збираємо випадкову вибірку черепах з кожної популяції з такою інформацією:

Зразок 1:

  • Обсяг вибірки n 1 = 40
  • Дисперсія вибірки s 1 2 = 18,5

Зразок 2:

  • Обсяг вибірки n 2 = 38
  • Дисперсія вибірки s 2 2 = 6,7

Ось як обчислити об’єднану дисперсію між двома вибірками:

  • s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • s p 2 = ( (40-1)*18,5 + (38-1)*6,7 ) / (40+38-2)
  • s p 2 = (39*18,5 + 37*6,7) / (76) = 12,755

Загальна дисперсія становить 12 755 .

Зауважте, що об’єднане значення дисперсії знаходиться між двома початковими дисперсіями 18,5 і 6,7. Це має сенс, враховуючи, що об’єднана дисперсія є лише зваженим середнім значенням двох дисперсій вибірки.

Додатковий ресурс: використовуйте цей калькулятор об’єднаної дисперсії , щоб автоматично обчислити об’єднану дисперсію між двома вибірками.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *