Дисперсійні вимірювання
У цій статті ви дізнаєтесь, що таке міри дисперсії та для чого використовуються ці статистичні показники. Крім того, ви зможете побачити, як обчислюється кожна міра дисперсії.
Що таке міри дисперсії?
Заходи дисперсії — це статистичні заходи, які вказують на розсіювання набору даних. Тобто міри дисперсії використовуються для оцінки ступеня розсіювання даних у вибірці.
Міри дисперсії також називають мірами мінливості або мірами розкиду .
Що таке міри дисперсії?
Заходи дисперсії такі:
- Стандартне відхилення (або стандартне відхилення)
- Дисперсія
- Коефіцієнт варіації
- охайний
- Міжквартильний діапазон
- Середня різниця
Далі пояснюється, як визначити кожну міру дисперсії.
Стандартне відхилення
Стандартне відхилення , яке також називають типовим відхиленням , дорівнює кореню квадратному із суми квадратів відхилень ряду даних, поділеного на загальну кількість спостережень.
Таким чином, формула для цієї міри дисперсії виглядає наступним чином:
Дисперсія
Дисперсія дорівнює сумі квадратів залишків над загальною кількістю спостережень. Отже, формула для цієї метрики дисперсії виглядає наступним чином:
золото:
-
це випадкова змінна, для якої потрібно обчислити дисперсію.
-
це значення даних
.
-
– загальна кількість спостережень.
-
є середнім значенням випадкової величини
.
Коефіцієнт варіації
У статистиці коефіцієнт варіації — це міра дисперсії, яка використовується для визначення дисперсії набору даних відносно його середнього значення. Коефіцієнт варіації обчислюється шляхом ділення стандартного відхилення даних на його середнє значення, а потім множення на 100, щоб виразити значення у відсотках.
охайний
Діапазон — це міра дисперсії, яка вказує різницю між максимальним і мінімальним значенням даних у вибірці. Таким чином, щоб обчислити обсяг генеральної сукупності або статистичної вибірки, максимальне значення необхідно відняти від мінімального значення.
Міжквартильний діапазон
Міжквартильний діапазон , також званий інтерквартильним діапазоном , є мірою статистичної дисперсії, яка вказує на різницю між третім і першим квартилями.
Тому, щоб обчислити інтерквартильний діапазон набору статистичних даних, ви повинні спочатку знайти третій і перший квартилі, а потім відняти їх.
Символом інтерквартильного діапазону є IQR, від англійського interquartile range .
Однією з найвигідніших характеристик цієї міри дисперсії є те, що вона є надійною статистикою, тобто має високу стійкість до викидів. Оскільки екстремальні значення не враховуються при розрахунку інтерквартильного діапазону, його значення буде дуже мало змінюватися, якщо з’являться нові викиди .
Середня різниця
Середнє відхилення , яке також називають середнім абсолютним відхиленням , є середнім значенням абсолютних відхилень. Отже, середнє відхилення дорівнює сумі відхилень кожного елемента даних від середнього арифметичного, поділеному на загальну кількість елементів даних.
Для чого використовуються дисперсійні вимірювання?
Заходи дисперсії використовуються для оцінки дисперсії статистичної вибірки. Тобто вимірювання дисперсії дозволяють нам кількісно визначити дисперсію набору даних, і на основі отриманих значень можна проаналізувати дисперсію вибірки даних.
Заходи дисперсії широко використовуються, оскільки вони допомагають описати вибірку даних. Заходи дисперсії допомагають зрозуміти, як виглядає ряд даних.
Інші статистичні показники, які також часто обчислюються, це показники центральної тенденції та показники позиції. Як правило, не визначається одне статистичне вимірювання, а проводиться кілька вимірювань, щоб краще зрозуміти, як виглядають дані, що вивчаються.