Вимірювання положення
У цій статті пояснюється, що таке вимірювання позиції та для чого вони використовуються. Тож ви знайдете всі вимірювання положення, а також приклади кожного типу.
Що таке вимірювання положення?
Позиція – це статистичні параметри вимірювань , які допомагають визначити набір даних. Простіше кажучи, вимірювання положення допомагає нам знати, як виглядає набір даних.
У статистиці існує два типи вимірювань положення: вимірювання центрального положення , які використовуються для визначення центральних значень набору даних, і вимірювання нецентрального положення , які використовуються для поділу даних на рівні інтервали. .
Що таке вимірювання положення?
У статистиці вимірювання позиції є:
- Вимірювання центрального положення : вкажіть центральні значення розподілу.
- Середнє : це середнє значення всіх даних у вибірці.
- Медіана : це середнє значення всіх даних, упорядкованих від найменшого до найбільшого.
- Режим : це значення, яке найчастіше повторюється в наборі даних.
- Вимірювання нецентрального положення : розділіть набір даних на рівні частини.
- Квартилі : Розділіть вибірку даних на чотири однакові частини.
- Квінтилі : Розділіть дані на п’ять рівних частин.
- Децилі : Розділіть набір даних на десять інтервалів однакової величини.
- Процентилі : розділити дані на сто еквівалентних частин.
Кожен тип вимірювання положення пояснюється більш детально нижче.
вимірювання центрального положення
Вимірювання положення центру вказує на центральне значення розподілу, тобто вони використовуються для пошуку значення, що представляє центр набору даних. Існують перш за все три міри центрального положення: середнє, медіана та мода.
половина
Щоб обчислити середнє значення, додайте всі значення, а потім розділіть на загальну кількість спостережень. Таким чином, формула середнього значення виглядає наступним чином:
Середнє також відоме як середнє арифметичне або середнє . Крім того, середнє значення статистичного розподілу еквівалентно його математичному сподіванню.
Медіана
Медіана – це середнє значення всіх даних, упорядкованих від найменшого до найбільшого. Іншими словами, медіана ділить упорядкований набір даних на дві рівні частини.
Розрахунок медіани залежить від того, парна чи непарна загальна кількість даних:
- Якщо загальна кількість даних непарна , медіаною буде значення, яке потрапляє прямо в середину даних. Тобто значення, яке знаходиться в позиції (n+1)/2 відсортованих даних.
- Якщо загальна кількість точок даних парна , медіана буде середнім значенням двох точок даних, розташованих у центрі. Тобто середнє арифметичне значень, які знаходяться в позиціях n/2 і n/2+1 упорядкованих даних.
золото
– загальна кількість даних у вибірці, а Me – медіана.
Мода
У статистиці режим — це значення в наборі даних, яке має найвищу абсолютну частоту, тобто режим — це значення, яке найчастіше з’являється в наборі даних.
Тому, щоб обчислити режим набору статистичних даних, просто підрахуйте, скільки разів кожен елемент даних з’являється у вибірці, і найбільш повторюваний елемент даних буде режимом.
Режим також можна назвати статистичним режимом або модальним значенням .
За кількістю найбільш повторюваних значень можна виділити три типи режимів:
- Унімодальний режим : є лише одне значення з максимальною кількістю повторень. Наприклад, [1, 4, 2, 4, 5, 3].
- Бімодальний режим : максимальна кількість повторів відбувається при двох різних значеннях, і обидва значення повторюються однакову кількість разів. Наприклад, [2, 6, 7, 2, 3, 6, 9].
- Мультимодальний режим : три або більше значень мають однакову максимальну кількість повторень. Наприклад, [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1].
Вимірювання нецентрального положення
Вимірювання нецентрального положення використовуються для поділу набору статистичних даних на рівні інтервали. Існує в основному чотири типи вимірювань нецентрального положення: квартилі, квінтилі, децилі та процентилі.
Квартилі
У статистиці квартилі – це три значення, які ділять набір даних на чотири рівні частини. Таким чином, перший, другий і третій квартилі становлять відповідно 25%, 50% і 75% усіх статистичних даних.
Квартилі представлені великою літерою Q та індексом квартиля, тому перший квартиль – Q 1 , другий квартиль – Q 2 , а третій квартиль – Q 3 .
Квінтилі
Квінтилі – це чотири значення, які ділять упорядкований набір даних на п’ять рівних частин. Таким чином, перший, другий, третій і четвертий квінтилі становлять 20%, 40%, 60% і 80% даних вибірки відповідно.
Наприклад, третій квінтиль представляє понад 60% усіх зібраних даних, але менший, ніж решта даних.
Символом для квінтилів є велика літера K з індексом квінтиля, тобто перший квінтиль – K 1 , другий квінтиль – K 2 , третій квінтиль – K 3 і четвертий квінтиль – K 4 . Хоча це також може бути представлено буквою Q (не рекомендується, оскільки це створює плутанину з квартилями).
Децилі
Децилі – це дев’ять значень, які ділять набір упорядкованих даних на десять рівних частин. Таким чином, перший, другий, третій,… дециль представляє 10%, 20%, 30%,… вибірки чи сукупності.
Наприклад, значення четвертого дециля вище за 40% даних, але нижче за решту даних.
Загалом децилі позначаються великою літерою D та децильним індексом, тобто перший дециль — D 1 , другий — D 2 , третій — D 3 тощо.
Процентилі
Процентилі – це значення, які ділять набір упорядкованих даних на сто рівних частин. Таким чином, процентиль вказує значення, нижче якого опускається відсоток набору даних.
Наприклад, значення 35-го процентиля вище за 35% спостережуваних даних, але нижче за решту даних.
Процентиль позначається великою літерою P та індексом процентиля, тобто 1-й процентиль — P 1 , 40-й процентиль — P 40 , 79-й процентиль — P 79 і так далі.