Медіана

У цій статті пояснюється, що таке медіана набору даних і як знайти медіану для незгрупованих і згрупованих даних. Крім того, ви можете розрахувати медіану будь-якого ряду даних за допомогою онлайн-калькулятора в кінці.

Що таке медіана?

У статистиці медіана – це середнє значення всіх даних, упорядкованих від найменшого до найбільшого. Іншими словами, медіана ділить упорядкований набір даних на дві рівні частини.

Медіана є мірою центрального положення, яка використовується для опису розподілу ймовірностей.

медіана

👉 Ви можете скористатися калькулятором нижче, щоб обчислити медіану будь-якого набору даних.

Взагалі, термін Я часто вживається як символ середини.

Іншими показниками центрального положення є середнє значення та мода, нижче ми побачимо відмінності між ними. Так само мірами нецентрального положення є квартилі, квінтилі, децилі, процентилі тощо.

Слід зазначити, що медіана набору даних збігається з другим квартилем, п’ятим децилем і 50-м процентилем.

Як обчислити медіану

Розрахунок медіани залежить від того, парна чи непарна загальна кількість даних:

  • Якщо загальна кількість даних непарна , медіаною буде значення, яке потрапляє прямо в середину даних. Тобто значення, яке знаходиться в позиції (n+1)/2 відсортованих даних.
  • Me=x_{\frac{n+1}{2}

  • Якщо загальна кількість точок даних парна , медіана буде середнім значенням двох точок даних, розташованих у центрі. Тобто середнє арифметичне значень, які знаходяться в позиціях n/2 і n/2+1 упорядкованих даних.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

золото

n

це загальна кількість елементів даних у вибірці.

Приклади обчислення медіани

Щоб ви могли побачити, як обчислюється медіана, нижче наведено два реальні приклади, по одному для кожного випадку. Спочатку буде обчислено медіану непарного набору даних, потім медіану буде обчислено для парного набору даних.

Медіана непарних даних

  • Обчисліть медіану таких даних: 3, 4, 1, 6, 7, 4, 8, 2, 8, 4, 5

Перше, що нам потрібно зробити перед тим, як виконувати обчислення, це впорядкувати дані, тобто розмістити числа від найменшого до найбільшого.

1 \ 2 \ 3 \ 4 \ 4 \ 4 \ 5 \ 6 \ 7 \ 8 \ 8

У цьому випадку ми маємо 11 спостережень, тому загальна кількість даних непарна. Тому ми застосовуємо наступну формулу для обчислення положення медіани:

\cfrac{n+1}{2}=\cfrac{11+1}{2}=6

Тому медіаною будуть дані, розташовані на шостій позиції, що в даному випадку відповідає значенню 4.

Me=x_6=4

медіана парних даних

  • Яка медіана наступних спостережень? 2, 6, 2, 8, 9, 4, 7, 11, 4, 13

Щоб отримати медіану, потрібно спочатку відсортувати всі дані в порядку зростання:

2 \ 2 \ 4 \ 4 \ 6 \ 7 \ 8 \ 9 \ 11 \ 13

Цей приклад відрізняється від попереднього, оскільки цього разу ми маємо 10 спостережень, що є парною кількістю. Тому процедура визначення середнього показника дещо складніша.

Спочатку потрібно обчислити дві центральні позиції, між якими буде знаходитися медіана, для цього потрібно застосувати наступні дві формули:

\cfrac{n}{2}=\cfrac{10}{2}=5

\cfrac{n}{2}+1=\cfrac{10}{2}+1=6

Таким чином, медіана буде між п’ятою та шостою позицією, що відповідає відповідно значенням 6 і 7. Конкретно, медіана буде середнім арифметичним зазначених значень:

Me=\cfrac{x_5+x_6}{2}=\cfrac{6+7}{2}=6,5

калькулятор медіан

Введіть набір статистичних даних у наступний калькулятор, щоб обчислити його медіану. Дані повинні бути розділені пробілом і введені крапкою як десятковим роздільником.

Медіана для згрупованих даних

Щоб обчислити медіану, коли дані згруповано в інтервали, потрібно спочатку знайти інтервал або бін, у який потрапляє медіана, використовуючи таку формулу:

\cfrac{n+1}{2}

Таким чином, медіана буде в інтервалі, кумулятивна абсолютна частота якого відразу перевищує число, отримане з попереднім алгебраїчним виразом.

І коли ми знаємо інтервал, до якого належить медіана, ми повинні застосувати таку формулу, щоб знайти точне значення медіани:

Me=L_i+ \cfrac{\displaystyle\frac{n+1}{2}-F_{i-1}}{f_i}\cdot I_i

золото:

  • L i – нижня межа інтервалу, в якому лежить медіана.
  • n – загальна кількість спостережень.
  • F i-1 – накопичена абсолютна частота попереднього інтервалу.
  • f i – абсолютна частота інтервалу, в якому лежить медіана.
  • I i – ширина середнього інтервалу.

Як приклад, нижче ви розв’язали вправу, у якій обчислюється медіана даних, згрупованих у інтервали.

медіана об’єднаних даних

Щоб знайти медіану набору даних, нам спочатку потрібно визначити діапазон, у який вона потрапляє. Для цього використовуємо таку формулу:

\cfrac{n+1}{2}=\cfrac{30+1}{2} =15,5 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [60,70)

Отже, медіана знаходитиметься в інтервалі, сукупна абсолютна частота якого безпосередньо перевищує 15,5, що в даному випадку є інтервалом [60,70), сукупна абсолютна частота якого дорівнює 26. І як тільки ми знаємо медіанний інтервал, ми застосовуємо другу формулу процес:

Me=L_i+ \cfrac{\displaystyle\frac{n+1}{2}-F_{i-1}}{f_i}\cdot I_i

Me=60+\cfrac{\displaystyle\frac{30+1}{2}-15}{11}\cdot 10=60,45

Зрештою, медіана об’єднаного набору даних становить 60,45. Як бачите, у задачах такого типу медіана зазвичай є десятковим числом.

медіана, середнє та мода

У цьому останньому розділі ми побачимо різницю між медіаною, середнім і модою. Ну, це три статистичні показники центральної позиції, але їх значення різне.

Як ми бачили, медіана визначається як значення, яке займає центральне положення, коли дані впорядковані.

Навпаки, середнє значення є середнім значенням усіх статистичних даних. Щоб обчислити середнє значення, потрібно додати всі дані, а потім розділити результат на кількість точок даних.

Нарешті, режим — це значення, яке найчастіше повторюється в ряді даних.

Як бачите, усі три статистичні показники допомагають описати розподіл ймовірностей, оскільки вони дають уявлення про його центральні значення. Однак жодна міра не краща за іншу, вони просто стосуються різних понять.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *