Чому медіана важлива в статистиці?


Медіана представляє середнє значення набору даних, коли всі значення впорядковані від найменшого до найбільшого.

Наприклад, медіана в наступному наборі даних становить 19:

Набір даних: 3, 4, 11, 15, 19 , 22, 23, 23, 26

Медіана також представляє 50-й процентиль набору даних. Тобто рівно половина значень у наборі даних вище медіани, а половина значень — нижче.

Медіана є важливим показником для обчислення, оскільки вона дає нам уявлення про те, де знаходиться «центр» набору даних. Це також дає нам уявлення про «типове» значення в даному наборі даних.

Наприклад, скажімо, у нас є набір даних, що містить ціни продажу 10 000 різних будинків у певному місті.

Замість перегляду рядків і рядківвихідних даних ми можемо обчислити середнє значення, щоб швидко зрозуміти середню ціну продажу будинків у цьому місті.

Знаючи, що середня ціна продажу становить 271 000 доларів США, ми знаємо, що рівно половина з 10 000 будинків продана за цю суму дорожче, а інша половина – за менше.

Це також дає нам уявлення про «типову» ціну продажу будинків у цьому місті.

Коли використовувати медіану

Аналізуючи набори даних, ми часто хочемо зрозуміти, де лежить центральна цінність.

У статистиці є два загальні показники, які ми використовуємо для вимірювання центру набору даних:

  • Середнє : середнє значення в наборі даних
  • Медіана : середнє значення в наборі даних

Виявляється, медіана є більш корисним показником за таких обставин:

Щоб проілюструвати це, розглянемо наступні два приклади.

Приклад 1: обчислення медіани нерівного розподілу

Розглянемо наступний розподіл зарплат жителів певного міста:

Медіана краще відображає «типову» зарплату жителя, ніж середня, оскільки розподіл зміщений вправо.

Це означає, що висока заробітна плата в правій частині розподілу відсуває середнє значення від центру розподілу.

У цьому конкретному прикладі середня зарплата становить 47 000 доларів США, а середня зарплата – 32 000 доларів США. Медіана набагато більше відповідає типовій зарплаті в цьому місті.

Приклад 2: обчислення медіани за наявності викидів

Розглянемо наступний графік, який показує площу будинків на певній вулиці:

Коли використовувати середнє значення проти медіани

На середнє значення сильно впливають кілька надзвичайно великих будинків, а на медіану – ні.

Ми бачимо, що медіана краще фіксує «типову» площу будинку на цій вулиці, ніж середня, оскільки на неї не впливають викиди.

Резюме

Ось короткий виклад основних моментів, розглянутих у цій статті:

  • Медіана представляє середнє значення в наборі даних.
  • Медіана важлива, оскільки вона дає нам уявлення про те, де знаходиться центральне значення в наборі даних.
  • Медіана, як правило, корисніша для обчислення, ніж середнє, коли розподіл спотворений і/або має викиди.

Додаткові ресурси

Конкретні приклади: використання середнього значення, медіани та моди
Коли використовувати середнє проти Медіана: з прикладами
Чому режим важливий у статистиці?

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *