Вимірювання центральної тенденції
У цій статті ви дізнаєтеся, що таке міри центральної тенденції, що вони собою являють, приклади всіх типів мір центральної тенденції, а також зможете розрахувати всі міри центральної тенденції вибірки за допомогою онлайн-калькулятора. .
Що таке міри центральної тенденції?
Міри центральної тенденції або міри централізації — це статистичні міри, які вказують на центральне значення розподілу. Іншими словами, вимірювання центральної тенденції використовуються для пошуку значення, яке представляє центр набору даних.
Найбільш часто використовуваними мірами центральної тенденції є середнє, медіана та мода.
Міри центральної тенденції також називаються мірами центральної позиції .
Що таке міри центральної тенденції?
Міри центральної тенденції:
- Середнє : це середнє значення всіх даних у вибірці.
- Медіана : це середнє значення всіх даних, упорядкованих від найменшого до найбільшого.
- Режим : це значення, яке найчастіше повторюється в наборі даних.
Ці три статистичні показники пояснюються більш детально нижче.
👉 Ви можете використовувати наведений нижче калькулятор, щоб обчислити показники центральної тенденції для будь-якого набору даних.
половина
Щоб обчислити середнє значення, додайте всі значення, а потім розділіть на загальну кількість даних. Таким чином, формула середнього значення виглядає наступним чином:
Середній символ – горизонтальна смуга над літерою х
Хоча ви також можете відрізнити середнє значення вибірки від середнього сукупності за допомогою символу середнього: середнє значення вибірки виражається символом
, тоді як середнє населення використовує грецьку літеру
Середнє також відоме як середнє арифметичне або середнє . Крім того, середнє значення статистичного розподілу еквівалентно його математичному сподіванню.
Середній приклад
- За навчальний рік учень отримав такі оцінки: з математики – 9, з мови – 7, з історії – 6, з економіки – 8, з природознавства – 7,5. Яке середнє серед усіх ваших оцінок?
Щоб знайти середнє арифметичне, потрібно скласти всі оцінки, а потім розділити на загальну кількість предметів у курсі, тобто 5. Тому застосовуємо формулу середнього арифметичного:
Підставляємо дані у формулу і обчислюємо середнє арифметичне:
Як бачимо, у середньому арифметичному кожному значенню присвоюється однакова вага, тобто кожна частина даних має однакову вагу в межах цілого.
Розрахунок цього типу вимірювання центральної тенденції дещо змінюється, коли дані групуються за інтервалами, ви можете побачити, як це робиться тут:
Медіана
Медіана – це середнє значення всіх елементів даних, упорядкованих від найменшого до найбільшого. Іншими словами, медіана ділить упорядкований набір даних на дві рівні частини.
Розрахунок медіани залежить від того, парна чи непарна загальна кількість даних:
- Якщо загальна кількість елементів даних непарна , медіаною буде значення, яке знаходиться прямо посередині даних. Тобто значення, яке знаходиться в позиції (n+1)/2 відсортованих даних.
- Якщо загальна кількість елементів даних парна , медіана буде середнім значенням двох елементів даних у центрі. Тобто середнє арифметичне значень, які знаходяться в позиціях n/2 і n/2+1 упорядкованих даних.
золото
це загальна кількість даних у вибірці, а символ Me вказує на медіану.
Медіанний приклад
- Знайдіть медіану таких даних: 3, 4, 1, 6, 7, 4, 8, 2, 8, 4, 5
Перше, що потрібно зробити перед тим, як робити обчислення, це класифікувати дані, тобто розташувати числа від найменшого до найбільшого.
У цьому випадку ми маємо 11 спостережень, тому загальна кількість даних непарна. Тому ми застосовуємо наступну формулу для обчислення положення медіани:
Тому медіаною будуть дані, розташовані на шостій позиції, що в даному випадку відповідає значенню 4.
Щоб побачити, як цей тип центральної міри тенденції обчислюється для згрупованих даних, натисніть тут:
Мода
У статистиці мода – це значення в наборі даних, яке має найвищу абсолютну частоту, тобто мода – це найбільш повторюване значення в наборі даних.
Тому, щоб обчислити режим набору статистичних даних, просто підрахуйте, скільки разів кожен елемент даних з’являється у вибірці, і найбільш повторювані дані будуть режимом.
Режим також можна назвати статистичним режимом або модальним значенням .
За кількістю найбільш повторюваних значень можна виділити три типи режимів:
- Унімодальний режим : є лише одне значення з максимальною кількістю повторів. Наприклад, [1, 4, 2, 4, 5, 3].
- Бімодальний режим : максимальна кількість повторів відбувається при двох різних значеннях, і обидва значення повторюються однакову кількість разів. Наприклад, [2, 6, 7, 2, 3, 6, 9].
- Мультимодальний режим : три або більше значень мають однакову максимальну кількість повторень. Наприклад, [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1].
приклад моди
- Який режим наступного набору даних?
Числа не в порядку, тому перше, що ми зробимо, це відсортуємо їх. Цей крок не є обов’язковим, але він допоможе вам легше знайти моду.
Числа 2 і 9 з’являються двічі, але число 5 повторюється тричі. Таким чином, режим ряду даних номер 5.
Коли дані групуються в класи або інтервали, режим потрібно обчислювати за допомогою спеціальної формули. Натисніть посилання нижче, щоб дізнатися, як:
Вимірювання калькулятора центральної тенденції
Введіть дані з будь-якої статистичної вибірки в наступний онлайн-калькулятор, щоб обчислити всі його показники центральної тенденції. Дані повинні бути розділені пробілом і введені крапкою як десятковим роздільником.
Для чого використовуються показники центральної тенденції?
Насамперед, міри центральної тенденції використовуються для знаходження числа, яке представляє центральні значення набору статистичних даних. Отже, мета цих статистичних параметрів — допомогти отримати уявлення про значення, знайдені в ряді даних.
Крім того, показники центральної тенденції дуже корисні для порівняння. Наприклад, якщо середня оцінка контролю якості продукту становить 8, а новий продукт виробляється і отримує оцінку 6, це означає, що цей новий продукт гірший, ніж зазвичай вироблений.
Однак важко дізнатися форму розподілу, якщо ми знаємо лише показники центральної тенденції. Ось чому рекомендується комбінувати заходи центральної тенденції з мірами дисперсії, оскільки вони дозволяють визначити, чи дані зосереджені навколо центральних значень, чи, навпаки, дані розсіяні.