Ділянка коробки та вуса
У цій статті пояснюється, що таке boxplot, також відомий як boxplot (або boxplot). Ви дізнаєтесь, як створюються ці типи статистичних діаграм, а також розв’яжете вправу на діаграмі коробки та вусів та її інтерпретацію.
Що таке графік коробки та вуса?
Боксплот , також званий боксплотом або боксплотом , — це графік, який візуально представляє набір статистичних даних за допомогою квартилів.
Основною характеристикою прямокутної діаграми є те, що вона дозволяє швидко візуалізувати дисперсію ряду даних, оскільки вона вказує на квартилі, медіану, екстремальні значення та викиди даних.
Таким чином, цей тип діаграми складається з прямокутної рамки та кількох ліній (або вусів), з яких виходять такі значення:
- Межі прямокутника вказують на перший і третій квартилі (Q 1 і Q 3 ). А вертикальна лінія всередині прямокутника є медіаною (еквівалентна другому квартилю Q2 ).
- Межі вусів (або рук) є крайніми значеннями , тобто мінімальним значенням і максимальним значенням ряду даних.
- Точки поза вусами є викидами , або, іншими словами, даними, які, ймовірно, були виміряні неправильно , і тому їх не слід брати до уваги в статистичному дослідженні.
Зауважте, що різниця між третім і першим квартилем є інтерквартильним діапазоном (або інтерквартильним діапазоном), іншим показником статистичної дисперсії.
Коробчаті та вусисті графіки дуже корисні для порівняння числових змінних. Однак він не підходить для представлення категоріальних змінних.
Як створити діаграму коробки та вуса
Щоб створити прямокутну діаграму (або прямокутну діаграму) із ряду даних, необхідно виконати наступні кроки:
- Розберіть приклади статистичних даних.
- Обчисліть квартилі (Q 1 , Q 2 і Q 3 ) і зобразіть їх у вигляді рамки на діаграмі. Перший і третій квартилі відповідають межам прямокутника, і щоб представити медіану (другий квартиль), ви повинні намалювати лінію всередині прямокутника, де розташоване його значення.
- Обчисліть інтерквартильний діапазон, який дорівнює третьому квартилю мінус перший квартиль.
- Обчислити допустимі величини LI і LS, формули яких:
- Визначте вибіркові викиди, які є значеннями, меншими за LI або більшими за LS. Позначте ці значення за межами діапазону вусів крапками.
- Визначте та відобразіть крайні значення, які є найменшим значенням і найбільшим значенням в інтервалі, утвореному LI та LS. Ці значення представляють кінець двох вусів на діаграмі.
Приклад графіка коробки та вуса
Розглянувши визначення та теорію прямокутної діаграми (або прямокутної діаграми), нижче ви знайдете конкретний приклад, щоб краще зрозуміти концепцію та побачити, як виконується цей тип статистичної діаграми.
- Намалюйте коробковий графік наступного набору статистичних даних.
У цьому випадку дані вже впорядковано від найменшого до найбільшого, тому жодних змін не потрібно. В іншому випадку ми повинні спочатку відсортувати вибіркові дані.
По-друге, ми витягуємо квартилі вибірки:
Після того, як ми обчислили три квартилі, ми знаходимо інтерквартильний діапазон, віднімаючи квартиль 3 мінус квартиль 1:
Тепер ми обчислюємо межі LI і LS, які є значеннями, починаючи з яких дані вважаються нетиповими. Для цього необхідно використовувати такі формули:
Тож у цьому випадку ми маємо два викиди, оскільки 3,02 менше за 3,16, а 5,71 більше за 5,56.
Нарешті, залишається визначити крайні значення, які є мінімумом і максимумом усіх даних, які знаходяться в інтервалі [LI,LS]. Тому в нашому прикладі мінімальне значення становить 3,70, а максимальне значення – 4,81.
Отже, коли ми визначили всі значення коробки та діаграми вусів, все, що залишилося, це зробити графічне представлення:
Для чого використовується графік коробки та вуса?
Нарешті, давайте подивимося, для чого це потрібно і як інтерпретувати діаграму коробки та вусів (або коробчату діаграму).
Очевидно, що прямокутний графік дуже корисний для швидкого визначення квартилів, інтерквартильного діапазону, медіани, екстремальних значень і викидів ряду даних, оскільки всі ці статистичні показники можна ідентифікувати простим переглядом.
Крім того, прямокутний графік використовується для аналізу симетрії статистичної вибірки, оскільки він візуально представляє весь набір даних. Якщо медіана знаходиться не в центрі прямокутника, це означає, що вибірка не симетрична.
Подібним чином коробкові діаграми широко використовуються на фондовому ринку для представлення зміни ціни акції протягом певного періоду часу, оскільки вони дозволяють побачити максимальне значення, мінімальне значення та проміжні значення за короткий період часу. час і таким чином швидше приймати рішення.