5 прикладів двовимірних даних у реальному житті
Двомірні дані стосуються набору даних, що містить рівно дві змінні.
Цей тип даних постійно з’являється в реальних ситуаціях, і ми зазвичай використовуємо наведені нижче методи для аналізу цього типу даних.
- Хмари точок
- Коефіцієнти кореляції
- Проста лінійна регресія
У наведених нижче прикладах показано різні сценарії, у яких двовимірні дані з’являються в реальному житті.
Приклад 1: Бізнес
Компанії часто збирають двовимірні дані про загальну суму грошей, витрачених на рекламу, і загальний дохід.
Наприклад, компанія може збирати такі дані за 12 кварталів продажів поспіль:
Це приклад двовимірних даних, оскільки він містить інформацію про дві змінні: витрати на рекламу та загальний дохід.
Компанія може прийняти рішення підібрати просту модель лінійної регресії до цього набору даних і знайти таку підігнану модель:
Загальний дохід = 14 942,75 + 2,70* (витрати на рекламу)
Це говорить компанії, що з кожним додатковим доларом, витраченим на рекламу, загальний дохід збільшується в середньому на 2,70 долара.
Приклад 2: Медичний
Медичні дослідники часто збирають двофакторні дані, щоб краще зрозуміти взаємозв’язок між змінними, пов’язаними зі здоров’ям.
Наприклад, дослідник може зібрати такі дані про вік і частоту серцевих скорочень від 15 осіб:
Потім дослідник може вирішити обчислити кореляцію між двома змінними та знайти, що вона дорівнює 0,812 .
Це вказує на те, що існує сильна позитивна кореляція між двома змінними. Тобто зі збільшенням віку залишкова частота серцевих скорочень також має тенденцію до прогнозованого збільшення.
За темою: що вважається «сильною» кореляцією?
Приклад 3: академіки
Дослідники часто збирають двовимірні дані, щоб зрозуміти, які змінні впливають на успішність студентів.
Наприклад, дослідник може зібрати дані про кількість вивчених годин на тиждень і відповідний середній бал для учнів певного класу:
Потім вона може створити просту діаграму розсіювання, щоб візуалізувати зв’язок між цими двома змінними:
Існує чіткий позитивний зв’язок між двома змінними: із збільшенням кількості годин, які навчаються на тиждень, середній бал учня також має тенденцію до зростання.
Приклад 4: Економіка
Економісти часто збирають двофакторні дані, щоб зрозуміти зв’язок між двома соціально-економічними змінними.
Наприклад, економіст може зібрати дані про загальну кількість років навчання та загальний річний дохід осіб у певному місті:
Потім він може вирішити адаптувати таку просту модель лінійної регресії:
Річний дохід = -45 353 + 7 120*(Роки навчання)
Це говорить економісту, що за кожен додатковий рік навчання річний дохід зростає в середньому на 7120 доларів.
Приклад 5: Біологія
Біологи часто збирають двофакторні дані, щоб зрозуміти, як дві змінні пов’язані між рослинами чи тваринами.
Наприклад, біолог може зібрати дані про загальну кількість опадів і загальну кількість рослин у різних регіонах:
Потім біолог може вирішити обчислити кореляцію між двома змінними та знайти, що вона дорівнює 0,926 .
Це вказує на те, що існує сильна позитивна кореляція між двома змінними.
Тобто більша кількість опадів тісно пов’язана зі збільшенням кількості рослин у регіоні.
Додаткові ресурси
У наступних посібниках надається додаткова інформація про двовимірні дані та способи їх аналізу.
Вступ до двовимірного аналізу
Вступ до однофакторного аналізу
Введення в коефіцієнт кореляції Пірсона
Вступ до простої лінійної регресії