5 прикладів двовимірних даних у реальному житті


Двомірні дані стосуються набору даних, що містить рівно дві змінні.

Цей тип даних постійно з’являється в реальних ситуаціях, і ми зазвичай використовуємо наведені нижче методи для аналізу цього типу даних.

  • Хмари точок
  • Коефіцієнти кореляції
  • Проста лінійна регресія

У наведених нижче прикладах показано різні сценарії, у яких двовимірні дані з’являються в реальному житті.

Приклад 1: Бізнес

Компанії часто збирають двовимірні дані про загальну суму грошей, витрачених на рекламу, і загальний дохід.

Наприклад, компанія може збирати такі дані за 12 кварталів продажів поспіль:

Це приклад двовимірних даних, оскільки він містить інформацію про дві змінні: витрати на рекламу та загальний дохід.

Компанія може прийняти рішення підібрати просту модель лінійної регресії до цього набору даних і знайти таку підігнану модель:

Загальний дохід = 14 942,75 + 2,70* (витрати на рекламу)

Це говорить компанії, що з кожним додатковим доларом, витраченим на рекламу, загальний дохід збільшується в середньому на 2,70 долара.

Приклад 2: Медичний

Медичні дослідники часто збирають двофакторні дані, щоб краще зрозуміти взаємозв’язок між змінними, пов’язаними зі здоров’ям.

Наприклад, дослідник може зібрати такі дані про вік і частоту серцевих скорочень від 15 осіб:

Потім дослідник може вирішити обчислити кореляцію між двома змінними та знайти, що вона дорівнює 0,812 .

Це вказує на те, що існує сильна позитивна кореляція між двома змінними. Тобто зі збільшенням віку залишкова частота серцевих скорочень також має тенденцію до прогнозованого збільшення.

За темою: що вважається «сильною» кореляцією?

Приклад 3: академіки

Дослідники часто збирають двовимірні дані, щоб зрозуміти, які змінні впливають на успішність студентів.

Наприклад, дослідник може зібрати дані про кількість вивчених годин на тиждень і відповідний середній бал для учнів певного класу:

Потім вона може створити просту діаграму розсіювання, щоб візуалізувати зв’язок між цими двома змінними:

Існує чіткий позитивний зв’язок між двома змінними: із збільшенням кількості годин, які навчаються на тиждень, середній бал учня також має тенденцію до зростання.

Приклад 4: Економіка

Економісти часто збирають двофакторні дані, щоб зрозуміти зв’язок між двома соціально-економічними змінними.

Наприклад, економіст може зібрати дані про загальну кількість років навчання та загальний річний дохід осіб у певному місті:

Потім він може вирішити адаптувати таку просту модель лінійної регресії:

Річний дохід = -45 353 + 7 120*(Роки навчання)

Це говорить економісту, що за кожен додатковий рік навчання річний дохід зростає в середньому на 7120 доларів.

Приклад 5: Біологія

Біологи часто збирають двофакторні дані, щоб зрозуміти, як дві змінні пов’язані між рослинами чи тваринами.

Наприклад, біолог може зібрати дані про загальну кількість опадів і загальну кількість рослин у різних регіонах:

Потім біолог може вирішити обчислити кореляцію між двома змінними та знайти, що вона дорівнює 0,926 .

Це вказує на те, що існує сильна позитивна кореляція між двома змінними.

Тобто більша кількість опадів тісно пов’язана зі збільшенням кількості рослин у регіоні.

Додаткові ресурси

У наступних посібниках надається додаткова інформація про двовимірні дані та способи їх аналізу.

Вступ до двовимірного аналізу
Вступ до однофакторного аналізу
Введення в коефіцієнт кореляції Пірсона
Вступ до простої лінійної регресії

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *