5 примеров двумерных данных в реальной жизни
Двумерные данные относятся к набору данных, содержащему ровно две переменные.
Этот тип данных постоянно появляется в реальных ситуациях, и для анализа этого типа данных мы обычно используем следующие методы:
- Облака точек
- Коэффициенты корреляции
- Простая линейная регрессия
В следующих примерах показаны различные сценарии появления двумерных данных в реальной жизни.
Пример 1: Бизнес
Компании часто собирают двумерные данные об общей сумме денег, потраченных на рекламу, и общем доходе.
Например, компания может собрать следующие данные за 12 последовательных кварталов продаж:
Это пример двумерных данных, поскольку они содержат информацию ровно о двух переменных: расходах на рекламу и общем доходе.
Компания может решить подогнать к этому набору данных простую модель линейной регрессии и найти следующую подобранную модель:
Общий доход = 14 942,75 + 2,70* (расходы на рекламу)
Это говорит компании о том, что на каждый дополнительный доллар, потраченный на рекламу, общий доход увеличивается в среднем на 2,70 доллара.
Пример 2: Медицинский
Исследователи-медики часто собирают двумерные данные, чтобы лучше понять взаимосвязь между переменными, связанными со здоровьем.
Например, исследователь может собрать следующие данные о возрасте и оставшейся частоте пульса у 15 человек:
Затем исследователь может решить вычислить корреляцию между двумя переменными и найти ее равной 0,812 .
Это указывает на то, что между двумя переменными существует сильная положительная корреляция. То есть с возрастом остаточная частота сердечных сокращений также имеет тенденцию к предсказуемому увеличению.
Связанный: Что считается «сильной» корреляцией?
Пример 3: ученые
Исследователи часто собирают двумерные данные, чтобы понять, какие переменные влияют на успеваемость студентов.
Например, исследователь может собрать данные о количестве учебных часов в неделю и соответствующем среднем балле учащихся определенного класса:
Затем она может создать простую диаграмму рассеяния, чтобы визуализировать взаимосвязь между этими двумя переменными:
Между этими двумя переменными явно существует положительная связь: по мере увеличения количества учебных часов в неделю средний балл учащегося также имеет тенденцию к увеличению.
Пример 4: Экономика
Экономисты часто собирают двумерные данные, чтобы понять взаимосвязь между двумя социально-экономическими переменными.
Например, экономист может собрать данные об общем количестве лет обучения и общем годовом доходе людей в определенном городе:
Затем он может решить адаптировать следующую простую модель линейной регрессии:
Годовой доход = -45 353 + 7 120*(Годы обучения)
Это говорит экономисту, что за каждый дополнительный год обучения годовой доход увеличивается в среднем на 7120 долларов.
Пример 5: Биология
Биологи часто собирают двумерные данные, чтобы понять, как две переменные связаны между растениями и животными.
Например, биолог может собрать данные об общем количестве осадков и общем количестве растений в разных регионах:
Затем биолог может решить вычислить корреляцию между двумя переменными и найти ее равной 0,926 .
Это указывает на то, что между двумя переменными существует сильная положительная корреляция.
То есть увеличение количества осадков тесно связано с увеличением количества растений в регионе.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о двумерных данных и способах их анализа.
Введение в двумерный анализ
Введение в одномерный анализ
Введение в коэффициент корреляции Пирсона
Введение в простую линейную регрессию