Короткий вступ до двовимірного аналізу
Термін двовимірний аналіз стосується аналізу двох змінних. Ви можете запам’ятати це, тому що префікс “бі” означає “два”.
Метою двофакторного аналізу є розуміння зв’язку між двома змінними. Ви можете порівняти цей тип аналізу з наступним:
- Однофакторний аналіз : аналіз однієї змінної.
- Багатофакторний аналіз: аналіз двох або більше змінних.
Існує три поширених способи виконання двовимірного аналізу:
1. Діаграма розсіювання.
2. Коефіцієнти кореляції.
3. Проста лінійна регресія.
У цьому підручнику наведено приклади кожного з цих типів двовимірного аналізу з використанням наведеного нижче набору даних, який містить інформацію про дві змінні: (1) години, витрачені на навчання, і (2) результати іспитів, отримані 20 різними студентами:
1. Хмари точок
Діаграма розсіювання забезпечує візуальний спосіб виконання двовимірного аналізу. Це дозволяє нам візуалізувати зв’язок між двома змінними, помістивши значення однієї змінної на вісь X, а значення іншої змінної – на вісь Y.
На діаграмі розсіювання нижче ми відклали вивчені години на вісь х, а результати іспитів на вісь у:
Ми чітко бачимо, що існує позитивний зв’язок між двома змінними: зі збільшенням кількості навчальних годин результати іспитів також мають тенденцію до зростання.
2. Коефіцієнти кореляції
Коефіцієнт кореляції забезпечує інший спосіб виконання двовимірного аналізу. Найпоширенішим типом коефіцієнта кореляції є коефіцієнт кореляції Пірсона , який є мірою лінійного зв’язку між двома змінними. Він має значення від -1 до 1, де:
- -1 вказує на абсолютно негативну лінійну кореляцію між двома змінними
- 0 означає відсутність лінійної кореляції між двома змінними
- 1 вказує на абсолютно позитивну лінійну кореляцію між двома змінними
Ця проста метрика дає нам гарне уявлення про те, як пов’язані дві змінні. На практиці ми часто використовуємо діаграми розсіювання та коефіцієнти кореляції, щоб зрозуміти взаємозв’язок між двома змінними, щоб ми могли візуалізувати та кількісно визначити їхній зв’язок.
3. Проста лінійна регресія
Третій спосіб виконання двофакторного аналізу полягає у використанні простої лінійної регресії .
Використовуючи цей метод, ми обираємо одну змінну як пояснювальну змінну , а іншу – як змінну відповіді . Потім ми знаходимо рядок, який найкраще «відповідає» набору даних, який потім можемо використовувати, щоб зрозуміти точний зв’язок між двома змінними.
Наприклад, найкраще підходить рядок для вищенаведеного набору даних:
Бал іспиту = 69,07 + 3,85*(вивчені години)
Це означає, що кожна додаткова вивчена година пов’язана зі збільшенням середнього балу за іспит на 3,85. Підібравши цю лінійну регресійну модель, ми можемо кількісно визначити точне співвідношення між годинами навчання та оцінкою іспиту.
Пов’язане: Як виконати просту лінійну регресію в Excel
Висновок
Двофакторний аналіз є одним із найбільш часто використовуваних типів аналізу в статистиці, оскільки ми часто хочемо зрозуміти зв’язок між двома змінними.
Використовуючи діаграми розсіювання, коефіцієнти кореляції та просту лінійну регресію, ми можемо візуалізувати та кількісно визначити зв’язок між двома змінними.
Часто ці три методи використовуються разом в аналізі, щоб отримати повну картину зв’язку між двома змінними. Тому варто ознайомитися з кожним методом.