Як створити коваріаційну матрицю в excel


Коваріація — це міра того, як зміни в одній змінній пов’язані зі змінами в другій змінній. Точніше, це міра ступеня лінійного зв’язку двох змінних.

Формула для обчислення коваріації між двома змінними, X і Y :

COV( X , Y ) = Σ(x- x )(y- y ) / n

Коваріаційна матриця – це квадратна матриця, яка показує коваріацію між багатьма різними змінними. Це може бути простим і корисним способом зрозуміти, як різні змінні пов’язані в наборі даних.

У наступному прикладі показано, як створити коваріаційну матрицю в Excel за допомогою простого набору даних.

Як створити коваріаційну матрицю в Excel

Скажімо, у нас є такий набір даних, який показує тестові результати 10 різних учнів із трьох предметів: математики, природничих наук та історії.

Щоб створити коваріаційну матрицю для цього набору даних, клацніть параметр «Аналіз даних » у верхньому правому куті Excel на вкладці «Дані» .

Набір інструментів аналізу в Excel

Примітка. Якщо ви не бачите опцію «Аналіз даних», спочатку потрібно завантажити пакет інструментів «Аналіз даних» .

Після натискання цієї опції з’явиться нове вікно. Натисніть Коваріація .

У полі «Діапазон введення» введіть «$A$1:$C$11», тому що це діапазон комірок, де знаходиться наш набір даних. Установіть прапорець «Мітки в першому рядку» , щоб повідомити Excel, що мітки для наших змінних знаходяться в першому рядку. Потім у полі «Діапазон виводу» введіть будь-яку клітинку, у якій потрібно розмістити коваріаційну матрицю. Я маю на увазі клітинку $E$2. Потім натисніть OK .

Коваріаційна матриця генерується автоматично та відображається в клітинці $E$2:

Як інтерпретувати коваріаційну матрицю

Якщо у нас є коваріаційна матриця, інтерпретувати значення матриці досить просто.

Значення вздовж діагоналей матриці є просто дисперсіями кожного предмета. Наприклад:

  • Дисперсія балів з математики – 64,96
  • Дисперсія балів з природничих наук становить 56,4
  • Історична дисперсія оцінки становить 75,56

Інші значення матриці представляють коваріації між різними предметами. Наприклад:

  • Коваріація між балами з математики та природничих наук становить 33,2.
  • Коваріація між балами з математики та історії становить -24,44.
  • Коваріація між балами з науки та історії становить -24,1.

Додатне число для коваріації вказує на те, що дві змінні мають тенденцію до збільшення або зменшення в тандемі. Наприклад, математика та природничі науки мають позитивну коваріацію (33,2), що вказує на те, що учні, які мають високі результати з математики, також, як правило, отримують високі результати з природничих наук. Подібним чином, учні, які мають погані результати в математиці, також, як правило, мають погані результати в науках.

Від’ємне число для коваріації вказує на те, що коли одна змінна збільшується, друга змінна має тенденцію до зменшення. Наприклад, математика та історія мають негативну коваріацію (-24,44), що вказує на те, що учні, які мають високі результати з математики, зазвичай отримують низькі результати з історії. Так само учні, які мають низькі результати з математики, зазвичай отримують високі результати з історії.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *