Як створити коваріаційну матрицю в r


Коваріація — це міра того, як зміни в одній змінній пов’язані зі змінами в другій змінній. Точніше, це міра ступеня лінійного зв’язку двох змінних.

Коваріаційна матриця – це квадратна матриця, яка показує коваріацію між багатьма різними змінними. Це може бути корисним способом зрозуміти, як різні змінні пов’язані в наборі даних.

У наступному прикладі показано, як створити коваріаційну матрицю в R.

Як створити коваріаційну матрицю в R

Виконайте наступні кроки, щоб створити коваріаційну матрицю в R.

Крок 1: Створіть фрейм даних.

Спочатку ми створимо фрейм даних, що містить тестові результати 10 різних студентів із трьох предметів: математики, природничих наук та історії.

 #create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                   science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                   history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

   math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

Крок 2: Створіть коваріаційну матрицю.

Далі ми створимо коваріаційну матрицю для цього набору даних за допомогою функції cov() :

 #create covariance matrix
cov(data)

             math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

Крок 3: Інтерпретація коваріаційної матриці.

Значення вздовж діагоналей матриці є просто дисперсіями кожного предмета. Наприклад:

  • Дисперсія балів з математики становить 72,18
  • Дисперсія наукових балів становить 62,67
  • Історична дисперсія балів становить 83,96

Інші значення матриці представляють коваріації між різними предметами. Наприклад:

  • Коваріація між балами з математики та природничих наук становить 36,89.
  • Коваріація між балами з математики та історії становить -27,16.
  • Коваріація між балами з науки та історії становить -26,78.

Додатне число для коваріації вказує на те, що дві змінні мають тенденцію до збільшення або зменшення в тандемі. Наприклад, математика та природничі науки мають позитивну коваріацію (36,89), що вказує на те, що учні, які мають високі результати з математики, також, як правило, отримують високі результати з природничих наук. Навпаки, учні, які мають погані результати в математиці, також, як правило, мають погані результати в науках.

Від’ємне число для коваріації вказує на те, що коли одна змінна збільшується, друга змінна має тенденцію до зменшення. Наприклад, математика та історія мають негативну коваріацію (-27,16), що вказує на те, що учні з високими показниками з математики, як правило, мають низькі показники з історії. Навпаки, учні, які мають низькі результати з математики, зазвичай отримують високі результати з історії.

Ви можете знайти більше підручників з R тут .

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *