วิธีสร้างเมทริกซ์ความแปรปรวนร่วมใน r


ความแปรปรวนร่วม คือการวัดว่าการเปลี่ยนแปลงในตัวแปรหนึ่งสัมพันธ์กับการเปลี่ยนแปลงในตัวแปรตัวที่สองอย่างไร โดยเฉพาะอย่างยิ่ง มันคือการวัดระดับที่ตัวแปรสองตัวมีความสัมพันธ์กันเชิงเส้นตรง

เมทริกซ์ความแปรปรวนร่วม คือเมทริกซ์จตุรัสที่แสดงความแปรปรวนร่วมระหว่างตัวแปรต่างๆ มากมาย นี่อาจเป็นวิธีที่มีประโยชน์ในการทำความเข้าใจว่าตัวแปรต่างๆ เกี่ยวข้องกันอย่างไรในชุดข้อมูล

ตัวอย่างต่อไปนี้แสดงวิธีการสร้างเมทริกซ์ความแปรปรวนร่วมใน R

วิธีสร้างเมทริกซ์ความแปรปรวนร่วมใน R

ใช้ขั้นตอนต่อไปนี้เพื่อสร้างเมทริกซ์ความแปรปรวนร่วมใน R

ขั้นตอนที่ 1: สร้างกรอบข้อมูล

ขั้นแรก เราจะสร้างกรอบข้อมูลที่มีคะแนนสอบของนักเรียน 10 คนที่แตกต่างกันใน 3 วิชา ได้แก่ คณิตศาสตร์ วิทยาศาสตร์ และประวัติศาสตร์

 #create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                   science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                   history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

   math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

ขั้นตอนที่ 2: สร้างเมทริกซ์ความแปรปรวนร่วม

ต่อไป เราจะสร้างเมทริกซ์ความแปรปรวนร่วมสำหรับชุดข้อมูลนี้โดยใช้ฟังก์ชัน cov() :

 #create covariance matrix
cov(data)

             math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

ขั้นตอนที่ 3: ตีความเมทริกซ์ความแปรปรวนร่วม

ค่าตามเส้นทแยงมุมของเมทริกซ์เป็นเพียงความแปรปรวนของแต่ละเรื่อง ตัวอย่างเช่น:

  • ความแปรปรวนของคะแนนคณิตศาสตร์คือ 72.18
  • ความแปรปรวนของคะแนนวิทยาศาสตร์คือ 62.67
  • ความแปรปรวนของคะแนนในอดีตคือ 83.96

ค่าอื่นๆ ของเมทริกซ์แสดงถึงความแปรปรวนร่วมระหว่างวิชาต่างๆ ตัวอย่างเช่น:

  • ความแปรปรวนร่วมระหว่างคะแนนคณิตศาสตร์และวิทยาศาสตร์คือ 36.89
  • ความแปรปรวนร่วมระหว่างคะแนนคณิตศาสตร์และประวัติศาสตร์คือ -27.16
  • ความแปรปรวนร่วมระหว่างคะแนนวิทยาศาสตร์และประวัติศาสตร์คือ -26.78

จำนวนบวก สำหรับความแปรปรวนร่วมบ่งชี้ว่าตัวแปรสองตัวมีแนวโน้มเพิ่มขึ้นหรือลดลงตามกัน ตัวอย่างเช่น คณิตศาสตร์และวิทยาศาสตร์มีความแปรปรวนร่วมเชิงบวก (36.89) ซึ่งบ่งชี้ว่านักเรียนที่ได้คะแนนสูงในวิชาคณิตศาสตร์ก็มีแนวโน้มที่จะได้คะแนนสูงในวิชาวิทยาศาสตร์เช่นกัน ในทางกลับกัน นักเรียนที่มีผลการเรียนไม่ดีในวิชาคณิตศาสตร์ก็มักจะมีผลการเรียนไม่ดีในวิชาวิทยาศาสตร์เช่นกัน

จำนวนลบ สำหรับความแปรปรวนร่วมบ่งชี้ว่าเมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรตัวที่สองมีแนวโน้มลดลง ตัวอย่างเช่น คณิตศาสตร์และประวัติศาสตร์มีความแปรปรวนร่วมเป็นลบ (-27.16) ซึ่งบ่งชี้ว่านักเรียนที่มีผลการเรียนคณิตศาสตร์สูงมักจะมีผลการเรียนต่ำในประวัติศาสตร์ ในทางกลับกัน นักเรียนที่ได้คะแนนคณิตศาสตร์ต่ำมักจะได้คะแนนสูงในประวัติศาสตร์

คุณสามารถค้นหาบทช่วยสอน R เพิ่มเติมได้ ที่นี่

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *