วิธีสร้างเมทริกซ์ความแปรปรวนร่วมใน r
ความแปรปรวนร่วม คือการวัดว่าการเปลี่ยนแปลงในตัวแปรหนึ่งสัมพันธ์กับการเปลี่ยนแปลงในตัวแปรตัวที่สองอย่างไร โดยเฉพาะอย่างยิ่ง มันคือการวัดระดับที่ตัวแปรสองตัวมีความสัมพันธ์กันเชิงเส้นตรง
เมทริกซ์ความแปรปรวนร่วม คือเมทริกซ์จตุรัสที่แสดงความแปรปรวนร่วมระหว่างตัวแปรต่างๆ มากมาย นี่อาจเป็นวิธีที่มีประโยชน์ในการทำความเข้าใจว่าตัวแปรต่างๆ เกี่ยวข้องกันอย่างไรในชุดข้อมูล
ตัวอย่างต่อไปนี้แสดงวิธีการสร้างเมทริกซ์ความแปรปรวนร่วมใน R
วิธีสร้างเมทริกซ์ความแปรปรวนร่วมใน R
ใช้ขั้นตอนต่อไปนี้เพื่อสร้างเมทริกซ์ความแปรปรวนร่วมใน R
ขั้นตอนที่ 1: สร้างกรอบข้อมูล
ขั้นแรก เราจะสร้างกรอบข้อมูลที่มีคะแนนสอบของนักเรียน 10 คนที่แตกต่างกันใน 3 วิชา ได้แก่ คณิตศาสตร์ วิทยาศาสตร์ และประวัติศาสตร์
#create data frame data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95), science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94), history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78)) #view data frame data math science history 1 84 85 97 2 82 82 94 3 81 72 93 4 89 77 95 5 73 75 88 6 94 89 82 7 92 95 78 8 70 84 84 9 88 77 69 10 95 94 78
ขั้นตอนที่ 2: สร้างเมทริกซ์ความแปรปรวนร่วม
ต่อไป เราจะสร้างเมทริกซ์ความแปรปรวนร่วมสำหรับชุดข้อมูลนี้โดยใช้ฟังก์ชัน cov() :
#create covariance matrix
cov(data)
math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556
ขั้นตอนที่ 3: ตีความเมทริกซ์ความแปรปรวนร่วม
ค่าตามเส้นทแยงมุมของเมทริกซ์เป็นเพียงความแปรปรวนของแต่ละเรื่อง ตัวอย่างเช่น:
- ความแปรปรวนของคะแนนคณิตศาสตร์คือ 72.18
- ความแปรปรวนของคะแนนวิทยาศาสตร์คือ 62.67
- ความแปรปรวนของคะแนนในอดีตคือ 83.96
ค่าอื่นๆ ของเมทริกซ์แสดงถึงความแปรปรวนร่วมระหว่างวิชาต่างๆ ตัวอย่างเช่น:
- ความแปรปรวนร่วมระหว่างคะแนนคณิตศาสตร์และวิทยาศาสตร์คือ 36.89
- ความแปรปรวนร่วมระหว่างคะแนนคณิตศาสตร์และประวัติศาสตร์คือ -27.16
- ความแปรปรวนร่วมระหว่างคะแนนวิทยาศาสตร์และประวัติศาสตร์คือ -26.78
จำนวนบวก สำหรับความแปรปรวนร่วมบ่งชี้ว่าตัวแปรสองตัวมีแนวโน้มเพิ่มขึ้นหรือลดลงตามกัน ตัวอย่างเช่น คณิตศาสตร์และวิทยาศาสตร์มีความแปรปรวนร่วมเชิงบวก (36.89) ซึ่งบ่งชี้ว่านักเรียนที่ได้คะแนนสูงในวิชาคณิตศาสตร์ก็มีแนวโน้มที่จะได้คะแนนสูงในวิชาวิทยาศาสตร์เช่นกัน ในทางกลับกัน นักเรียนที่มีผลการเรียนไม่ดีในวิชาคณิตศาสตร์ก็มักจะมีผลการเรียนไม่ดีในวิชาวิทยาศาสตร์เช่นกัน
จำนวนลบ สำหรับความแปรปรวนร่วมบ่งชี้ว่าเมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรตัวที่สองมีแนวโน้มลดลง ตัวอย่างเช่น คณิตศาสตร์และประวัติศาสตร์มีความแปรปรวนร่วมเป็นลบ (-27.16) ซึ่งบ่งชี้ว่านักเรียนที่มีผลการเรียนคณิตศาสตร์สูงมักจะมีผลการเรียนต่ำในประวัติศาสตร์ ในทางกลับกัน นักเรียนที่ได้คะแนนคณิตศาสตร์ต่ำมักจะได้คะแนนสูงในประวัติศาสตร์
คุณสามารถค้นหาบทช่วยสอน R เพิ่มเติมได้ ที่นี่