วิธีสร้างเมทริกซ์ความแปรปรวนร่วมใน python


ความแปรปรวนร่วม คือการวัดว่าการเปลี่ยนแปลงในตัวแปรหนึ่งสัมพันธ์กับการเปลี่ยนแปลงในตัวแปรตัวที่สองอย่างไร โดยเฉพาะอย่างยิ่ง มันคือการวัดระดับที่ตัวแปรสองตัวมีความสัมพันธ์กันเชิงเส้นตรง

เมทริกซ์ความแปรปรวนร่วม คือเมทริกซ์จตุรัสที่แสดงความแปรปรวนร่วมระหว่างตัวแปรต่างๆ มากมาย นี่อาจเป็นวิธีที่มีประโยชน์ในการทำความเข้าใจว่าตัวแปรต่างๆ เกี่ยวข้องกันอย่างไรในชุดข้อมูล

ตัวอย่างต่อไปนี้แสดงวิธีสร้างเมทริกซ์ความแปรปรวนร่วมใน Python

วิธีสร้างเมทริกซ์ความแปรปรวนร่วมใน Python

ใช้ขั้นตอนต่อไปนี้เพื่อสร้างเมทริกซ์ความแปรปรวนร่วมใน Python

ขั้นตอนที่ 1: สร้างชุดข้อมูล

ขั้นแรก เราจะสร้างชุดข้อมูลที่ประกอบด้วยคะแนนสอบของนักเรียน 10 คนที่แตกต่างกันใน 3 วิชา ได้แก่ คณิตศาสตร์ วิทยาศาสตร์ และประวัติศาสตร์

 import numpy as np

math = [84, 82, 81, 89, 73, 94, 92, 70, 88, 95]
science = [85, 82, 72, 77, 75, 89, 95, 84, 77, 94]
history = [97, 94, 93, 95, 88, 82, 78, 84, 69, 78]

data = np.array([math, science, history])

ขั้นตอนที่ 2: สร้างเมทริกซ์ความแปรปรวนร่วม

ต่อไป เราจะสร้างเมทริกซ์ความแปรปรวนร่วมสำหรับชุดข้อมูลนี้โดยใช้ฟังก์ชัน numpy cov() โดยระบุว่า bias = True เพื่อให้เราสามารถคำนวณเมทริกซ์ความแปรปรวนร่วมของประชากรได้

 np.cov(data, bias= True )

array([[ 64.96, 33.2, -24.44],
       [33.2, 56.4, -24.1],
       [-24.44, -24.1, 75.56]])

ขั้นตอนที่ 3: ตีความเมทริกซ์ความแปรปรวนร่วม

ค่าตามเส้นทแยงมุมของเมทริกซ์เป็นเพียงความแปรปรวนของแต่ละเรื่อง ตัวอย่างเช่น:

  • ความแปรปรวนของคะแนนคณิตศาสตร์คือ 64.96
  • ความแปรปรวนของคะแนนวิทยาศาสตร์คือ 56.4
  • ความแปรปรวนของคะแนนในอดีตคือ 75.56

ค่าอื่นๆ ของเมทริกซ์แสดงถึงความแปรปรวนร่วมระหว่างวิชาต่างๆ ตัวอย่างเช่น:

  • ความแปรปรวนร่วมระหว่างคะแนนคณิตศาสตร์และวิทยาศาสตร์คือ 33.2
  • ความแปรปรวนร่วมระหว่างคะแนนคณิตศาสตร์และประวัติศาสตร์คือ -24.44
  • ความแปรปรวนร่วมระหว่างคะแนนวิทยาศาสตร์และประวัติศาสตร์คือ -24.1

จำนวนบวก สำหรับความแปรปรวนร่วมบ่งชี้ว่าตัวแปรสองตัวมีแนวโน้มเพิ่มขึ้นหรือลดลงตามกัน ตัวอย่างเช่น คณิตศาสตร์และวิทยาศาสตร์มีความแปรปรวนร่วมเชิงบวก (33.2) ซึ่งบ่งชี้ว่านักเรียนที่ได้คะแนนสูงในวิชาคณิตศาสตร์ก็มีแนวโน้มที่จะได้คะแนนสูงในวิชาวิทยาศาสตร์เช่นกัน ในทางกลับกัน นักเรียนที่มีผลการเรียนไม่ดีในวิชาคณิตศาสตร์ก็มักจะมีผลการเรียนไม่ดีในวิชาวิทยาศาสตร์เช่นกัน

จำนวนลบ สำหรับความแปรปรวนร่วมบ่งชี้ว่าเมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรตัวที่สองมีแนวโน้มลดลง ตัวอย่างเช่น คณิตศาสตร์และประวัติศาสตร์มีความแปรปรวนร่วมเป็นลบ (-24.44) ซึ่งบ่งชี้ว่านักเรียนที่ได้คะแนนสูงในวิชาคณิตศาสตร์มักจะได้คะแนนต่ำในประวัติศาสตร์ ในทางกลับกัน นักเรียนที่ได้คะแนนคณิตศาสตร์ต่ำมักจะได้คะแนนสูงในประวัติศาสตร์

ขั้นตอนที่ 4: เห็นภาพเมทริกซ์ความแปรปรวนร่วม (ไม่บังคับ)

คุณสามารถเห็นภาพเมทริกซ์ความแปรปรวนร่วมได้โดยใช้ฟังก์ชัน heatmap() ของแพ็คเกจที่เกิดในทะเล:

 import seaborn as sns
import matplotlib.pyplot as plt

cov = np.cov(data, bias=True)
labs = ['math', 'science', 'history']

sns.heatmap(cov, annot=True, fmt='g', xticklabels=labs, yticklabels=labs)
plt.show()

เมทริกซ์ความแปรปรวนร่วมใน Python

คุณยังสามารถเปลี่ยนจานสีได้โดยการระบุอาร์กิวเมนต์ cmap :

 sns.heatmap(cov, annot=True, fmt='g', xticklabels=labs, yticklabels=labs, cmap=' YlGnBu ')
plt.show() 

เมทริกซ์ความแปรปรวนร่วมใน Python

สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการจัดรูปแบบแผนที่ความร้อนนี้ โปรดดู เอกสารประกอบเกี่ยวกับทะเล

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *