วิธีสร้าง scatterplot matrix ใน r (2 ตัวอย่าง)
เมทริกซ์ Scatterplot คือเมทริกซ์ Scatterplot ที่ช่วยให้คุณเข้าใจความสัมพันธ์แบบคู่ระหว่างตัวแปรต่างๆ ในชุดข้อมูล
มีสองวิธีทั่วไปในการสร้างเมทริกซ์ Scatterplot ใน R:
วิธีที่ 1: ใช้ Base R
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
วิธีที่ 2: ใช้แพ็คเกจ ggplot2 และ GGally
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้ใน R:
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
ตัวอย่างที่ 1: สร้างเมทริกซ์ Scatterplot โดยใช้ Base R
เราสามารถใช้ฟังก์ชัน base R plot() เพื่อสร้างเมทริกซ์ Scatterplot สำหรับแต่ละตัวแปรในกรอบข้อมูลของเรา:
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
วิธีการตีความเมทริกซ์มีดังนี้:
- ชื่อตัวแปรจะแสดงอยู่ในกล่องแนวทแยง
- กล่องอื่นๆ ทั้งหมดจะแสดงแผนภาพกระจายของความสัมพันธ์ระหว่างการรวมตัวแปรแต่ละคู่ตามลำดับ ตัวอย่างเช่น กล่องที่มุมขวาบนของเมทริกซ์จะแสดงแผนภาพกระจายของค่าสำหรับ จุด และ รีบาวด์ พื้นที่ตรงกลางด้านซ้ายแสดงแผนภาพกระจายของค่า คะแนน และ การช่วยเหลือ ฯลฯ
โปรดทราบว่า cex ควบคุมขนาดของจุดในเส้นทางและ col ควบคุมสีของจุด
ตัวอย่างที่ 2: สร้างเมทริกซ์ Scatterplot โดยใช้ ggplot2 และ GGally
นอกจากนี้เรายังสามารถใช้ฟังก์ชัน ggpairs() จากแพ็คเกจ ggplot2 และ GGally ใน R เพื่อสร้างเมทริกซ์ Scatterplot สำหรับแต่ละตัวแปรในกรอบข้อมูลของเรา:
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
เมทริกซ์ Scatterplot นี้ประกอบด้วย Scatterplots เดียวกันกับฟังก์ชัน R base plot() แต่นอกจากนี้ เรายังสามารถดูค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการรวมตัวแปรแต่ละคู่ในทิศทางคู่ ตลอดจนพล็อตความหนาแน่นสำหรับตัวแปรแต่ละตัวอีกด้วย
ตัวอย่างเช่น เราเห็น:
- ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างแอสซิสต์และแต้มคือ 0.571
- ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการรีบาวด์และคะแนนคือ -0.598
- ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างรีบาวด์และแอสซิสต์คือ -0.740
ดาวดวงเล็ก ( * ) ถัดจาก -0.740 ยังบ่งชี้ว่าความสัมพันธ์ระหว่างการรีบาวด์และการแอสซิสต์นั้นมีนัยสำคัญทางสถิติ
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:
วิธีสร้างเมทริกซ์สหสัมพันธ์ใน R
วิธีสร้าง point cloud ตามกลุ่มใน R