วิธีสร้าง scatterplot matrix ใน r (2 ตัวอย่าง)


เมทริกซ์ Scatterplot คือเมทริกซ์ Scatterplot ที่ช่วยให้คุณเข้าใจความสัมพันธ์แบบคู่ระหว่างตัวแปรต่างๆ ในชุดข้อมูล

มีสองวิธีทั่วไปในการสร้างเมทริกซ์ Scatterplot ใน R:

วิธีที่ 1: ใช้ Base R

 #create scatterplot matrix (pch=20 means to use a solid circle for points)
plot(df, pch= 20 )

วิธีที่ 2: ใช้แพ็คเกจ ggplot2 และ GGally

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df)

ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้ใน R:

 #create data frame
df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104),
                 assists=c(33, 28, 31, 39, 40, 40, 35, 47),
                 rebounds=c(30, 28, 24, 24, 20, 20, 15, 12))

#view first few rows of data frame
head(df)

  points assists rebounds
1 99 33 30
2 90 28 28
3 86 31 24
4 88 39 24
5 95 40 20
6 99 40 20

ตัวอย่างที่ 1: สร้างเมทริกซ์ Scatterplot โดยใช้ Base R

เราสามารถใช้ฟังก์ชัน base R plot() เพื่อสร้างเมทริกซ์ Scatterplot สำหรับแต่ละตัวแปรในกรอบข้อมูลของเรา:

 #create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')

เมทริกซ์ Scatterplot ใน R

วิธีการตีความเมทริกซ์มีดังนี้:

  • ชื่อตัวแปรจะแสดงอยู่ในกล่องแนวทแยง
  • กล่องอื่นๆ ทั้งหมดจะแสดงแผนภาพกระจายของความสัมพันธ์ระหว่างการรวมตัวแปรแต่ละคู่ตามลำดับ ตัวอย่างเช่น กล่องที่มุมขวาบนของเมทริกซ์จะแสดงแผนภาพกระจายของค่าสำหรับ จุด และ รีบาวด์ พื้นที่ตรงกลางด้านซ้ายแสดงแผนภาพกระจายของค่า คะแนน และ การช่วยเหลือ ฯลฯ

โปรดทราบว่า cex ควบคุมขนาดของจุดในเส้นทางและ col ควบคุมสีของจุด

ตัวอย่างที่ 2: สร้างเมทริกซ์ Scatterplot โดยใช้ ggplot2 และ GGally

นอกจากนี้เรายังสามารถใช้ฟังก์ชัน ggpairs() จากแพ็คเกจ ggplot2 และ GGally ใน R เพื่อสร้างเมทริกซ์ Scatterplot สำหรับแต่ละตัวแปรในกรอบข้อมูลของเรา:

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df) 

เมทริกซ์ Scatterplot ใน ggplot2

เมทริกซ์ Scatterplot นี้ประกอบด้วย Scatterplots เดียวกันกับฟังก์ชัน R base plot() แต่นอกจากนี้ เรายังสามารถดูค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการรวมตัวแปรแต่ละคู่ในทิศทางคู่ ตลอดจนพล็อตความหนาแน่นสำหรับตัวแปรแต่ละตัวอีกด้วย

ตัวอย่างเช่น เราเห็น:

  • ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างแอสซิสต์และแต้มคือ 0.571
  • ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการรีบาวด์และคะแนนคือ -0.598
  • ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างรีบาวด์และแอสซิสต์คือ -0.740

ดาวดวงเล็ก ( * ) ถัดจาก -0.740 ยังบ่งชี้ว่าความสัมพันธ์ระหว่างการรีบาวด์และการแอสซิสต์นั้นมีนัยสำคัญทางสถิติ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:

วิธีสร้างเมทริกซ์สหสัมพันธ์ใน R
วิธีสร้าง point cloud ตามกลุ่มใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *