วิธีสร้างและตีความแปลงคู่ใน r
แผนภาพคู่ คือเมทริกซ์แผนภาพกระจายที่ช่วยให้คุณเข้าใจความสัมพันธ์แบบคู่ระหว่างตัวแปรต่างๆ ในชุดข้อมูล
โชคดีที่การสร้างกราฟคู่ใน R เป็นเรื่องง่ายโดยใช้ฟังก์ชัน pairs() บทช่วยสอนนี้มีตัวอย่างการใช้งานฟังก์ชันนี้ในทางปฏิบัติหลายตัวอย่าง
ตัวอย่างที่ 1: พล็อตคู่ของตัวแปรทั้งหมด
รหัสต่อไปนี้สาธิตวิธีการสร้างพล็อตคู่ฐานสำหรับตัวแปรทั้งหมดในกรอบข้อมูลใน R:
#make this example reproducible set.seed(0) #create data frame var1 <- rnorm(1000) var2 <- var1 + rnorm(1000, 0, 2) var3 <- var2 - rnorm(1000, 0, 5) df <- data.frame(var1, var2, var3) #create pairs plot peers(df)
วิธีการตีความเมทริกซ์มีดังนี้:
- ชื่อตัวแปรจะแสดงอยู่ในกล่องแนวทแยง
- กล่องอื่นๆ ทั้งหมดจะแสดงแผนภาพกระจายของความสัมพันธ์ระหว่างการรวมตัวแปรแต่ละคู่ตามลำดับ ตัวอย่างเช่น พื้นที่ที่มุมขวาบนของเมทริกซ์จะแสดงแผนภาพกระจายของค่าสำหรับ var1 และ var3 กล่องด้านซ้ายตรงกลางจะแสดงแผนภาพกระจายของค่าสำหรับ var1 และ var2 และอื่นๆ
กราฟเดี่ยวนี้ทำให้เราเข้าใจถึงความสัมพันธ์ระหว่างตัวแปรแต่ละคู่ในชุดข้อมูลของเรา ตัวอย่างเช่น var1 และ var2 ดูเหมือนจะมีความสัมพันธ์เชิงบวก ในขณะที่ var1 และ var3 ดูเหมือนจะมีความสัมพันธ์กันเพียงเล็กน้อยหรือไม่มีเลย
ตัวอย่างที่ 2: การลงจุดคู่ของตัวแปรเฉพาะ
รหัสต่อไปนี้สาธิตวิธีการสร้างพล็อตคู่ฐานสำหรับตัวแปรสองตัวแรกเท่านั้นในชุดข้อมูล:
#create pairs plot for var1 and var2 only
even(df[, 1:2])
ตัวอย่างที่ 3: เปลี่ยนความสวยงามของพล็อตคู่
รหัสต่อไปนี้สาธิตวิธีการเปลี่ยนความสวยงามของพล็อตคู่ รวมถึงชื่อเรื่อง สี และป้ายกำกับ:
peers(df, col = ' blue ', #modify color labels = c(' First ', ' Second ', ' Third '), #modify labels main = ' Custom Title ') #modify title
ตัวอย่างที่ 4: การได้รับความสัมพันธ์กับ ggpairs
คุณยังสามารถรับ ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ระหว่างตัวแปรโดยใช้ฟังก์ชัน ggpairs() จากไลบรารี GGally รหัสต่อไปนี้สาธิตวิธีการใช้ฟังก์ชันนี้:
#install necessary libraries install.packages('ggplot2') install.packages('GGally') #load libraries library(ggplot2) library(GGally) #create pairs plot ggpairs(df)
วิธีการตีความเมทริกซ์นี้มีดังนี้:
- ชื่อตัวแปรจะแสดงอยู่ที่ขอบด้านนอกของเมทริกซ์
- กล่องตามแนวทแยงจะแสดงแผนภาพความหนาแน่นของแต่ละตัวแปร
- กล่องที่มุมซ้ายล่างจะแสดงแผนภาพกระจายระหว่างแต่ละตัวแปร
- กล่องที่มุมขวาบนจะแสดงค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างแต่ละตัวแปร ตัวอย่างเช่น ความสัมพันธ์ระหว่าง var1 และ var2 คือ 0.425
ข้อดีของการใช้ ggpairs() บนฟังก์ชัน R pairs() พื้นฐานคือ คุณสามารถรับข้อมูลเพิ่มเติมเกี่ยวกับตัวแปรได้ โดยเฉพาะอย่างยิ่ง คุณสามารถดูค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการผสมตัวแปรแต่ละคู่ในทิศทางคู่ รวมถึงกราฟความหนาแน่นของตัวแปรแต่ละตัว
คุณสามารถดูเอกสารฉบับเต็มสำหรับฟังก์ชัน ggpairs() ได้ที่นี่