วิธีสร้างและตีความแปลงคู่ใน r


แผนภาพคู่ คือเมทริกซ์แผนภาพกระจายที่ช่วยให้คุณเข้าใจความสัมพันธ์แบบคู่ระหว่างตัวแปรต่างๆ ในชุดข้อมูล

โชคดีที่การสร้างกราฟคู่ใน R เป็นเรื่องง่ายโดยใช้ฟังก์ชัน pairs() บทช่วยสอนนี้มีตัวอย่างการใช้งานฟังก์ชันนี้ในทางปฏิบัติหลายตัวอย่าง

ตัวอย่างที่ 1: พล็อตคู่ของตัวแปรทั้งหมด

รหัสต่อไปนี้สาธิตวิธีการสร้างพล็อตคู่ฐานสำหรับตัวแปรทั้งหมดในกรอบข้อมูลใน R:

 #make this example reproducible 
set.seed(0)

#create data frame 
var1 <- rnorm(1000)
var2 <- var1 + rnorm(1000, 0, 2)
var3 <- var2 - rnorm(1000, 0, 5)
 
df <- data.frame(var1, var2, var3)

#create pairs plot 
peers(df) 

วิธีการตีความเมทริกซ์มีดังนี้:

  • ชื่อตัวแปรจะแสดงอยู่ในกล่องแนวทแยง
  • กล่องอื่นๆ ทั้งหมดจะแสดงแผนภาพกระจายของความสัมพันธ์ระหว่างการรวมตัวแปรแต่ละคู่ตามลำดับ ตัวอย่างเช่น พื้นที่ที่มุมขวาบนของเมทริกซ์จะแสดงแผนภาพกระจายของค่าสำหรับ var1 และ var3 กล่องด้านซ้ายตรงกลางจะแสดงแผนภาพกระจายของค่าสำหรับ var1 และ var2 และอื่นๆ

กราฟเดี่ยวนี้ทำให้เราเข้าใจถึงความสัมพันธ์ระหว่างตัวแปรแต่ละคู่ในชุดข้อมูลของเรา ตัวอย่างเช่น var1 และ var2 ดูเหมือนจะมีความสัมพันธ์เชิงบวก ในขณะที่ var1 และ var3 ดูเหมือนจะมีความสัมพันธ์กันเพียงเล็กน้อยหรือไม่มีเลย

ตัวอย่างที่ 2: การลงจุดคู่ของตัวแปรเฉพาะ

รหัสต่อไปนี้สาธิตวิธีการสร้างพล็อตคู่ฐานสำหรับตัวแปรสองตัวแรกเท่านั้นในชุดข้อมูล:

 #create pairs plot for var1 and var2 only
even(df[, 1:2]) 

การพล็อตคู่ตัวแปรเฉพาะใน R

ตัวอย่างที่ 3: เปลี่ยนความสวยงามของพล็อตคู่

รหัสต่อไปนี้สาธิตวิธีการเปลี่ยนความสวยงามของพล็อตคู่ รวมถึงชื่อเรื่อง สี และป้ายกำกับ:

 peers(df,
      col = ' blue ', #modify color
      labels = c(' First ', ' Second ', ' Third '), #modify labels
      main = ' Custom Title ') #modify title 

การลงจุดคู่ที่กำหนดเองใน R

ตัวอย่างที่ 4: การได้รับความสัมพันธ์กับ ggpairs

คุณยังสามารถรับ ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ระหว่างตัวแปรโดยใช้ฟังก์ชัน ggpairs() จากไลบรารี GGally รหัสต่อไปนี้สาธิตวิธีการใช้ฟังก์ชันนี้:

 #install necessary libraries
install.packages('ggplot2')
install.packages('GGally')

#load libraries
library(ggplot2)
library(GGally)

#create pairs plot
ggpairs(df) 

ฟังก์ชัน ggpairs ในตัวอย่าง R

วิธีการตีความเมทริกซ์นี้มีดังนี้:

  • ชื่อตัวแปรจะแสดงอยู่ที่ขอบด้านนอกของเมทริกซ์
  • กล่องตามแนวทแยงจะแสดงแผนภาพความหนาแน่นของแต่ละตัวแปร
  • กล่องที่มุมซ้ายล่างจะแสดงแผนภาพกระจายระหว่างแต่ละตัวแปร
  • กล่องที่มุมขวาบนจะแสดงค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างแต่ละตัวแปร ตัวอย่างเช่น ความสัมพันธ์ระหว่าง var1 และ var2 คือ 0.425

ข้อดีของการใช้ ggpairs() บนฟังก์ชัน R pairs() พื้นฐานคือ คุณสามารถรับข้อมูลเพิ่มเติมเกี่ยวกับตัวแปรได้ โดยเฉพาะอย่างยิ่ง คุณสามารถดูค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการผสมตัวแปรแต่ละคู่ในทิศทางคู่ รวมถึงกราฟความหนาแน่นของตัวแปรแต่ละตัว

คุณสามารถดูเอกสารฉบับเต็มสำหรับฟังก์ชัน ggpairs() ได้ที่นี่

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *