วิธีการคำนวณความสัมพันธ์ระหว่างตัวแปรหลายตัวใน r


วิธีหนึ่งในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรสองตัวคือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่ง เป็นหน่วยวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว จะใช้ค่าระหว่าง -1 ถึง 1 เสมอโดยที่:

  • -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
  • 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
  • 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว

บทช่วยสอนนี้จะอธิบายวิธีคำนวณความสัมพันธ์ระหว่างตัวแปรหลายตัวใน R โดยใช้กรอบข้อมูลต่อไปนี้เป็นตัวอย่าง:

 #create data frame
df <- data.frame(a <- c(2, 3, 3, 5, 6, 9, 14, 15, 19, 21, 22, 23),
                 b <- c(23, 24, 24, 23, 17, 28, 38, 34, 35, 39, 41, 43),
                 c <- c(13, 14, 14, 14, 15, 17, 18, 19, 22, 20, 24, 26),
                 d <- c(6, 6, 7, 8, 8, 8, 7, 6, 5, 3, 3, 2))

ตัวอย่างที่ 1: ความสัมพันธ์ระหว่างสองตัวแปร

รหัสต่อไปนี้แสดงวิธีการคำนวณความสัมพันธ์ระหว่างตัวแปรสองตัวในกรอบข้อมูล:

 cor(df$a, df$b)

[1] 0.9279869

ตัวอย่างที่ 2: ความสัมพันธ์ระหว่างตัวแปรหลายตัว

รหัสต่อไปนี้แสดงวิธีคำนวณความสัมพันธ์ระหว่างตัวแปรสามตัวในกรอบข้อมูล:

 cor(df[, c(' a ', ' b ', ' c ')])

          ABC
a 1.0000000 0.9279869 0.9604329
b 0.9279869 1.0000000 0.8942139
c 0.9604329 0.8942139 1.0000000

วิธีการตีความผลลัพธ์มีดังนี้:

  • ความสัมพันธ์ระหว่าง a และ b คือ 0.9279869
  • ความสัมพันธ์ระหว่าง a และ c คือ 0.9604329
  • ความสัมพันธ์ระหว่าง b และ c คือ 0.8942139

ตัวอย่างที่ 3: ความสัมพันธ์ระหว่างตัวแปรทั้งหมด

รหัสต่อไปนี้แสดงวิธีการคำนวณความสัมพันธ์ระหว่างตัวแปรทั้งหมดในกรอบข้อมูล:

 cor(df)

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

ตัวอย่างที่ 4: ความสัมพันธ์ระหว่างตัวแปรตัวเลขเท่านั้น

รหัสต่อไปนี้แสดงวิธีการคำนวณความสัมพันธ์ระหว่างตัวแปรตัวเลขในกรอบข้อมูลเท่านั้น:

 cor(df[, unlist ( lapply (df, is. numeric ))])

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

ตัวอย่างที่ 5: การแสดงภาพความสัมพันธ์

รหัสต่อไปนี้แสดงวิธีการสร้างการลงจุดแบบคู่ ซึ่งเป็นประเภทของการลงจุดที่ช่วยให้คุณเห็นภาพความสัมพันธ์ระหว่างแต่ละชุดของตัวแปรแบบคู่:

 #load psych package
library(psych)

#create pairs plot
peers. panels (df)

แหล่งข้อมูลเพิ่มเติม

วิธีการคำนวณความสัมพันธ์บางส่วนใน R
วิธีการคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลใน R
วิธีการคำนวณความสัมพันธ์แบบเลื่อนใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *