วิธีใช้ corrwith() ใน pandas (พร้อมตัวอย่าง)


คุณสามารถใช้ฟังก์ชัน corrwith() ใน pandas เพื่อคำนวณความสัมพันธ์แบบคู่ระหว่างคอลัมน์ตัวเลข ที่มีชื่อเดียวกัน ใน DataFrames ของ pandas สองอันที่แตกต่างกัน

ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 df1. corrwith (df2)

หมายเหตุ : ฟังก์ชันนี้แตกต่างจากฟังก์ชัน corr() ซึ่งจะคำนวณความสัมพันธ์ระหว่างคอลัมน์ตัวเลข 2 คอลัมน์ภายใน DataFrame เดียวกัน

ตัวอย่างต่อไปนี้แสดงวิธีการใช้ฟังก์ชัน corrwith() ในทางปฏิบัติ

ตัวอย่าง: วิธีใช้ corrwith() ใน Pandas

สมมติว่าเรามี DataFrames แพนด้าสองตัวต่อไปนี้:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [18, 22, 29, 25, 14, 11],
                    ' assists ': [4, 5, 5, 4, 8, 12],
                    ' rebounds ': [10, 6, 4, 6, 3, 5]})

print (df1)

  team points assists rebounds
0 to 18 4 10
1 B 22 5 6
2 C 29 5 4
3 D 25 4 6
4 E 14 8 3
5 F 11 12 5

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [22, 25, 27, 35, 25, 20],
                    ' assists ': [15, 13, 8, 8, 5, 8],
                    ' rebs ': [4, 11, 12, 8, 7, 10]})

print (df2)

  team points assists rebs
0 A 22 15 4
1 B 25 13 11
2 C 27 8 12
3 D 35 8 8
4 E 25 5 7
5 F 20 8 10

เราสามารถใช้ฟังก์ชัน corrwith() เพื่อคำนวณความสัมพันธ์ระหว่างคอลัมน์ตัวเลขที่มีชื่อเดียวกันใน DataFrames ทั้งสอง:

 #calculate correlation between numeric columns with same names in each DataFrame
df1. corrwith (df2)

points 0.677051
assists -0.478184
NaN rebounds
rebs NaN
dtype:float64

จากผลลัพธ์เราจะเห็นได้ว่า:

  • ความสัมพันธ์ระหว่างค่าคอลัมน์ จุด ของ DataFrames ทั้งสองคือ 0.677
  • ความสัมพันธ์ระหว่างค่าคอลัมน์ ตัวช่วย ใน DataFrames ทั้งสองคือ -0.478

เนื่องจากชื่อคอลัมน์ ตีกลับ และ rebs ไม่มีอยู่ใน DataFrames ทั้งสอง ค่า NaN จะถูกส่งกลับสำหรับแต่ละคอลัมน์เหล่านี้

หมายเหตุ #1 : ตามค่าเริ่มต้น ฟังก์ชัน corrwith() จะคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างคอลัมน์ แต่คุณยังสามารถระบุ method=’kendall’ หรือ method=’spearman’ เพื่อคำนวณค่าสัมประสิทธิ์ประเภทอื่นแทนความสัมพันธ์ได้

หมายเหตุ #2 : คุณสามารถค้นหาเอกสารฉบับเต็มสำหรับฟังก์ชัน corrwith() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ในแพนด้า:

วิธีการคำนวณความสัมพันธ์ตามกลุ่มใน Pandas
วิธีการคำนวณความสัมพันธ์แบบเลื่อนในแพนด้า
วิธีการคำนวณความสัมพันธ์ระหว่างสองคอลัมน์ใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *