Pandas에서 corrwith()를 사용하는 방법(예제 포함)
Pandas에서 corrwith() 함수를 사용하여 두 개의 서로 다른 Pandas DataFrame에서 동일한 이름을 가진 숫자 열 간의 쌍별 상관 관계를 계산할 수 있습니다.
이 함수는 다음 기본 구문을 사용합니다.
df1. corrwith (df2)
참고 : 이 함수는 동일한 DataFrame 내의 두 숫자 열 간의 상관 관계를 계산하는 corr() 함수와 다릅니다.
다음 예제에서는 corrwith() 함수를 실제로 사용하는 방법을 보여줍니다.
예: Pandas에서 corrwith()를 사용하는 방법
다음 두 개의 팬더 DataFrame이 있다고 가정해 보겠습니다.
import pandas as pd #create first DataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'], ' points ': [18, 22, 29, 25, 14, 11], ' assists ': [4, 5, 5, 4, 8, 12], ' rebounds ': [10, 6, 4, 6, 3, 5]}) print (df1) team points assists rebounds 0 to 18 4 10 1 B 22 5 6 2 C 29 5 4 3 D 25 4 6 4 E 14 8 3 5 F 11 12 5 #create second DataFrame df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'], ' points ': [22, 25, 27, 35, 25, 20], ' assists ': [15, 13, 8, 8, 5, 8], ' rebs ': [4, 11, 12, 8, 7, 10]}) print (df2) team points assists rebs 0 A 22 15 4 1 B 25 13 11 2 C 27 8 12 3 D 35 8 8 4 E 25 5 7 5 F 20 8 10
corrwith() 함수를 사용하여 두 DataFrame에서 동일한 이름을 가진 숫자 열 간의 상관 관계를 계산할 수 있습니다.
#calculate correlation between numeric columns with same names in each DataFrame
df1. corrwith (df2)
points 0.677051
assists -0.478184
NaN rebounds
rebs NaN
dtype:float64
결과에서 우리는 다음을 볼 수 있습니다:
- 두 DataFrame의 포인트 열 값 사이의 상관관계는 0.677 입니다.
- 두 DataFrame의 도우미 열 값 간의 상관 관계는 -0.478 입니다.
Bounces 및 rebs 라는 열 이름이 두 DataFrames 모두에 존재하지 않았기 때문에 이러한 각 열에 대해 NaN 값이 반환됩니다.
참고 #1 : 기본적으로 corrwith() 함수는 열 간의 Pearson 상관 계수를 계산하지만 method=’kendall’ 또는 method=’spearman’을 지정하여 상관 관계 대신 다른 유형의 계수를 계산할 수도 있습니다.
참고 #2 : corrwith() 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 그룹별 상관관계를 계산하는 방법
팬더에서 슬라이딩 상관 관계를 계산하는 방법
Pandas에서 두 열 간의 상관 관계를 계산하는 방법