Pandas에서 corrwith()를 사용하는 방법(예제 포함)


Pandas에서 corrwith() 함수를 사용하여 두 개의 서로 다른 Pandas DataFrame에서 동일한 이름을 가진 숫자 열 간의 쌍별 상관 관계를 계산할 수 있습니다.

이 함수는 다음 기본 구문을 사용합니다.

 df1. corrwith (df2)

참고 : 이 함수는 동일한 DataFrame 내의 두 숫자 열 간의 상관 관계를 계산하는 corr() 함수와 다릅니다.

다음 예제에서는 corrwith() 함수를 실제로 사용하는 방법을 보여줍니다.

예: Pandas에서 corrwith()를 사용하는 방법

다음 두 개의 팬더 DataFrame이 있다고 가정해 보겠습니다.

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [18, 22, 29, 25, 14, 11],
                    ' assists ': [4, 5, 5, 4, 8, 12],
                    ' rebounds ': [10, 6, 4, 6, 3, 5]})

print (df1)

  team points assists rebounds
0 to 18 4 10
1 B 22 5 6
2 C 29 5 4
3 D 25 4 6
4 E 14 8 3
5 F 11 12 5

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [22, 25, 27, 35, 25, 20],
                    ' assists ': [15, 13, 8, 8, 5, 8],
                    ' rebs ': [4, 11, 12, 8, 7, 10]})

print (df2)

  team points assists rebs
0 A 22 15 4
1 B 25 13 11
2 C 27 8 12
3 D 35 8 8
4 E 25 5 7
5 F 20 8 10

corrwith() 함수를 사용하여 두 DataFrame에서 동일한 이름을 가진 숫자 열 간의 상관 관계를 계산할 수 있습니다.

 #calculate correlation between numeric columns with same names in each DataFrame
df1. corrwith (df2)

points 0.677051
assists -0.478184
NaN rebounds
rebs NaN
dtype:float64

결과에서 우리는 다음을 볼 수 있습니다:

  • 두 DataFrame의 포인트 열 값 사이의 상관관계는 0.677 입니다.
  • 두 DataFrame의 도우미 열 값 간의 상관 관계는 -0.478 입니다.

Bouncesrebs 라는 열 이름이 두 DataFrames 모두에 존재하지 않았기 때문에 이러한 각 열에 대해 NaN 값이 반환됩니다.

참고 #1 : 기본적으로 corrwith() 함수는 열 간의 Pearson 상관 계수를 계산하지만 method=’kendall’ 또는 method=’spearman’을 지정하여 상관 관계 대신 다른 유형의 계수를 계산할 수도 있습니다.

참고 #2 : corrwith() 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 그룹별 상관관계를 계산하는 방법
팬더에서 슬라이딩 상관 관계를 계산하는 방법
Pandas에서 두 열 간의 상관 관계를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다