Pandas에서 열의 평균을 계산하는 방법


종종 Pandas DataFrame에 있는 하나 이상의 열의 평균을 계산하는 데 관심이 있을 수 있습니다. 다행스럽게도 Mean() 함수를 사용하여 팬더에서 이 작업을 쉽게 수행할 수 있습니다.

이 튜토리얼에서는 이 기능을 사용하는 몇 가지 예를 보여줍니다.

예시 1: 단일 열의 평균 찾기

다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

        player points assists rebounds
0 A 25 5 NaN
1 B 20 7 8.0
2 C 14 7 10.0
3 D 16 8 6.0
4 E 27 5 6.0
5 F 20 7 9.0
6 G 12 6 6.0
7:15 9 10.0
8 I 14 9 10.0
9 D 19 5 7.0

다음 구문을 사용하여 “points”라는 열의 평균을 찾을 수 있습니다.

 df['points']. mean ()

18.2

Mean() 함수는 기본적으로 NA도 제외합니다. 예를 들어, “리바운드” 열의 평균을 찾으면 “NaN”의 첫 번째 값은 계산에서 제외됩니다.

 df['rebounds']. mean ()

8.0

숫자가 아닌 열의 평균을 찾으려고 하면 오류가 발생합니다.

 df['player']. mean ()

TypeError: Could not convert ABCDEFGHIJ to numeric

예시 2: 여러 열의 평균 찾기

다음 구문을 사용하여 여러 열의 평균을 찾을 수 있습니다.

 #find mean of points and rebounds columns
df[['rebounds', 'points']]. mean ()

rebounds 8.0
points 18.2
dtype:float64

예시 3: 모든 열의 평균 찾기

다음 구문을 사용하여 모든 숫자 열의 평균을 찾을 수도 있습니다.

 #find mean of all numeric columns in DataFrame
df. mean ()

points 18.2
assists 6.8
rebounds 8.0
dtype:float64

Mean() 함수는 숫자가 아닌 열을 무시합니다.

추가 리소스

팬더에서 중앙값을 계산하는 방법
Pandas에서 열의 합계를 계산하는 방법
Pandas에서 열의 최대값을 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다