Pandas에서 열의 평균을 계산하는 방법
종종 Pandas DataFrame에 있는 하나 이상의 열의 평균을 계산하는 데 관심이 있을 수 있습니다. 다행스럽게도 Mean() 함수를 사용하여 팬더에서 이 작업을 쉽게 수행할 수 있습니다.
이 튜토리얼에서는 이 기능을 사용하는 몇 가지 예를 보여줍니다.
예시 1: 단일 열의 평균 찾기
다음과 같은 팬더 DataFrame이 있다고 가정합니다.
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df player points assists rebounds 0 A 25 5 NaN 1 B 20 7 8.0 2 C 14 7 10.0 3 D 16 8 6.0 4 E 27 5 6.0 5 F 20 7 9.0 6 G 12 6 6.0 7:15 9 10.0 8 I 14 9 10.0 9 D 19 5 7.0
다음 구문을 사용하여 “points”라는 열의 평균을 찾을 수 있습니다.
df['points']. mean ()
18.2
Mean() 함수는 기본적으로 NA도 제외합니다. 예를 들어, “리바운드” 열의 평균을 찾으면 “NaN”의 첫 번째 값은 계산에서 제외됩니다.
df['rebounds']. mean ()
8.0
숫자가 아닌 열의 평균을 찾으려고 하면 오류가 발생합니다.
df['player']. mean ()
TypeError: Could not convert ABCDEFGHIJ to numeric
예시 2: 여러 열의 평균 찾기
다음 구문을 사용하여 여러 열의 평균을 찾을 수 있습니다.
#find mean of points and rebounds columns df[['rebounds', 'points']]. mean () rebounds 8.0 points 18.2 dtype:float64
예시 3: 모든 열의 평균 찾기
다음 구문을 사용하여 모든 숫자 열의 평균을 찾을 수도 있습니다.
#find mean of all numeric columns in DataFrame df. mean () points 18.2 assists 6.8 rebounds 8.0 dtype:float64
Mean() 함수는 숫자가 아닌 열을 무시합니다.
추가 리소스
팬더에서 중앙값을 계산하는 방법
Pandas에서 열의 합계를 계산하는 방법
Pandas에서 열의 최대값을 찾는 방법