Pandas에서 중앙값을 계산하는 방법(예제 포함)
median() 함수를 사용하여 Pandas DataFrame에 있는 하나 이상의 열의 중앙값을 찾을 수 있습니다.
#find median value in specific column
df[' column1 ']. median ()
#find median value in several columns
df[[' column1 ', ' column2 ']]. median ()
#find median value in every numeric column
df. median ()
다음 예에서는 다음 pandas DataFrame에서 실제로 이 함수를 사용하는 방법을 보여줍니다.
#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [25, pd. NA , 15, 14, 19, 23, 25, 29],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
df
player points assists rebounds
0 to 25 5 11
1 B NA 7 8
2 C 15 7 10
3 D 14 9 6
4 E 19 12 6
5 F 23 9 5
6 G 25 9 9
7:29 4 12
예 1: 단일 열의 중앙값 찾기
다음 코드는 Pandas DataFrame에서 단일 열의 중앙값을 찾는 방법을 보여줍니다.
#find median value of points column
df[' points ']. median ()
23.0
포인트 열의 중앙값은 23 입니다.
기본적으로 median() 함수는 중앙값을 계산할 때 모든 누락된 값을 무시합니다.
예 2: 여러 열의 중앙값 찾기
다음 코드는 Pandas DataFrame에서 여러 열의 중앙값을 찾는 방법을 보여줍니다.
#find median value of points and rebounds columns
df[[' points ', ' rebounds ']]. median ()
points 23.0
rebounds 8.5
dtype:float64
예 3: 모든 숫자 열의 중앙값 찾기
다음 코드는 Pandas DataFrame에 있는 모든 숫자 열의 중앙값을 찾는 방법을 보여줍니다.
#find median value of all numeric columns
df. median ()
points 23.0
assists 8.0
rebounds 8.5
dtype:float64
추가 리소스
Pandas에서 열의 평균을 계산하는 방법
Pandas에서 열의 합계를 계산하는 방법
Pandas에서 열의 최대값을 찾는 방법