Pandas에서 중앙값을 계산하는 방법(예제 포함)


median() 함수를 사용하여 Pandas DataFrame에 있는 하나 이상의 열의 중앙값을 찾을 수 있습니다.

 #find median value in specific column
df[' column1 ']. median ()

#find median value in several columns
df[[' column1 ', ' column2 ']]. median ()

#find median value in every numeric column
df. median ()

다음 예에서는 다음 pandas DataFrame에서 실제로 이 함수를 사용하는 방법을 보여줍니다.

 #createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [25, pd. NA , 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	player points assists rebounds
0 to 25 5 11
1 B NA 7 8
2 C 15 7 10
3 D 14 9 6
4 E 19 12 6
5 F 23 9 5
6 G 25 9 9
7:29 4 12

예 1: 단일 열의 중앙값 찾기

다음 코드는 Pandas DataFrame에서 단일 열의 중앙값을 찾는 방법을 보여줍니다.

 #find median value of points column
df[' points ']. median ()

23.0

포인트 열의 중앙값은 23 입니다.

기본적으로 median() 함수는 중앙값을 계산할 때 모든 누락된 값을 무시합니다.

예 2: 여러 열의 중앙값 찾기

다음 코드는 Pandas DataFrame에서 여러 열의 중앙값을 찾는 방법을 보여줍니다.

 #find median value of points and rebounds columns
df[[' points ', ' rebounds ']]. median ()

points 23.0
rebounds 8.5
dtype:float64

예 3: 모든 숫자 열의 중앙값 찾기

다음 코드는 Pandas DataFrame에 있는 모든 숫자 열의 중앙값을 찾는 방법을 보여줍니다.

 #find median value of all numeric columns
df. median ()

points 23.0
assists 8.0
rebounds 8.5
dtype:float64

추가 리소스

Pandas에서 열의 평균을 계산하는 방법
Pandas에서 열의 합계를 계산하는 방법
Pandas에서 열의 최대값을 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다