팬더에서 평균, 중앙값 및 모드를 계산하는 방법


다음 함수를 사용하여 Pandas DataFrame에 있는 각 숫자 열의 평균, 중앙값 및 모드를 계산할 수 있습니다.

 print ( df.mean (numeric_only= True ))
print (df. median (numeric_only= True ))
print (df. mode (numeric_only= True ))

다음 예에서는 이러한 기능을 실제로 사용하는 방법을 보여줍니다.

예: Pandas에서 평균, 중앙값 및 모드 계산

네 가지 게임에서 다양한 농구 선수가 득점한 점수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' game1 ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' game2 ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' game3 ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' game4 ': [9, 8, 10, 9, 14, 15, 10, 11]})
                   
#view DataFrame
print (df)

  player game1 game2 game3 game4
0 A 18 5 11 9
1 B 22 7 8 8
2 C 19 7 10 10
3 D 14 9 6 9
4 E 14 12 6 14
5 F 11 9 5 15
6 G 20 9 9 10
7:28 4 12 11

다음 구문을 사용하여 각 숫자 열의 평균값 을 계산할 수 있습니다.

 #calculate mean of each numeric column
print ( df.mean (numeric_only= True ))

game1 18,250
game2 7,750
game3 8.375
game4 10,750
dtype:float64

결과에서 우리는 다음을 볼 수 있습니다:

  • game1 열의 평균값은 18.25 입니다.
  • game2 열의 평균값은 7.75 입니다.
  • game3 열의 평균값은 8.375 입니다.
  • game4 열의 평균값은 10.75 입니다.

그런 다음 다음 구문을 사용하여 각 숫자 열의 중앙값 을 계산할 수 있습니다.

 #calculate median of each numeric column
print (df. median (numeric_only= True ))

game1 18.5
game2 8.0
game3 8.5
game4 10.0
dtype:float64

결과에서 우리는 다음을 볼 수 있습니다:

  • game1 열의 중앙값은 18.5 입니다.
  • game2 열의 중앙값은 8 입니다.
  • game3 열의 중앙값은 8.5 입니다.
  • game4 열의 중앙값은 10 입니다.

그런 다음 다음 구문을 사용하여 각 숫자 열의 모드를 계산할 수 있습니다.

 #calculate mode of each numeric column
print (df. mode (numeric_only= True ))

   game1 game2 game3 game4
0 14.0 9.0 6.0 9
1 NaN NaN NaN 10

결과에서 우리는 다음을 볼 수 있습니다:

  • game1 열의 모드는 14 입니다.
  • game2 열의 모드는 9 입니다.
  • game3 열의 모드는 6 입니다.
  • game4 열의 모드는 910 입니다.

참고로 game4 열에는 해당 열에 가장 자주 나타나는 값이 두 개 있으므로 두 가지 모드가 있습니다.

참고 : Pandas의 explain() 함수를 사용하여 각 열에 대해 더 자세한 설명 통계를 생성할 수도 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

팬더에서 그룹 평균을 계산하는 방법
팬더에서 그룹 중앙값을 계산하는 방법
Pandas에서 그룹별로 모드를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다