Pandas에서 idxmax() 함수를 사용하는 방법(예제 포함)


pandas.DataFrame.idxmax() 함수를 사용하여 pandas DataFrame의 지정된 축에서 최대값의 인덱스를 반환할 수 있습니다.

이 함수는 다음 구문을 사용합니다.

DataFrame.idxmax(축=0, Skipna=True)

금:

  • axis : 사용할 축입니다(0 = 행, 1 = 열). 기본값은 0입니다.
  • Skipna : NA 또는 null 값을 제외할지 여부입니다. 기본값은 True입니다.

다음 예에서는 다음 pandas DataFrame에서 실제로 이 함수를 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({'points': [25, 12, 15, 8, 9, 23],
                   'assists': [5, 7, 7, 9, 12, 9],
                   'rebounds': [11, 8, 11, 6, 6, 5]},
                   index=['Andy','Bob', 'Chad', 'Dan', 'Eric', 'Frank'])

#view DataFrame
df

        points assists rebounds
Andy 25 5 11
Bob 12 7 8
Chad 15 7 11
Dan 8 9 6
Eric 9 12 6
Frank 23 9 5

예시 1: 각 열의 최대값이 있는 인덱스 찾기

다음 코드는 각 열의 최대값을 갖는 인덱스를 찾는 방법을 보여줍니다.

 #find index that has max value for each column
df. idxmax (axis= 0 )

Andy points
assists Eric
rebounds Andy
dtype:object

결과에서 우리는 다음을 볼 수 있습니다:

  • 포인트 열에서 가장 높은 값을 얻은 플레이어는 Andy입니다.
  • 어시스트 열에서 가장 높은 값을 얻은 선수는 Eric입니다.
  • 리바운드 열에서 가장 높은 값을 가진 선수는 Andy입니다.

idxmax() 함수는 처음 나타나는 최대값을 반환한다는 점에 유의하는 것이 중요합니다.

예를 들어 Andy와 Chad는 모두 11개의 리바운드를 기록했습니다. Andy가 DataFrame에서 가장 먼저 나타나므로 그의 이름이 반환됩니다.

예시 2: 각 행의 최대값이 있는 열 찾기

다음 코드는 각 행의 최대값을 포함하는 열을 찾는 방법을 보여줍니다.

 #find column that has max value for each row
df. idxmax (axis= 1 )

Andy points
Bob stitches
Chad points
Dan assists
Eric assists
Frank points
dtype:object

결과에서 우리는 다음을 볼 수 있습니다:

  • “Andy”라고 표시된 행에서 가장 높은 값이 포인트 열에 있습니다.
  • “Bob”이라고 표시된 행에서 가장 높은 값이 포인트 열에 있습니다.
  • ‘Chad’라고 표시된 행에서 가장 높은 값이 점수 열에 있습니다.
  • “Dan”이라고 표시된 행에서 가장 높은 값이 어시스트 열에 있습니다.
  • “Eric”이라고 표시된 행에서 가장 높은 값이 어시스트 열에 있습니다.
  • “Andy”라고 표시된 행에서 가장 높은 값이 포인트 열에 있습니다.

idxmax() 함수에 대한 전체 설명은 pandas 설명서를 참조하세요.

추가 리소스

Pandas에서 열의 최대값을 찾는 방법
Pandas에서 열의 평균을 계산하는 방법
Pandas에서 열의 합계를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다