Pandas dataframe에 숫자 열을 추가하는 방법


다음 기본 구문을 사용하여 Pandas DataFrame에 “count” 열을 추가할 수 있습니다.

 df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ')

이 특정 구문은 var1 이라는 열의 값 수를 포함하는 DataFrame에 var1_count 라는 열을 추가합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas에 숫자 열 추가

다양한 농구 선수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' pos ': ['Gu', 'Fo', 'Fo', 'Fo', 'Gu', 'Gu', 'Fo', 'Fo'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28]})

#view DataFrame
print (df)

  team pos points
0 A Gu 18
1 A Fo 22
2 A Fo 19
3 B Fo 14
4 B Gu 14
5 B Gu 11
6 B Fo 20
7 B Fo 28

다음 코드를 사용하여 각 팀의 수를 포함하는 team_count 라는 열을 추가할 수 있습니다.

 #add column that shows total count of each team
df[' team_count '] = df. groupby (' team ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_count
0 A Gu 18 3
1 A Fo 22 3
2 A Fo 19 3
3 B Fo 14 5
4 B Gu 14 5
5 B Gu 11 5
6 B Fo 20 5
7 B Fo 28 5

팀 값이 A인 라인이 3개 있고 팀 값이 B인 라인이 5 개 있습니다.

그래서:

  • 팀이 A인 각 행에 대해 team_count 열의 값은 3 입니다.
  • 팀이 B인 각 행에 대해 team_count 열의 값은 5 입니다.

여러 변수를 함께 그룹화하는 “계정” 열을 추가할 수도 있습니다.

예를 들어, 다음 코드는 pos 변수를 그룹화하는 “count” 열을 추가하는 방법을 보여줍니다.

 #add column that shows total count of each team and position
df[' team_pos_count '] = df. groupby ([' team ', ' pos ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_pos_count
0 A Gu 18 1
1 A Fo 22 2
2 A Fo 19 2
3 B Fo 14 3
4 B Gu 14 2
5 B Gu 11 2
6 B Fo 20 3
7 B Fo 28 3

결과에서 우리는 다음을 볼 수 있습니다:

  • 열에 A가 있고 pos 열에 Gu가 포함된 행이 1 개 있습니다.
  • 열에 A가 포함되고 pos 열에 Fo가 포함된 2개의 행이 있습니다.
  • 열에 B가 포함되고 pos 열에 Fo가 포함된 3개의 행이 있습니다.
  • 열에 B가 포함되고 pos 열에 Gu가 포함된 2개의 행이 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: GroupBy 및 값 개수를 사용하는 방법
Pandas: Bin 개수와 함께 GroupBy를 사용하는 방법
Pandas: 조건이 있는 열의 값을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다