Pandas: value_counts를 백분율로 표시하는 방법


팬더의 value_counts() 함수를 사용하여 DataFrame의 특정 열에서 값의 발생 횟수를 계산할 수 있습니다.

값을 백분율로 표시하려면 다음 방법 중 하나를 사용할 수 있습니다.

방법 1: 값을 백분율로 표시(소수점 형식)

 df. my_col . value_counts (normalize= True )

방법 2: 값을 백분율로 표시(백분율 기호로 형식 지정)

 df. my_col . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % '

방법 3: 값 개수를 백분율로 표시(개수 포함)

 counts = df. my_col . value_counts ()
percs = df. my_col . value_counts (normalize= True )
p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage '])

다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'C'],
                   ' points ': [15, 12, 18, 20, 22, 28, 35, 40]})

#view DataFrame
print (df)

  team points
0 to 15
1 to 12
2 B 18
3 B 20
4 B 22
5 B 28
6 B 35
7 C 40

예시 1: 값을 백분율로 표시(소수점 형식)

다음 코드는 열에서 각 값의 발생 횟수를 계산하고 발생 횟수를 전체의 백분율(십진수 형식)로 표시하는 방법을 보여줍니다.

 #count occurrence of each value in 'team' column as percentage of total
df. team . value_counts (normalize= True )

B 0.625
At 0.250
C 0.125
Name: team, dtype: float64

결과에서 우리는 다음을 볼 수 있습니다:

  • B 값은 팀 열 발생의 62.5%를 나타냅니다.
  • A 값은 팀 열의 발생 횟수 중 25%를 나타냅니다.
  • C 값은 팀 열에서 발생하는 횟수의 12.5%를 나타냅니다.

백분율은 소수점 형식으로 표시됩니다.

예시 2: 값을 백분율로 표시(백분율 기호로 형식 지정)

다음 코드는 열에서 각 값의 발생 횟수를 계산하고 발생 횟수를 백분율 기호 형식으로 전체 대비 백분율로 표시하는 방법을 보여줍니다.

 #count occurrence of each value in 'team' column as percentage of total
df. team . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % '

B 62.5%
At 25.0%
C 12.5%
Name: team, dtype: object

백분율은 백분율 기호가 포함된 문자열로 형식화됩니다.

예시 3: 값의 개수를 백분율로 표현하기(숫자 포함)

다음 코드는 열에서 각 값의 발생 횟수를 계산하고 발생 횟수를 숫자와 백분율로 표시하는 방법을 보여줍니다.

 #count occurrence of each value in 'team' column
counts = df. team . value_counts ()

#count occurrence of each value in 'team' column as percentage of total
percs = df. team . value_counts (normalize= True )

#concatenate results into one DataFrame
p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage '])

        count percentage
B 5 0.625
At 2 0.250
C 1 0.125

개수 열에는 팀 열의 각 고유 값 개수가 표시되고, 백분율 열에는 각 고유 값이 총 발생 횟수에 대한 백분율로 표시됩니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: 가치 계정을 그리는 방법
Pandas: GroupBy 및 값 개수를 사용하는 방법
Pandas: 그룹별로 히스토그램을 그리는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다