Pandas: value_counts를 백분율로 표시하는 방법
팬더의 value_counts() 함수를 사용하여 DataFrame의 특정 열에서 값의 발생 횟수를 계산할 수 있습니다.
값을 백분율로 표시하려면 다음 방법 중 하나를 사용할 수 있습니다.
방법 1: 값을 백분율로 표시(소수점 형식)
df. my_col . value_counts (normalize= True )
방법 2: 값을 백분율로 표시(백분율 기호로 형식 지정)
df. my_col . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % '
방법 3: 값 개수를 백분율로 표시(개수 포함)
counts = df. my_col . value_counts () percs = df. my_col . value_counts (normalize= True ) p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage '])
다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'C'], ' points ': [15, 12, 18, 20, 22, 28, 35, 40]}) #view DataFrame print (df) team points 0 to 15 1 to 12 2 B 18 3 B 20 4 B 22 5 B 28 6 B 35 7 C 40
예시 1: 값을 백분율로 표시(소수점 형식)
다음 코드는 팀 열에서 각 값의 발생 횟수를 계산하고 발생 횟수를 전체의 백분율(십진수 형식)로 표시하는 방법을 보여줍니다.
#count occurrence of each value in 'team' column as percentage of total df. team . value_counts (normalize= True ) B 0.625 At 0.250 C 0.125 Name: team, dtype: float64
결과에서 우리는 다음을 볼 수 있습니다:
- B 값은 팀 열 발생의 62.5%를 나타냅니다.
- A 값은 팀 열의 발생 횟수 중 25%를 나타냅니다.
- C 값은 팀 열에서 발생하는 횟수의 12.5%를 나타냅니다.
백분율은 소수점 형식으로 표시됩니다.
예시 2: 값을 백분율로 표시(백분율 기호로 형식 지정)
다음 코드는 팀 열에서 각 값의 발생 횟수를 계산하고 발생 횟수를 백분율 기호 형식으로 전체 대비 백분율로 표시하는 방법을 보여줍니다.
#count occurrence of each value in 'team' column as percentage of total df. team . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % ' B 62.5% At 25.0% C 12.5% Name: team, dtype: object
백분율은 백분율 기호가 포함된 문자열로 형식화됩니다.
예시 3: 값의 개수를 백분율로 표현하기(숫자 포함)
다음 코드는 팀 열에서 각 값의 발생 횟수를 계산하고 발생 횟수를 숫자와 백분율로 표시하는 방법을 보여줍니다.
#count occurrence of each value in 'team' column counts = df. team . value_counts () #count occurrence of each value in 'team' column as percentage of total percs = df. team . value_counts (normalize= True ) #concatenate results into one DataFrame p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage ']) count percentage B 5 0.625 At 2 0.250 C 1 0.125
개수 열에는 팀 열의 각 고유 값 개수가 표시되고, 백분율 열에는 각 고유 값이 총 발생 횟수에 대한 백분율로 표시됩니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas: 가치 계정을 그리는 방법
Pandas: GroupBy 및 값 개수를 사용하는 방법
Pandas: 그룹별로 히스토그램을 그리는 방법