Pandas 히스토그램에 사용되는 저장소 수를 변경하는 방법


bins 인수를 사용하여 팬더 히스토그램에 사용되는 bin 수를 변경할 수 있습니다.

 df. plot . hist (columns=[' my_column '], bins= 10 )

Pandas 히스토그램에 사용되는 기본 bin 수는 10입니다.

다음 예에서는 실제로 bins 인수를 사용하는 방법을 보여줍니다.

예: Pandas 히스토그램의 저장소 수를 변경하는 방법

다양한 팀의 농구 선수가 득점한 점수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ),
                   ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )})

#view head of DataFrame
print ( df.head ())

  team points
0 A 23.248691
1 A 18.776487
2 A 18.943656
3 A 17.854063
4 A 21.730815

포인트 변수 값의 분포를 시각화하기 위해 히스토그램을 생성하면 팬더는 기본적으로 히스토그램에 10개의 빈을 사용합니다.

 #create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')

히스토그램에는 10개의 막대가 있습니다.

그러나 bins 인수를 사용하여 총 bin 수를 20으로 변경한다고 가정합니다.

 #create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 ) 

팬더는 히스토그램의 빈 수를 늘립니다.

이제 히스토그램에 20개의 막대가 있습니다.

또한 bin 수를 5개로 줄일 수도 있습니다.

 #create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 ) 

팬더는 히스토그램의 빈 수를 줄입니다.

이제 히스토그램에는 총 5개의 막대가 있습니다.

원하는 정확한 히스토그램을 생성하려면 bins 인수의 값을 자유롭게 조정하세요.

그러나 Bin 수를 선택할 때 다음 사항에 유의하십시오.

  • 너무 적은 수의 범주를 선택하면 데이터의 실제 기본 패턴이 숨겨질 수 있습니다.
  • 범주를 너무 많이 선택하면 데이터에 노이즈만 나타날 수 있습니다.

히스토그램에 사용할 최적의 Bin 수를 결정하는 유용한 방법은 Sturges의 규칙을 사용하는 것입니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas DataFrame에서 히스토그램을 만드는 방법
Pandas 시리즈에서 히스토그램을 만드는 방법
Pandas에서 그룹별로 히스토그램을 그리는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다