Panda'nın histogramında kullanılan kutu sayısı nasıl değiştirilir?


Bir panda histogramında kullanılan kutu sayısını değiştirmek için kutu bağımsız değişkenini kullanabilirsiniz:

 df. plot . hist (columns=[' my_column '], bins= 10 )

Bir panda histogramında kullanılan varsayılan kutu sayısı 10’dur.

Aşağıdaki örnek, bins argümanının pratikte nasıl kullanılacağını gösterir.

Örnek: Pandas histogramındaki kutu sayısı nasıl değiştirilir?

Farklı takımlardaki basketbol oyuncularının attığı puanlar hakkında bilgi içeren aşağıdaki panda DataFrame’e sahip olduğumuzu varsayalım:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ),
                   ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )})

#view head of DataFrame
print ( df.head ())

  team points
0 A 23.248691
1 A 18.776487
2 A 18.943656
3 A 17.854063
4 A 21.730815

Puan değişkeninin değerlerinin dağılımını görselleştirmek için bir histogram oluşturursak pandalar varsayılan olarak histogramda 10 kutu kullanacaktır:

 #create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')

Histogramda 10 çubuk olduğuna dikkat edin.

Ancak, toplam bin sayısını 20’ye değiştirmek için bins bağımsız değişkenini kullandığımızı varsayalım:

 #create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 ) 

pandalar histogramdaki kutu sayısını artırır

Histogramda artık 20 çubuk olduğuna dikkat edin.

Ayrıca kutu sayısını 5’e düşürebiliriz:

 #create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 ) 

pandalar histogramdaki kutu sayısını azaltır

Artık histogramda toplam 5 çubuk bulunmaktadır.

Tam olarak istediğiniz histogramı oluşturmak için bin bağımsız değişkeninin değerini ayarlamaktan çekinmeyin.

Ancak kutu sayısını seçerken aşağıdaki noktaları aklınızda bulundurun:

  • Çok az kategori seçerseniz verilerin altında yatan gerçek desen gizlenebilir.
  • Çok fazla kategori seçerseniz verilerde yalnızca gürültü görüyor olabilirsiniz.

Bir histogramda kullanılacak en uygun kutu sayısını belirlemenin yararlı bir yolu Sturges kuralını kullanmaktır.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandas DataFrame’den histogram nasıl oluşturulur
Pandalar serisinden histogram nasıl oluşturulur
Pandalarda histogramlar gruba göre nasıl çizilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir