Pandalarda sütun değerlerinin dağılımı nasıl çizilir


Bir pandas DataFrame’de sütun değerlerinin dağılımını çizmek için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Değerlerin dağılımını bir sütuna çizin

 df[' my_column ']. plot (kind=' kde ')

Yöntem 2: Değerlerin dağılımını başka bir sütuna göre gruplandırılmış bir sütuna çizin

 df. groupby (' group_column ')[' values_column ']. plot (kind=' kde ')

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                            'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 
                              8, 7, 8, 9, 12, 12, 12, 14, 15, 17]})

#view DataFrame
print (df)

   team points
0 to 3
1 to 3
2 to 4
3 to 5
4 to 4
5 TO 7
6 to 7
7 to 7
8 to 10
9 to 11
10 B 8
11 B 7
12 B 8
13 B 9
14 B 12
15 B 12
16 B 12
17 B 14
18 B 15
19 B 17

Örnek 1: Değerlerin dağılımını bir sütuna çizin

Aşağıdaki kod, puan sütununda değerlerin dağılımının nasıl çizileceğini gösterir:

 #plot distribution of values in points column
df[' points ']. plot (kind=' kde ')

kind=’kde’nin pandalara, bir değişkenin değerlerinin dağılımını özetleyen düzgün bir eğri üreten çekirdek yoğunluğu tahminini kullanmasını söylediğini unutmayın.

Bunun yerine bir histogram oluşturmak istiyorsanız, kind=’hist’i aşağıdaki gibi belirtebilirsiniz:

 #plot distribution of values in points column using histogram
df[' points ']. plot (kind=' hist ', edgecolor=' black ') 

Bu yöntem, dağılımın şeklini özetleyen düz bir çizginin aksine, noktalar sütunundaki değerlerin frekanslarını temsil etmek için çubuklar kullanır.

Örnek 2: Bir sütundaki değerlerin dağılımını başka bir sütuna göre gruplandırarak çizin

Aşağıdaki kod, takım sütununa göre gruplandırılmış puan sütunundaki değerlerin dağılımının nasıl çizileceğini gösterir:

 import matplotlib.pyplot as plt

#plot distribution of points by team 
df. groupby (' team ')[' points ']. plot (kind=' kde ')

#add legend
plt. legend ([' A ',' B '], title=' Team ')

#add x-axis label
plt. xlabel (' Points ')

Mavi çizgi A takımı oyuncularının puan dağılımını, turuncu çizgi ise B takımı oyuncularının puan dağılımını gösterir.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandas’ta grafiklere başlıklar nasıl eklenir?
Bir panda grafiğinin şekil boyutu nasıl ayarlanır?
Alt noktalarda birden fazla Pandas DataFrame nasıl çizilir
Pandalarda Konu Efsaneleri Nasıl Oluşturulur ve Özelleştirilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir