Pandalarda sütun değerlerinin dağılımı nasıl çizilir
Bir pandas DataFrame’de sütun değerlerinin dağılımını çizmek için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Değerlerin dağılımını bir sütuna çizin
df[' my_column ']. plot (kind=' kde ')
Yöntem 2: Değerlerin dağılımını başka bir sütuna göre gruplandırılmış bir sütuna çizin
df. groupby (' group_column ')[' values_column ']. plot (kind=' kde ')
Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'], ' points ': [3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17]}) #view DataFrame print (df) team points 0 to 3 1 to 3 2 to 4 3 to 5 4 to 4 5 TO 7 6 to 7 7 to 7 8 to 10 9 to 11 10 B 8 11 B 7 12 B 8 13 B 9 14 B 12 15 B 12 16 B 12 17 B 14 18 B 15 19 B 17
Örnek 1: Değerlerin dağılımını bir sütuna çizin
Aşağıdaki kod, puan sütununda değerlerin dağılımının nasıl çizileceğini gösterir:
#plot distribution of values in points column df[' points ']. plot (kind=' kde ')
kind=’kde’nin pandalara, bir değişkenin değerlerinin dağılımını özetleyen düzgün bir eğri üreten çekirdek yoğunluğu tahminini kullanmasını söylediğini unutmayın.
Bunun yerine bir histogram oluşturmak istiyorsanız, kind=’hist’i aşağıdaki gibi belirtebilirsiniz:
#plot distribution of values in points column using histogram df[' points ']. plot (kind=' hist ', edgecolor=' black ')
Bu yöntem, dağılımın şeklini özetleyen düz bir çizginin aksine, noktalar sütunundaki değerlerin frekanslarını temsil etmek için çubuklar kullanır.
Örnek 2: Bir sütundaki değerlerin dağılımını başka bir sütuna göre gruplandırarak çizin
Aşağıdaki kod, takım sütununa göre gruplandırılmış puan sütunundaki değerlerin dağılımının nasıl çizileceğini gösterir:
import matplotlib.pyplot as plt #plot distribution of points by team df. groupby (' team ')[' points ']. plot (kind=' kde ') #add legend plt. legend ([' A ',' B '], title=' Team ') #add x-axis label plt. xlabel (' Points ')
Mavi çizgi A takımı oyuncularının puan dağılımını, turuncu çizgi ise B takımı oyuncularının puan dağılımını gösterir.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandas’ta grafiklere başlıklar nasıl eklenir?
Bir panda grafiğinin şekil boyutu nasıl ayarlanır?
Alt noktalarda birden fazla Pandas DataFrame nasıl çizilir
Pandalarda Konu Efsaneleri Nasıl Oluşturulur ve Özelleştirilir