Pandalarda çeyrekler nasıl hesaplanır (örnekle)


İstatistikte çeyrekler , bir veri kümesini dört eşit parçaya bölen değerlerdir.

Bir dağılımı analiz ederken genellikle aşağıdaki çeyreklerle ilgileniriz:

  • Birinci çeyrek ( Q1 ): 25. yüzdelik dilimde yer alan değer
  • İkinci çeyrek ( Q2 ): 50. yüzdelik dilimde yer alan değer
  • Üçüncü çeyrek ( Q3 ): 75. yüzdelik dilimde yer alan değer

Bir pandas DataFrame’deki sütunların çeyreklerini hesaplamak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Bir Sütun için Çeyrekleri Hesaplama

 df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])

Yöntem 2: Her Sayısal Sütun için Çeyrekleri Hesapla

 df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   ' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
                   ' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15

Örnek 1: Bir sütun için çeyrekleri hesaplama

Aşağıdaki kod yalnızca puan sütunu için çeyreklerin nasıl hesaplanacağını gösterir:

 #calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])

0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64

Sonuçtan şunu görebiliriz:

  • İlk çeyrek 14,5’tir .
  • İkinci çeyrek 25’tir .
  • Üçüncü çeyrek 29,5’tir .

Yalnızca bu üç değeri bildiğimizde, değerlerin puan sütununda nasıl dağıldığına dair oldukça iyi bir fikrimiz olur.

Örnek 2: Her Sayısal Sütun için Çeyrekleri Hesaplama

Aşağıdaki kod, DataFrame’deki her sayısal sütun için çeyreklerin nasıl hesaplanacağını gösterir:

 #calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

      assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75

Çıktı, DataFrame’in iki sayısal sütununun çeyreklerini görüntüler.

Bir dağılımın çeyreklerini hesaplamanın birkaç yolu olduğunu unutmayın.

Pandas quantile() işlevinin çeyrekleri hesaplamak için kullandığı farklı yöntemleri görmek için pandas dokümantasyon sayfasına bakın.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda yüzde değişim nasıl hesaplanır
Pandalarda kümülatif yüzde nasıl hesaplanır?
Pandalarda bir grup içindeki toplamın yüzdesi nasıl hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir