Cara menghitung kuartil di panda (dengan contoh)


Dalam statistika, kuartil adalah nilai yang membagi sekumpulan data menjadi empat bagian yang sama besar.

Saat menganalisis suatu distribusi, umumnya kita tertarik pada kuartil berikut:

  • Kuartil pertama ( Q1 ): Nilai yang terletak pada persentil ke-25
  • Kuartil kedua ( Q2 ): Nilai yang terletak pada persentil ke-50
  • Kuartil ketiga ( Q3 ): Nilai yang terletak pada persentil ke-75

Anda dapat menggunakan metode berikut untuk menghitung kuartil kolom di pandas DataFrame:

Metode 1: Hitung Kuartil untuk Kolom

 df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])

Metode 2: Hitung Kuartil untuk Setiap Kolom Numerik

 df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan pandas DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   ' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
                   ' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15

Contoh 1: Hitung kuartil untuk sebuah kolom

Kode berikut menunjukkan cara menghitung kuartil untuk kolom poin saja:

 #calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])

0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64

Dari hasilnya kita dapat melihat:

  • Kuartil pertama adalah 14,5 .
  • Kuartil kedua adalah 25 .
  • Kuartil ketiga adalah 29,5 .

Dengan mengetahui ketiga nilai tersebut saja, kita mempunyai gambaran yang cukup baik tentang bagaimana nilai-nilai tersebut didistribusikan pada kolom poin .

Contoh 2: Hitung Kuartil untuk Setiap Kolom Numerik

Kode berikut menunjukkan cara menghitung kuartil untuk setiap kolom numerik di DataFrame:

 #calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

      assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75

Outputnya menampilkan kuartil dari dua kolom numerik DataFrame.

Perhatikan bahwa ada beberapa cara untuk menghitung kuartil suatu distribusi.

Lihat halaman dokumentasi pandas untuk melihat berbagai metode yang digunakan fungsi pandas quantile() untuk menghitung kuartil.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Cara menghitung persen perubahan pada panda
Cara menghitung persentase kumulatif di panda
Cara menghitung persentase total dalam suatu kelompok di panda

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *