Cara membuat plot distribusi di matplotlib


Ada dua cara umum untuk membuat diagram distribusi dengan Python:

Metode 1: Buat Histogram Menggunakan Matplotlib

 import matplotlib. pyplot as plt

plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Perhatikan bahwa warna mengontrol warna isian batang, ec mengontrol warna tepi batang, dan bins mengontrol jumlah nampan dalam histogram.

Metode 2: Membuat Histogram dengan Kurva Densitas Menggunakan Seaborn

 import seaborn as sns
sns. displot (data, kde= True , bins= 15 )

Perhatikan bahwa kde=True menetapkan bahwa kurva kepadatan harus ditumpangkan pada histogram.

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktiknya untuk memvisualisasikan distribusi nilai dalam array NumPy berikut:

 import numpy as np

#make this example reproducible.
n.p. random . seed ( 1 )

#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )

#view first five values
data[: 5 ]

array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])

Contoh 1: Membuat Histogram Menggunakan Matplotlib

Kita dapat menggunakan kode berikut untuk membuat histogram di Matplotlib untuk memvisualisasikan distribusi nilai dalam array NumPy:

 import matplotlib. pyplot as plt

#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Sumbu x menampilkan nilai dari array NumPy dan sumbu y menampilkan frekuensi nilai tersebut.

Perhatikan bahwa semakin besar nilai yang Anda gunakan untuk argumen bins , semakin banyak batang yang ada di histogram.

Contoh 2: Buat histogram dengan kurva kepadatan menggunakan Seaborn

Kita dapat menggunakan kode berikut untuk membuat histogram dengan kurva kepadatan yang dilapis menggunakan pustaka visualisasi data seaborn:

 import seaborn as sns

#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 ) 

Hasilnya adalah histogram yang ditumpangkan pada kurva kepadatan.

Keuntungan menggunakan kurva densitas adalah ia merangkum bentuk distribusi menggunakan kurva kontinu tunggal.

Catatan : Anda dapat menemukan dokumentasi lengkap untuk fungsi seaborn displot() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara membuat grafik umum lainnya dengan Python:

Cara Membuat Diagram Batang Bertumpuk di Matplotlib
Cara membuat histogram frekuensi relatif di Matplotlib
Cara membuat barplot horizontal di Seaborn

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *