Cara membuat plot distribusi di matplotlib
Ada dua cara umum untuk membuat diagram distribusi dengan Python:
Metode 1: Buat Histogram Menggunakan Matplotlib
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Perhatikan bahwa warna mengontrol warna isian batang, ec mengontrol warna tepi batang, dan bins mengontrol jumlah nampan dalam histogram.
Metode 2: Membuat Histogram dengan Kurva Densitas Menggunakan Seaborn
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
Perhatikan bahwa kde=True menetapkan bahwa kurva kepadatan harus ditumpangkan pada histogram.
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktiknya untuk memvisualisasikan distribusi nilai dalam array NumPy berikut:
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
Contoh 1: Membuat Histogram Menggunakan Matplotlib
Kita dapat menggunakan kode berikut untuk membuat histogram di Matplotlib untuk memvisualisasikan distribusi nilai dalam array NumPy:
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Sumbu x menampilkan nilai dari array NumPy dan sumbu y menampilkan frekuensi nilai tersebut.
Perhatikan bahwa semakin besar nilai yang Anda gunakan untuk argumen bins , semakin banyak batang yang ada di histogram.
Contoh 2: Buat histogram dengan kurva kepadatan menggunakan Seaborn
Kita dapat menggunakan kode berikut untuk membuat histogram dengan kurva kepadatan yang dilapis menggunakan pustaka visualisasi data seaborn:
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
Hasilnya adalah histogram yang ditumpangkan pada kurva kepadatan.
Keuntungan menggunakan kurva densitas adalah ia merangkum bentuk distribusi menggunakan kurva kontinu tunggal.
Catatan : Anda dapat menemukan dokumentasi lengkap untuk fungsi seaborn displot() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara membuat grafik umum lainnya dengan Python:
Cara Membuat Diagram Batang Bertumpuk di Matplotlib
Cara membuat histogram frekuensi relatif di Matplotlib
Cara membuat barplot horizontal di Seaborn