Cara melakukan uji kesesuaian chi-kuadrat dengan python


Uji kesesuaian chi-kuadrat digunakan untuk menentukan apakah suatu variabel kategori mengikuti distribusi hipotetis atau tidak.

Tutorial ini menjelaskan cara melakukan uji kesesuaian chi-kuadrat dengan Python.

Contoh: Uji kesesuaian chi-kuadrat dengan Python

Seorang pemilik toko mengatakan bahwa jumlah pelanggan yang datang ke tokonya sama setiap hari dalam seminggu. Untuk menguji hipotesis ini, peneliti mencatat jumlah pelanggan yang datang ke toko pada minggu tertentu dan menemukan hal berikut:

  • Senin: 50 pelanggan
  • Selasa: 60 pelanggan
  • Rabu: 40 pelanggan
  • Kamis: 47 pelanggan
  • Jumat: 53 pelanggan

Gunakan langkah-langkah berikut untuk melakukan uji kesesuaian chi-kuadrat dengan Python untuk menentukan apakah data konsisten dengan klaim pemilik toko.

Langkah 1: Buat datanya.

Pertama, kita akan membuat dua tabel untuk memuat jumlah pelanggan yang diamati dan diharapkan setiap hari:

 expected = [50, 50, 50, 50, 50]
observed = [50, 60, 40, 47, 53]

Langkah 2: Lakukan uji kecocokan chi-kuadrat.

Selanjutnya, kita dapat melakukan uji kelayakan chi-kuadrat menggunakan fungsi chi-kuadrat dari pustaka SciPy, yang menggunakan sintaksis berikut:

chi kuadrat (f_obs, f_exp)

Emas:

  • f_obs: serangkaian jumlah yang diamati.
  • f_exp: serangkaian jumlah yang diharapkan. Secara default, setiap kategori diasumsikan memiliki kemungkinan yang sama.

Kode berikut menunjukkan cara menggunakan fungsi ini dalam contoh spesifik kami:

 import scipy.stats as stats

#perform Chi-Square Goodness of Fit Test
stats.chisquare(f_obs=observed, f_exp=expected)

(statistic=4.36, pvalue=0.35947)

Statistik uji Chi-kuadrat adalah 4,36 dan nilai p yang sesuai adalah 0,35947 .

Perhatikan bahwa nilai p sesuai dengan nilai Chi-kuadrat dengan n-1 derajat kebebasan (dof), di mana n adalah jumlah kategori yang berbeda. Dalam hal ini, dof = 5-1 = 4. Anda dapat menggunakan kalkulator chi-kuadrat ke nilai P untuk memastikan bahwa nilai p yang sesuai dengan X 2 = 4,36 dengan dof = 4 adalah 0,35947 .

Ingatlah bahwa uji kesesuaian chi-kuadrat menggunakan hipotesis nol dan hipotesis alternatif berikut:

  • H 0 : (hipotesis nol) Suatu variabel mengikuti distribusi hipotetis.
  • H 1 : (hipotesis alternatif) Suatu variabel tidak mengikuti distribusi hipotetis.

Karena nilai p (0,35947) tidak kurang dari 0,05, kami gagal menolak hipotesis nol. Artinya, kami tidak memiliki cukup bukti untuk mengatakan bahwa sebaran pelanggan sebenarnya berbeda dengan yang dilaporkan oleh pemilik toko.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *