Cara melakukan pengujian hipotesis dengan python (dengan contoh)
Uji hipotesis adalah uji statistik formal yang kita gunakan untuk menolak atau gagal menolak hipotesis statistik.
Tutorial ini menjelaskan cara melakukan uji hipotesis berikut dengan Python:
- Uji sampel t
- Uji T dua sampel
- Uji-t sampel berpasangan
Ayo pergi!
Contoh 1: Contoh uji-t dengan Python
Uji-t satu sampel digunakan untuk menguji apakah rata-rata suatu populasi sama dengan nilai tertentu atau tidak.
Misalnya, kita ingin mengetahui apakah berat rata-rata suatu spesies penyu tertentu adalah 310 pon atau tidak.
Untuk mengujinya, kami mengumpulkan sampel penyu secara acak sederhana dengan bobot sebagai berikut:
Berat : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Kode berikut menunjukkan cara menggunakan fungsi ttest_1samp() di perpustakaan scipy.stats untuk melakukan uji-t satu sampel:
import scipy.stats as stats #define data data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] #perform one sample t-test stats. ttest_1samp (a=data, popmean= 310 ) Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)
Statistik uji-t adalah -1,5848 dan nilai p dua sisi yang sesuai adalah 0,1389 .
Dua hipotesis uji-t pada sampel tertentu adalah sebagai berikut:
- H 0 : µ = 310 (berat rata-rata spesies penyu ini adalah 310 pon)
- H A : µ ≠310 (berat rata-rata bukan 310 pon)
Karena nilai p pengujian kami (0,1389) lebih besar dari alpha = 0,05, kami gagal menolak hipotesis nol pengujian tersebut.
Kami tidak memiliki cukup bukti untuk mengatakan bahwa berat rata-rata spesies penyu ini selain 310 pon.
Contoh 2: Uji-t dua sampel dengan Python
Uji-t dua sampel digunakan untuk menguji apakah rata-rata dua populasi sama atau tidak.
Misalnya, kita ingin mengetahui apakah berat rata-rata dua spesies penyu yang berbeda sama atau tidak.
Untuk mengujinya, kami mengumpulkan sampel acak sederhana penyu dari setiap spesies dengan bobot sebagai berikut:
Sampel 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Sampel 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305
Kode berikut menunjukkan cara menggunakan fungsi ttest_ind() di perpustakaan scipy.stats untuk melakukan dua contoh uji-t ini:
import scipy. stats as stats #define array of turtle weights for each sample sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305] #perform two sample t-tests stats. ttest_ind (a=sample1, b=sample2) Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)
Statistik uji-t adalah –2,1009 dan nilai p dua sisi yang sesuai adalah 0,0463 .
Dua asumsi untuk uji t dua sampel ini adalah:
- H 0 : µ 1 = µ 2 (rata-rata bobot kedua spesies adalah sama)
- H A : µ 1 ≠ µ 2 (rata-rata bobot kedua spesies tidak sama)
Karena nilai p tes (0,0463) kurang dari 0,05, kami menolak hipotesis nol.
Artinya, kita mempunyai cukup bukti untuk mengatakan bahwa berat rata-rata antara kedua spesies tersebut tidak sama.
Contoh 3: Uji-t Sampel Berpasangan dengan Python
Uji-t sampel berpasangan digunakan untuk membandingkan rata-rata dua sampel ketika setiap observasi pada satu sampel dapat dikaitkan dengan observasi pada sampel lainnya.
Misalnya, kita ingin mengetahui apakah suatu program latihan tertentu mampu meningkatkan lompatan vertikal maksimum (dalam inci) pemain bola basket atau tidak.
Untuk mengujinya, kita dapat merekrut sampel acak sederhana yang terdiri dari 12 pemain bola basket perguruan tinggi dan mengukur setiap lompatan vertikal maksimum mereka. Kemudian kita dapat meminta setiap pemain menggunakan program pelatihan selama sebulan dan kemudian mengukur lompatan vertikal maksimum mereka lagi pada akhir bulan tersebut.
Data berikut menunjukkan tinggi lompatan maksimum (dalam inci) sebelum dan sesudah menggunakan program latihan untuk setiap pemain:
Depan : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
Setelah : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20
Kode berikut menunjukkan cara menggunakan fungsi ttest_rel() di perpustakaan scipy.stats untuk melakukan uji-t sampel berpasangan ini:
import scipy. stats as stats #define before and after max jump heights before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21] after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20] #perform paired samples t-test stats. ttest_rel (a=before, b=after) Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)
Statistik uji-t adalah –2,5289 dan nilai p dua sisi yang sesuai adalah 0,0280 .
Dua asumsi untuk uji-t sampel berpasangan ini adalah:
- H 0 : µ 1 = µ 2 (rata-rata tinggi lompatan sebelum dan sesudah menggunakan program adalah sama)
- H A : µ 1 ≠ µ 2 (rata-rata tinggi lompatan sebelum dan sesudah menggunakan program tidak sama)
Karena nilai p pengujian (0,0280) kurang dari 0,05, kami menolak hipotesis nol.
Artinya kita mempunyai cukup bukti untuk mengatakan bahwa rata-rata tinggi lompatan sebelum dan sesudah menggunakan program latihan tidak sama.
Sumber daya tambahan
Anda dapat menggunakan kalkulator online berikut untuk melakukan berbagai uji-t secara otomatis:
Contoh kalkulator uji-t
Kalkulator uji-t dua sampel
Kalkulator Uji-t Sampel Berpasangan