Cara melakukan tes tukey dengan python
ANOVA satu arah digunakan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara rata-rata tiga atau lebih kelompok independen.
Jika nilai p keseluruhan tabel ANOVA berada di bawah tingkat signifikansi tertentu, maka kita memiliki cukup bukti untuk mengatakan bahwa setidaknya salah satu mean kelompok berbeda dari mean kelompok lainnya.
Namun, hal ini tidak memberi tahu kita kelompok mana yang berbeda satu sama lain. Hal ini menunjukkan kepada kita bahwa tidak semua rata-rata kelompok adalah sama. Untuk mengetahui secara pasti kelompok mana yang berbeda satu sama lain, kita perlu melakukan tes post hoc .
Salah satu tes post hoc yang paling umum digunakan adalah tes Tukey , yang memungkinkan kita melakukan perbandingan berpasangan antara rata-rata setiap kelompok sambil mengendalikan tingkat kesalahan berdasarkan kelompok .
Tutorial ini memberikan contoh langkah demi langkah tentang cara melakukan tes Tukey dengan Python.
Langkah 1: Muat paket dan fungsi yang diperlukan
Pertama, kita akan memuat paket dan fungsi yang diperlukan dengan Python:
import pandas as pd
import numpy as np
from scipy. stats import f_oneway
from statsmodels. stats . multicomp import pairwise_tukeyhsd
Langkah 2: Pasangkan model ANOVA
Kode berikut menunjukkan cara membuat kumpulan data palsu dengan tiga kelompok (A, B, dan C) dan menyesuaikan model ANOVA satu arah ke data untuk menentukan apakah nilai rata-rata setiap kelompok sama:
#enter data for three groups a = [85, 86, 88, 75, 78, 94, 98, 79, 71, 80] b = [91, 92, 93, 90, 97, 94, 82, 88, 95, 96] c = [79, 78, 88, 94, 92, 85, 83, 85, 82, 81] #perform one-way ANOVA f_oneway(a, b, c) F_onewayResult(statistic=5.167774552944481, pvalue=0.012582197136592609)
Kita dapat melihat bahwa nilai p keseluruhan dari tabel ANOVA adalah 0.01258 .
Karena angka ini kurang dari 0,05, kami mempunyai cukup bukti untuk mengatakan bahwa nilai rata-rata pada setiap kelompok tidak sama.
Jadi, kita dapat melakukan uji Tukey untuk mengetahui secara pasti mean kelompok mana yang berbeda.
Langkah 3: Lakukan tes Tukey
Untuk melakukan tes Tukey dengan Python, kita dapat menggunakan fungsi pairwise_tukeyhsd() dari perpustakaan statsmodels :
#create DataFrame to hold data df = pd. DataFrame ({'score': [85, 86, 88, 75, 78, 94, 98, 79, 71, 80, 91, 92, 93, 90, 97, 94, 82, 88, 95, 96, 79, 78, 88, 94, 92, 85, 83, 85, 82, 81], 'group': np. repeat (['a', 'b', 'c'], repeats= 10 )}) # perform Tukey's test tukey = pairwise_tukeyhsd(endog=df['score'], groups=df['group'], alpha= 0.05 ) #display results print (tukey) Multiple Comparison of Means - Tukey HSD, FWER=0.05 ==================================================== === group1 group2 meandiff p-adj lower upper reject -------------------------------------------------- --- ab 8.4 0.0158 1.4272 15.3728 True ac 1.3 0.8864 -5.6728 8.2728 False bc -7.1 0.0453 -14.0728 -0.1272 True -------------------------------------------------- ---
Berikut cara menafsirkan hasilnya:
- Nilai P selisih mean antara a dan b: 0,0158
- Nilai P selisih mean antara a dan c: 0,8864
- Nilai P selisih mean antara b dan c: 0,0453
Dengan demikian, kita dapat menyimpulkan bahwa terdapat perbedaan yang signifikan secara statistik antara rata-rata kelompok a dan b serta kelompok b dan c , namun tidak ada perbedaan yang signifikan secara statistik antara rata-rata kelompok a dan c .
Sumber daya tambahan
Cara Melakukan ANOVA Satu Arah dengan Python
Cara Melakukan ANOVA Dua Arah dengan Python
Cara Melakukan Tindakan Berulang ANOVA dengan Python