पायथन में टुकी टेस्ट कैसे करें
एक-तरफ़ा एनोवा का उपयोग यह निर्धारित करने के लिए किया जाता है कि तीन या अधिक स्वतंत्र समूहों के साधनों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है या नहीं।
यदि एनोवा तालिका का समग्र पी-मूल्य एक निश्चित स्तर के महत्व से नीचे है, तो हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि समूह का कम से कम एक साधन दूसरों से अलग है।
हालाँकि, इससे हमें यह नहीं पता चलता कि कौन से समूह एक-दूसरे से भिन्न हैं। यह हमें बस इतना बताता है कि सभी समूहों का औसत समान नहीं है। यह जानने के लिए कि कौन से समूह एक-दूसरे से भिन्न हैं, हमें एक पोस्ट हॉक परीक्षण करने की आवश्यकता है।
सबसे अधिक उपयोग किए जाने वाले पोस्ट हॉक परीक्षणों में से एक तुकी परीक्षण है, जो हमें परिवारवार त्रुटि दर को नियंत्रित करते हुए प्रत्येक समूह के साधनों के बीच जोड़ीवार तुलना करने की अनुमति देता है।
यह ट्यूटोरियल पायथन में टुकी परीक्षण कैसे करें इसका चरण-दर-चरण उदाहरण प्रदान करता है।
चरण 1: आवश्यक पैकेज और फ़ंक्शन लोड करें
सबसे पहले, हम पायथन में आवश्यक पैकेज और फ़ंक्शन लोड करेंगे:
import pandas as pd
import numpy as np
from scipy. stats import f_oneway
from statsmodels. stats . multicomp import pairwise_tukeyhsd
चरण 2: एनोवा मॉडल फिट करें
निम्नलिखित कोड दिखाता है कि तीन समूहों (ए, बी, और सी) के साथ एक नकली डेटा सेट कैसे बनाया जाए और यह निर्धारित करने के लिए डेटा में एक-तरफ़ा एनोवा मॉडल फिट किया जाए कि प्रत्येक समूह का औसत मान बराबर है या नहीं:
#enter data for three groups a = [85, 86, 88, 75, 78, 94, 98, 79, 71, 80] b = [91, 92, 93, 90, 97, 94, 82, 88, 95, 96] c = [79, 78, 88, 94, 92, 85, 83, 85, 82, 81] #perform one-way ANOVA f_oneway(a, b, c) F_onewayResult(statistic=5.167774552944481, pvalue=0.012582197136592609)
हम देख सकते हैं कि एनोवा तालिका से कुल पी-वैल्यू 0.01258 है।
चूँकि यह संख्या 0.05 से कम है, हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि प्रत्येक समूह में औसत मान समान नहीं हैं।
इसलिए, हम यह निर्धारित करने के लिए टुकी परीक्षण कर सकते हैं कि वास्तव में कौन से समूह के साधन भिन्न हैं।
चरण 3: तुकी परीक्षण करें
पायथन में तुकी परीक्षण करने के लिए, हम statsmodels लाइब्रेरी से युग्मित_tukeyhsd() फ़ंक्शन का उपयोग कर सकते हैं:
#create DataFrame to hold data df = pd. DataFrame ({'score': [85, 86, 88, 75, 78, 94, 98, 79, 71, 80, 91, 92, 93, 90, 97, 94, 82, 88, 95, 96, 79, 78, 88, 94, 92, 85, 83, 85, 82, 81], 'group': np. repeat (['a', 'b', 'c'], repeats= 10 )}) # perform Tukey's test tukey = pairwise_tukeyhsd(endog=df['score'], groups=df['group'], alpha= 0.05 ) #display results print (tukey) Multiple Comparison of Means - Tukey HSD, FWER=0.05 ==================================================== === group1 group2 meandiff p-adj lower upper reject -------------------------------------------------- --- ab 8.4 0.0158 1.4272 15.3728 True ac 1.3 0.8864 -5.6728 8.2728 False bc -7.1 0.0453 -14.0728 -0.1272 True -------------------------------------------------- ---
यहां परिणाम की व्याख्या करने का तरीका बताया गया है:
- ए और बी के बीच के अंतर के लिए पी मान: 0.0158
- ए और सी के बीच के अंतर के लिए पी मान: 0.8864
- बी और सी के बीच के अंतर के लिए पी मान: 0.0453
इस प्रकार, हम यह निष्कर्ष निकालेंगे कि समूह ए और बी और समूह बी और सी के साधनों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है, लेकिन समूह ए और सी के साधनों के बीच कोई सांख्यिकीय रूप से महत्वपूर्ण अंतर नहीं है।
अतिरिक्त संसाधन
पायथन में वन-वे एनोवा कैसे निष्पादित करें
पायथन में टू-वे एनोवा कैसे निष्पादित करें
पायथन में एनोवा द्वारा दोहराए गए उपाय कैसे करें