पायथन में टुकी टेस्ट कैसे करें

द्वारा डॉ. बेंजामिन एंडरसन जुलाई 26, 2023 मार्गदर्शक शून्य टिप्पणियां

एक-तरफ़ा एनोवा का उपयोग यह निर्धारित करने के लिए किया जाता है कि तीन या अधिक स्वतंत्र समूहों के साधनों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है या नहीं।

यदि एनोवा तालिका का समग्र पी-मूल्य एक निश्चित स्तर के महत्व से नीचे है, तो हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि समूह का कम से कम एक साधन दूसरों से अलग है।

हालाँकि, इससे हमें यह नहीं पता चलता कि कौन से समूह एक-दूसरे से भिन्न हैं। यह हमें बस इतना बताता है कि सभी समूहों का औसत समान नहीं है। यह जानने के लिए कि कौन से समूह एक-दूसरे से भिन्न हैं, हमें एक पोस्ट हॉक परीक्षण करने की आवश्यकता है।

सबसे अधिक उपयोग किए जाने वाले पोस्ट हॉक परीक्षणों में से एक तुकी परीक्षण है, जो हमें परिवारवार त्रुटि दर को नियंत्रित करते हुए प्रत्येक समूह के साधनों के बीच जोड़ीवार तुलना करने की अनुमति देता है।

यह ट्यूटोरियल पायथन में टुकी परीक्षण कैसे करें इसका चरण-दर-चरण उदाहरण प्रदान करता है।

चरण 1: आवश्यक पैकेज और फ़ंक्शन लोड करें

सबसे पहले, हम पायथन में आवश्यक पैकेज और फ़ंक्शन लोड करेंगे:

 import pandas as pd
import numpy as np
from scipy. stats import f_oneway
from statsmodels. stats . multicomp import pairwise_tukeyhsd

चरण 2: एनोवा मॉडल फिट करें

निम्नलिखित कोड दिखाता है कि तीन समूहों (ए, बी, और सी) के साथ एक नकली डेटा सेट कैसे बनाया जाए और यह निर्धारित करने के लिए डेटा में एक-तरफ़ा एनोवा मॉडल फिट किया जाए कि प्रत्येक समूह का औसत मान बराबर है या नहीं:

 #enter data for three groups
a = [85, 86, 88, 75, 78, 94, 98, 79, 71, 80]
b = [91, 92, 93, 90, 97, 94, 82, 88, 95, 96]
c = [79, 78, 88, 94, 92, 85, 83, 85, 82, 81]

#perform one-way ANOVA
f_oneway(a, b, c)

F_onewayResult(statistic=5.167774552944481, pvalue=0.012582197136592609)

हम देख सकते हैं कि एनोवा तालिका से कुल पी-वैल्यू 0.01258 है।

चूँकि यह संख्या 0.05 से कम है, हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि प्रत्येक समूह में औसत मान समान नहीं हैं।

इसलिए, हम यह निर्धारित करने के लिए टुकी परीक्षण कर सकते हैं कि वास्तव में कौन से समूह के साधन भिन्न हैं।

चरण 3: तुकी परीक्षण करें

पायथन में तुकी परीक्षण करने के लिए, हम statsmodels लाइब्रेरी से युग्मित_tukeyhsd() फ़ंक्शन का उपयोग कर सकते हैं:

 #create DataFrame to hold data
df = pd. DataFrame ({'score': [85, 86, 88, 75, 78, 94, 98, 79, 71, 80,
                             91, 92, 93, 90, 97, 94, 82, 88, 95, 96,
                             79, 78, 88, 94, 92, 85, 83, 85, 82, 81],
                   'group': np. repeat (['a', 'b', 'c'], repeats= 10 )}) 

# perform Tukey's test
tukey = pairwise_tukeyhsd(endog=df['score'],
                          groups=df['group'],
                          alpha= 0.05 )

#display results
print (tukey)

 Multiple Comparison of Means - Tukey HSD, FWER=0.05 
==================================================== ===
group1 group2 meandiff p-adj lower upper reject
-------------------------------------------------- ---
     ab 8.4 0.0158 1.4272 15.3728 True
     ac 1.3 0.8864 -5.6728 8.2728 False
     bc -7.1 0.0453 -14.0728 -0.1272 True
-------------------------------------------------- ---

यहां परिणाम की व्याख्या करने का तरीका बताया गया है:

ए और बी के बीच के अंतर के लिए पी मान: 0.0158
ए और सी के बीच के अंतर के लिए पी मान: 0.8864
बी और सी के बीच के अंतर के लिए पी मान: 0.0453

इस प्रकार, हम यह निष्कर्ष निकालेंगे कि समूह ए और बी और समूह बी और सी के साधनों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है, लेकिन समूह ए और सी के साधनों के बीच कोई सांख्यिकीय रूप से महत्वपूर्ण अंतर नहीं है।

अतिरिक्त संसाधन

पायथन में वन-वे एनोवा कैसे निष्पादित करें
पायथन में टू-वे एनोवा कैसे निष्पादित करें
पायथन में एनोवा द्वारा दोहराए गए उपाय कैसे करें

लेखक के बारे में

डॉ. बेंजामिन एंडरसन

नमस्ते, मैं बेंजामिन हूं, एक सेवानिवृत्त सांख्यिकी प्रोफेसर जो अब समर्पित Statorials शिक्षक बन गया है। सांख्यिकी के क्षेत्र में व्यापक अनुभव और विशेषज्ञता के साथ, मैं Statorials के माध्यम से छात्रों को सशक्त बनाने के लिए अपना ज्ञान साझा करने के लिए उत्सुक हूं। अधिक जाने