كيفية إجراء anova ثنائي الاتجاه في بايثون


يتم استخدام ANOVA ثنائي الاتجاه لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات ثلاث مجموعات مستقلة أو أكثر تم تقسيمها على عاملين أم لا.

الغرض من تحليل التباين ثنائي الاتجاه هو تحديد تأثير عاملين على متغير الاستجابة وتحديد ما إذا كان هناك تفاعل بين العاملين على متغير الاستجابة أم لا.

يشرح هذا البرنامج التعليمي كيفية إجراء ANOVA ثنائي الاتجاه في Python.

مثال: تحليل التباين ثنائي الاتجاه في بايثون

يريد عالم النبات معرفة ما إذا كان نمو النبات يتأثر بالتعرض لأشعة الشمس وتكرار الري. تزرع 30 بذرة وتتركها تنمو لمدة شهرين في ظروف مختلفة من التعرض لأشعة الشمس وتكرار الري. وبعد شهرين، سجلت ارتفاع كل نبتة بالبوصة.

استخدم الخطوات التالية لإجراء تحليل التباين (ANOVA) ثنائي الاتجاه لتحديد ما إذا كان تكرار الري والتعرض لأشعة الشمس لهما تأثير كبير على نمو النبات، ولتحديد ما إذا كان هناك تأثير تفاعل بين تردد الماء والتعرض لأشعة الشمس. الري والتعرض لأشعة الشمس.

الخطوة 1: أدخل البيانات.

أولاً، سنقوم بإنشاء إطار بيانات الباندا الذي يحتوي على المتغيرات الثلاثة التالية:

  • الماء: عدد مرات سقي كل نبات: يوميًا أو أسبوعيًا
  • الشمس: كمية التعرض لأشعة الشمس التي يتلقاها كل نبات: منخفضة أو متوسطة أو عالية
  • الارتفاع: ارتفاع كل نبات (بالبوصة) بعد شهرين
 import numpy as np
import pandas as pd

#create data
df = pd.DataFrame({'water': np.repeat(['daily', 'weekly'], 15),
                   'sun': np.tile(np.repeat(['low', 'med', 'high'], 5), 2),
                   'height': [6, 6, 6, 5, 6, 5, 5, 6, 4, 5,
                              6, 6, 7, 8, 7, 3, 4, 4, 4, 5,
                              4, 4, 4, 4, 4, 5, 6, 6, 7, 8]})

#view first ten rows of data 
df[:10]

	water sun height
0 daily low 6
1 daily low 6
2 daily low 6
3 daily low 5
4 daily low 6
5 daily med 5
6 daily med 5
7 daily med 6
8 daily med 4
9 daily med 5

الخطوة 2: إجراء تحليل التباين ثنائي الاتجاه.

بعد ذلك، سنقوم بإجراء تحليل التباين ثنائي الاتجاه باستخدام الدالة anova_lm() من مكتبة statsmodels:

 import statsmodels.api as sm
from statsmodels.formula.api import ols

#perform two-way ANOVA
model = ols('height ~ C(water) + C(sun) + C(water):C(sun)', data=df).fit()
sm.stats.anova_lm(model, typ=2)

	           sum_sq df F PR(>F)
C(water) 8.533333 1.0 16.0000 0.000527
C(sun) 24.866667 2.0 23.3125 0.000002
C(water):C(sun) 2.466667 2.0 2.3125 0.120667
Residual 12.800000 24.0 NaN NaN

الخطوة 3: تفسير النتائج.

يمكننا أن نرى القيم الاحتمالية التالية لكل عامل من العوامل في الجدول:

  • الماء: القيمة الاحتمالية = 0.000527
  • الشمس: القيمة الاحتمالية = 0.0000002
  • الماء*الشمس: القيمة الاحتمالية = 0.120667

وبما أن القيم p للماء والشمس كلاهما أقل من 0.05، فهذا يعني أن كلا العاملين لهما تأثير ذو دلالة إحصائية على ارتفاع النبات.

وبما أن القيمة p لتأثير التفاعل (0.120667) لا تقل عن 0.05 فهذا يدلنا على عدم وجود تأثير تفاعلي معنوي بين التعرض للشمس وتكرار الري.

ملاحظة: على الرغم من أن نتائج تحليل التباين (ANOVA) تخبرنا أن تكرار الري والتعرض لأشعة الشمس لهما تأثير ذو دلالة إحصائية على ارتفاع النبات، إلا أننا سنحتاج إلى إجراء اختبار ما بعد مخصص لتحديد مدى تأثير المستويات المختلفة للمياه وأشعة الشمس على ارتفاع النبات.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في بايثون:

كيفية إجراء ANOVA أحادي الاتجاه في بايثون
كيفية إجراء ANOVA ثلاثي الاتجاهات في بايثون

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *