كيفية إجراء تحليل التباين (ancova) في بايثون


يتم استخدام تحليل التباين المشترك ( ANCOVA ) (“تحليل التباين”) لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات ثلاث مجموعات مستقلة أو أكثر، بعد التحكم في واحد أو أكثر من المتغيرات المشتركة .

يشرح هذا البرنامج التعليمي كيفية إجراء تحليل التباين (ANCOVA) في بايثون.

مثال: ANCOVA في بايثون

تريد إحدى المعلمات معرفة ما إذا كانت هناك ثلاث تقنيات دراسة مختلفة تؤثر على درجات الامتحان، ولكنها تريد أن تأخذ في الاعتبار الدرجة الحالية التي حصل عليها الطالب بالفعل في الفصل.

سيتم إجراء تحليل التباين (ANCOVA) باستخدام المتغيرات التالية:

  • متغير العامل: الدراسة الفنية
  • المتغير: النتيجة الحالية
  • متغير الاستجابة: درجة الامتحان

اتبع الخطوات التالية لإجراء تحليل التباين (ANCOVA) على مجموعة البيانات هذه:

الخطوة 1: أدخل البيانات.

أولاً، سنقوم بإنشاء DataFrame الباندا للاحتفاظ ببياناتنا:

 import numpy as np
import pandas as pd

#create data
df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5),
                   'current_grade': [67, 88, 75, 77, 85,
                                     92, 69, 77, 74, 88, 
                                     96, 91, 88, 82, 80],
                   'exam_score': [77, 89, 72, 74, 69,
                                  78, 88, 93, 94, 90,
                                  85, 81, 83, 88, 79]})
#view data 
df

   technical current_grade exam_score
0 A 67 77
1 A 88 89
2 A 75 72
3 A 77 74
4 A 85 69
5 B 92 78
6 B 69 88
7 B 77 93
8 B 74 94
9 B 88 90
10 C 96 85
11 C 91 81
12 C 88 83
13 C 82 88
14 C 80 79

الخطوة 2: إجراء تحليل التباين (ANCOVA).

بعد ذلك، سنقوم بإجراء تحليل التباين (ANCOVA) باستخدام الدالة ancova() ‎ من مكتبة penguin:

 pip install penguin 
from penguin import ancova

#perform ANCOVA
ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ')


        Source SS DF F p-unc np2
0 technical 390.575130 2 4.80997 0.03155 0.46653
1 current_grade 4.193886 1 0.10329 0.75393 0.00930
2 Residual 446.606114 11 NaN NaN NaN

الخطوة 3: تفسير النتائج.

من جدول تحليل التباين (ANCOVA)، نرى أن القيمة p (p-unc = “القيمة p غير المصححة”) لتقنية الدراسة هي 0.03155 . وبما أن هذه القيمة أقل من 0.05، فيمكننا رفض الفرضية الصفرية القائلة بأن كل أسلوب من أساليب الدراسة يؤدي إلى نفس متوسط درجات الامتحان، حتى بعد احتساب الدرجة الحالية للطالب في الفصل .

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *