تحليل التباين (anova)

تشرح هذه المقالة ما هو تحليل التباين، المعروف أيضًا باسم ANOVA، في الإحصائيات. لذلك، سوف تكتشف كيفية إجراء تحليل التباين، وما هو جدول ANOVA، بالإضافة إلى تمرين تم حله خطوة بخطوة. بالإضافة إلى ذلك، فإنه يوضح ما هي الافتراضات السابقة التي يجب احترامها لإجراء تحليل التباين، وأخيرا، ما هي مزايا وعيوب تحليل ANOVA.

ما هو تحليل التباين (ANOVA)؟

في الإحصاء، تحليل التباين ، ويسمى أيضًا ANOVA (تحليل التباين)، هو أسلوب يسمح لك بمقارنة الفروق بين وسائل العينات المختلفة.

يستخدم تحليل التباين (ANOVA) لتحليل ما إذا كان هناك فرق بين متوسطي أكثر من مجتمعين. وبالتالي، فإن تحليل التباين يسمح لنا بتحديد ما إذا كان متوسط السكان لمجموعتين أو أكثر مختلفًا من خلال تحليل التباين بين متوسطات العينة.

وبالتالي فإن الفرضية الصفرية لتحليل التباين هي أن وسائل جميع المجموعات التي تم تحليلها متساوية. بينما ترى الفرضية البديلة أن إحدى الوسيلتين على الأقل مختلفة.

\begin{cases}H_0: \mu_1=\mu_2=\ldots=\mu_k=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=1,2,\ldots, k\end{cases}

لذا فإن تحليل التباين مفيد بشكل خاص لمقارنة متوسطات أكثر من مجموعتين، لأنه مع هذا النوع من التحليل يمكنك دراسة متوسطات جميع المجموعات في نفس الوقت، بدلاً من مقارنة المتوسطات في أزواج. أدناه سنرى ما هي مزايا وعيوب تحليل التباين.

جدول أنوفا

ويتلخص تحليل التباين في جدول يسمى جدول التباين (ANOVA) وصيغه كما يلي:

تحليل التباين أو صيغ ANOVA

ذهب:

  • n_i

    هو حجم العينة أنا.

  • N

    هو العدد الإجمالي للملاحظات.

  • k

    هو عدد المجموعات المختلفة في تحليل التباين.

  • y_{ij}

    هي القيمة j للمجموعة i.

  • \overline{y}_{i}

    هو متوسط المجموعة i.

  • \overline{y}

    وهذا هو متوسط جميع البيانات التي تم تحليلها.

مثال على تحليل التباين (ANOVA)

لإنهاء فهم مفهوم ANOVA، دعونا نرى كيفية القيام بتحليل التباين من خلال حل مثال خطوة بخطوة.

  • تم إجراء دراسة إحصائية لمقارنة الدرجات التي حصل عليها أربعة طلاب في ثلاث مواد مختلفة (أ، ب، ج). يوضح الجدول التالي الدرجات التي حصل عليها كل طالب في اختبار بحد أقصى 20 درجة. قم بإجراء تحليل التباين لمقارنة الدرجات التي حصل عليها كل طالب في كل مادة.

الفرضية الصفرية لتحليل التباين هي أن متوسط درجات المواد الثلاثة متساوية. ومن ناحية أخرى، فإن الفرضية الصفرية هي أن بعض هذه الوسائل مختلفة.

\begin{cases}H_0: \mu_A=\mu_B=\mu_C=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=A, B, C\end{cases}

لإجراء تحليل التباين، أول ما يجب فعله هو حساب متوسط كل موضوع والمتوسط الإجمالي للبيانات:

\overline{y}_A=\cfrac{14+12+14+10}{4}=12,5

\overline{y}_B=\cfrac{13+14+10+14}{4}=12,75

\overline{y}_C=\cfrac{19+17+16+19}{4}=17,75

\overline{y}=\cfrac{14+12+14+10+13+14+10+14+19+17+16+19}{12}=14,33

بمجرد أن نعرف قيمة المتوسط، نقوم بحساب مجموع المربعات باستخدام صيغ تحليل التباين (ANOVA) الموضحة أعلاه:

\begin{aligned}\displaystyle SS_F&=\sum_{i=1}^k n_i(\overline{y}_i-\overline{y})^2\\[2ex] SS_F&= 4\cdot (12,5-14,33)^2+4\cdot (12,75-14,33)^2+4\cdot (17,75-14,33)^2\\[2ex] SS_F&=70,17\end{aligned}

\begin{aligned}\displaystyle SS_E=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y}_i)^2\\[2ex] \displaystyle SS_E=\ &(14-12,5)^2+(12-12,5)^2+(14-12,5)^2+(10-12,5)^2+\\&+(13-12,75)^2+(14-12,75)^2+(10-12,75)^2+(14-12,75)^2+\\&+(19-17,75)^2+(17-17,75)^2+(16-17,75)^2+(19-17,75)^2\\[2ex] SS_E=\ &28,50\end{aligned}

\begin{aligned}\displaystyle SS_T=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y})^2\\[2ex] \displaystyle SS_T= \ &(14-14,33)^2+(12-14,33)^2+(14-14,33)^2+(10-14,33)^2+\\&+(13-14,33)^2+(14-14,33)^2+(10-14,33)^2+(14-14,33)^2+\\&+(19-14,33)^2+(17-14,33)^2+(16-14,33)^2+(19-14,33)^2\\[2ex] SS_T= \ &98,67\end{aligned}

ثم نحدد درجات حرية العامل والخطأ والإجمالي:

GL_F=k-1=3-1=2

GL_E=N-k=12-3=9

GL_F=N-1=12-1=11

نقوم الآن بحساب متوسط الأخطاء المربعة عن طريق قسمة مجموع مربعات العامل والخطأ على درجات الحرية الخاصة بكل منهما:

MSE_F=\cfrac{SS_F}{GL_F}=\cfrac{70,17}{2}=35,08

MSE_R=\cfrac{SS_R}{GL_R}=\cfrac{28,50}{9}=3,17

وأخيرًا، نحسب قيمة إحصائية F بقسمة الخطأين المحسوبين في الخطوة السابقة:

F=\cfrac{MSE_F}{MSE_R}=\cfrac{35,09}{3,17}=11,08

باختصار، سيبدو جدول ANOVA لبيانات المثال كما يلي:

مثال على تحليل التباين (ANOVA)

بمجرد حساب جميع القيم الموجودة في جدول ANOVA، كل ما تبقى هو تفسير النتائج التي تم الحصول عليها. للقيام بذلك، نحتاج إلى إيجاد احتمال الحصول على قيمة أكبر من إحصائية F في توزيع Snedecor F مع درجات الحرية المقابلة، أي أننا بحاجة إلى تحديد القيمة p للاختبار:

P[F>11,08]=0,004″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”172″ style=”vertical-align: -5px;”></p>
</p>
<p style= لذلك، إذا أخذنا مستوى الأهمية α=0.05 (الأكثر شيوعًا)، فيجب علينا رفض فرضية العدم وقبول الفرضية البديلة، نظرًا لأن القيمة p للاختبار أقل من مستوى الأهمية. وهذا يعني أن بعض وسائل المجموعات المدروسة على الأقل تختلف عن غيرها.

0,004 < 0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \text{Se rechaza } H_0

تجدر الإشارة إلى أنه يوجد حاليًا العديد من برامج الكمبيوتر التي يمكنها إجراء تحليل التباين في ثوانٍ معدودة. ومع ذلك، من المهم أيضًا معرفة النظرية الكامنة وراء الحسابات.

افتراضات تحليل التباين (ANOVA)

من أجل إجراء تحليل التباين (ANOVA)، يجب استيفاء الشروط التالية:

  • الاستقلال : القيم المرصودة مستقلة عن بعضها البعض. إحدى الطرق لضمان استقلالية الملاحظات هي إضافة العشوائية إلى عملية أخذ العينات.
  • التجانس : يجب أن يكون هناك تجانس في التباينات، أي أن تباين البقايا ثابت.
  • الطبيعية : يجب أن يتم توزيع البقايا بشكل طبيعي، أو بمعنى آخر، يجب أن تتبع التوزيع الطبيعي.
  • الاستمرارية : يجب أن يكون المتغير التابع مستمرًا.

أنواع تحليل التباين (ANOVA)

هناك ثلاثة أنواع من تحليل التباين (ANOVA) :

  • تحليل التباين أحادي الاتجاه (One-way ANOVA) : في تحليل التباين يوجد عامل واحد فقط، أي أنه يوجد متغير مستقل واحد فقط.
  • تحليل التباين ثنائي الاتجاه (Two-way ANOVA) : تحليل التباين له عاملين، لذلك يتم تحليل متغيرين مستقلين والتفاعل بينهما.
  • تحليل التباين متعدد المتغيرات (MANOVA) : في تحليل التباين يوجد أكثر من متغير تابع. الهدف هو تحديد ما إذا كانت المتغيرات المستقلة تغير قيمتها عندما تختلف المتغيرات التابعة.

مزايا وعيوب تحليل التباين (ANOVA)

وأخيرًا، سنرى متى يكون من المناسب لنا استخدام تحليل التباين، وأيضًا ما هي حدود هذا النوع من التحليل الإحصائي.

الميزة الرئيسية لتحليل التباين (ANOVA) هي أنه يسمح بمقارنة أكثر من مجموعتين في نفس الوقت. على عكس اختبار t ، حيث يمكنك فقط تحليل متوسط عينة واحدة أو عينتين، يتم استخدام تحليل التباين لتحديد ما إذا كانت المجموعات السكانية المتعددة لها نفس المتوسط أم لا.

ومع ذلك، فإن تحليل التباين لا يخبرنا بأي مجموعة دراسية لديها متوسط مختلف، فهو يتيح لنا فقط معرفة ما إذا كانت هناك وسائل مختلفة بشكل كبير أو إذا كانت جميع الوسائل متشابهة.

وبالمثل، هناك عيب آخر لتحليل التباين وهو أنه يجب تلبية أربعة افتراضات سابقة (انظر أعلاه) لإجراء تحليل ANOVA، وإلا فإن الاستنتاجات المستخلصة قد تكون خاطئة. ولذلك، يجب التحقق دائمًا من أن مجموعة البيانات الإحصائية تلبي هذه المتطلبات الأربعة.

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *