كيفية إجراء manova في r
لفهم مانوفا، من المفيد أولاً أن نفهم أنوفا.
يتم استخدام تحليل التباين ( ANOVA ) لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات ثلاث مجموعات مستقلة أو أكثر أم لا.
على سبيل المثال، لنفترض أننا نريد معرفة ما إذا كان أسلوب الدراسة له تأثير على درجات الامتحان لفصل من الطلاب أم لا. قمنا بتقسيم الفصل إلى ثلاث مجموعات بشكل عشوائي. تستخدم كل مجموعة أسلوب دراسة مختلفًا لمدة شهر للتحضير للامتحان. وفي نهاية الشهر، يؤدي جميع الطلاب نفس الاختبار.
لمعرفة ما إذا كان أسلوب الدراسة له تأثير على درجات الامتحانات، يمكننا إجراء تحليل التباين (ANOVA) أحادي الاتجاه، والذي سيخبرنا ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسط درجات المجموعات الثلاث.
في ANOVA لدينا متغير الاستجابة. ومع ذلك، في MANOVA (تحليل التباين متعدد المتغيرات)، لدينا متغيرات استجابة متعددة.
على سبيل المثال، لنفترض أننا نريد أن نعرف ما هو تأثير مستوى التعليم (أي المدرسة الثانوية، ودرجة الزمالة، ودرجة البكالوريوس، ودرجة الماجستير، وما إلى ذلك) على كل من الدخل السنوي ومبلغ ديون الطلاب. في هذه الحالة، لدينا عامل واحد (مستوى التعليم) ومتغيرين للاستجابة (الدخل السنوي وديون الطلاب)، حتى نتمكن من إجراء تحليل MANOVA أحادي الاتجاه.
ذات صلة: فهم الاختلافات بين ANOVA وANCOVA وMANOVA وMANCOVA
كيفية إجراء MANOVA في R
في المثال التالي، سنوضح كيفية إجراء تحليل MANOVA أحادي الاتجاه في R باستخدام مجموعة بيانات القزحية المضمنة، والتي تحتوي على معلومات حول طول وعرض قياسات الزهور المختلفة لثلاثة أنواع مختلفة (“setosa”، “virginica” ، “المتعددة الألوان”):
#view first six rows of iris dataset
head(iris)
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa
لنفترض أننا نريد أن نعرف ما إذا كان للأنواع تأثير على طول الكأس وعرضه. باستخدام الأنواع كمتغير مستقل، وطول وعرض الكأس كمتغيرات الاستجابة، يمكننا إجراء MANOVA أحادي الاتجاه باستخدام الدالة manova() في R.
تستخدم الدالة manova() الصيغة التالية:
مانوفا (cbind (rv1، rv2، …) ~ iv، البيانات)
ذهب:
- rv1، rv2 : متغير الاستجابة 1، متغير الاستجابة 2، إلخ.
- الرابع : المتغير المستقل
- البيانات : اسم إطار البيانات
في مثالنا مع مجموعة بيانات القزحية، يمكننا ملاءمة MANOVA وعرض النتائج باستخدام الصيغة التالية:
#fit the MANOVA model model <- manova(cbind(Sepal.Length, Sepal.Width) ~ Species, data = iris) #view the results summary(model) # Df Pillai approx F num Df den Df Pr(>F) #Species 2 0.94531 65.878 4,294 < 2.2e-16 *** #Residuals 147 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
من النتيجة، يمكننا أن نرى أن إحصائية F هي 65.878 والقيمة p المقابلة صغيرة للغاية. يشير هذا إلى وجود فروق ذات دلالة إحصائية في قياسات الكأس اعتمادًا على النوع.
ملاحظة فنية: بشكل افتراضي، يستخدم manova() إحصائية اختبار Pillai . وبما أن توزيع إحصائية الاختبار هذه معقد، يتم أيضًا توفير قيمة F تقريبية لتسهيل التفسير.
بالإضافة إلى ذلك، من الممكن تحديد “Roy” أو “Hotelling-Lawley” أو “Wilks” كإحصائية اختبار لاستخدامها باستخدام الصيغة التالية: Summary(model, test = ‘Wilks’)
لمعرفة كيفية تأثر طول وعرض الكأس بالأنواع ، يمكننا إجراء تحليل ANOVA أحادي المتغير باستخدام Summary.aov() كما هو موضح في الكود التالي:
summary.aov(model) # Response Sepal.Length: # Df Sum Sq Mean Sq F value Pr(>F) #Species 2 63.212 31.606 119.26 < 2.2e-16 *** #Residuals 147 38.956 0.265 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 # Response Sepal.Width: # Df Sum Sq Mean Sq F value Pr(>F) #Species 2 11.345 5.6725 49.16 < 2.2e-16 *** #Residuals 147 16.962 0.1154 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
يمكننا أن نرى من النتيجة أن القيم p لكلا ANOVAs أحادي المتغير منخفضة للغاية (<2.2e-16)، مما يشير إلى أن الأنواع لها تأثير ذو دلالة إحصائية على عرض الكأس وطوله.
تصور موارد المجموعة
قد يكون من المفيد أيضًا تصور وسائل المجموعة لكل مستوى من أنواعنا المتغيرة المستقلة لفهم نتائجنا بشكل أفضل.
على سبيل المثال، يمكننا استخدام مكتبة gplots والدالة plotmeans() لتصور متوسط طول الكأسية حسب الأنواع :
#load gplots library library(gplots) #visualize mean sepal length by species plotmeans(iris$Sepal.Length ~ iris$Species)
من الرسم البياني يمكننا أن نرى أن متوسط طول الكأس يختلف بشكل كبير بين الأنواع. وهذا يطابق نتائج اختبار MANOVA، الذي أخبرنا بوجود فرق ذو دلالة إحصائية في قياسات الكأس عبر الأنواع.
يمكننا أيضًا تصور متوسط عرض الكأسية حسب الأنواع :
plotmeans(iris$Sepal.Width ~ iris$Species)
راجع الوثائق الكاملة لوظيفة manova() هنا .