كيفية إجراء الانحدار اللوجستي في ستاتا
الانحدار اللوجستي هو أسلوب نستخدمه لملاءمة نموذج الانحدار عندما يكون متغير الاستجابة ثنائيًا. فيما يلي بعض الأمثلة على استخدام الانحدار اللوجستي:
- نريد أن نعرف كيف تؤثر التمارين الرياضية والنظام الغذائي والوزن على احتمالية الإصابة بنوبة قلبية. متغير الاستجابة هو نوبة قلبية وله نتيجتان محتملتان: حدوث نوبة قلبية أو عدم حدوثها.
- نريد أن نعرف كيف يؤثر المعدل التراكمي (GPA) ودرجة ACT وعدد دورات AP التي تم تلقيها على احتمالية القبول في جامعة معينة. متغير الاستجابة هو القبول وله نتيجتان محتملتان: مقبول أو غير مقبول.
- نريد أن نعرف ما إذا كان عدد الكلمات وعنوان البريد الإلكتروني يؤثران على احتمالية كون البريد الإلكتروني بريدًا عشوائيًا. متغير الاستجابة هو بريد عشوائي وله نتيجتان محتملتان: بريد عشوائي أو ليس بريدًا عشوائيًا.
يشرح هذا البرنامج التعليمي كيفية إجراء الانحدار اللوجستي في Stata.
مثال: الانحدار اللوجستي في ستاتا
لنفترض أننا نريد أن نفهم ما إذا كان عمر الأم وعادات التدخين تؤثر على احتمالية إنجاب طفل منخفض الوزن عند الولادة.
لاستكشاف ذلك، يمكننا إجراء الانحدار اللوجستي باستخدام العمر والتدخين (نعم أو لا) كمتغيرات توضيحية وانخفاض الوزن عند الولادة (نعم أو لا) كمتغير الاستجابة. وبما أن متغير الاستجابة ثنائي – هناك نتيجتان محتملتان فقط – فيجب استخدام الانحدار اللوجستي.
أكمل الخطوات التالية في Stata لإجراء الانحدار اللوجستي باستخدام مجموعة البيانات المسماة lbw ، والتي تحتوي على بيانات عن 189 أمًا مختلفة.
الخطوة 1: تحميل البيانات.
قم بتحميل البيانات عن طريق كتابة ما يلي في مربع الأمر:
استخدم https://www.stata-press.com/data/r13/lbw
الخطوة 2: احصل على ملخص البيانات.
احصل على فهم سريع للبيانات التي تتعامل معها عن طريق كتابة ما يلي في مربع الأوامر:
كي تختصر
يمكننا أن نرى أن هناك 11 متغيرًا مختلفًا في مجموعة البيانات، ولكن الثلاثة الوحيدة التي نهتم بها هي:
- منخفض – ما إذا كان وزن الطفل منخفضًا عند الولادة أم لا. 1 = نعم، 0 = لا.
- العمر – عمر الأم.
- الدخان – سواء كانت الأم تدخن أثناء الحمل أم لا. 1 = نعم، 0 = لا.
الخطوة 3: تنفيذ الانحدار اللوجستي.
اكتب ما يلي في مربع الأمر لإجراء انحدار لوجستي باستخدام العمر والدخان كمتغيرين توضيحيين ومنخفض كمتغير الاستجابة.
سجل الدخان منخفض العمر
إليك كيفية تفسير الأرقام الأكثر إثارة للاهتمام في النتيجة:
الرقم (العمر): -.0497792. الحفاظ على ثبات الدخان ، يرتبط كل عام من الزيادة في العمر بـ exp(-0.0497792) = 0.951 زيادة في احتمالات انخفاض وزن الطفل عند الولادة. كون هذا الرقم أقل من 1 يعني أن الزيادة في العمر ترتبط فعليًا بانخفاض فرصة إنجاب طفل منخفض الوزن عند الولادة.
على سبيل المثال، لنفترض أن الأم أ والأم ب كلاهما يدخنان. إذا كانت الأم “أ” أكبر من الأم “ب” بسنة واحدة، فإن فرص إنجاب الأم “أ” لطفل منخفض الوزن عند الولادة تبلغ 95.1% فقط من فرص إنجاب الأم “ب” لطفل منخفض الوزن عند الولادة. الميلاد.
ف>|ض| (العمر): 0.119. هذه هي القيمة p المرتبطة بإحصائيات الاختبار للعمر . وبما أن هذه القيمة لا تقل عن 0.05، فإن العمر ليس مؤشرا ذا دلالة إحصائية لانخفاض الوزن عند الولادة.
نسبة الأرجحية (الدخان): 0.6918486. مع ثبات العمر ، فإن الأم التي تدخن أثناء الحمل لديها احتمالية أكبر لإنجاب طفل منخفض الوزن عند الولادة (.6918486) = 1.997 مقارنة بالأم التي لا تدخن أثناء الحمل.
على سبيل المثال، لنفترض أن الأم أ والأم ب يبلغان من العمر 30 عامًا. إذا كانت الأم “أ” تدخن أثناء الحمل والأم “ب” لا تدخن، فإن فرص إنجاب الأم “أ” لطفل منخفض الوزن عند الولادة تكون أعلى بنسبة 99.7% من فرص إنجاب الأم “ب” لطفل منخفض الوزن عند الولادة.
ف>|ض| (الدخان): 0.032. هذه هي القيمة p المرتبطة بإحصائيات اختبار الدخان . وبما أن هذه القيمة أقل من 0.05، فإن التدخين يعد مؤشرا ذا دلالة إحصائية لانخفاض الوزن عند الولادة.
الخطوة 4: الإبلاغ عن النتائج.
وأخيرا، نود أن نورد نتائج الانحدار اللوجستي لدينا. فيما يلي مثال لكيفية القيام بذلك:
تم إجراء الانحدار اللوجستي لتحديد ما إذا كان عمر الأم وعادات التدخين تؤثر على احتمالية إنجاب طفل منخفض الوزن عند الولادة. تم استخدام عينة مكونة من 189 أمًا في التحليل.
وأظهرت النتائج وجود علاقة ذات دلالة إحصائية بين التدخين واحتمال انخفاض الوزن عند الولادة (ض = 2.15، ع = 0.032)، بينما لا توجد علاقة ذات دلالة إحصائية بين العمر واحتمال انخفاض الوزن عند الولادة (ض = -1.56). ، ع = 0.032). 119).