الإحصائي مقابل عالم البيانات: ما الفرق؟
يعمل كل من الإحصائيين وعلماء البيانات كثيرًا على البيانات، ولكن هناك بعض الاختلافات الرئيسية بين المهنتين:
الفرق رقم 1 (أنواع البيانات) – يميل علماء البيانات إلى قضاء المزيد من الوقت في جمع البيانات غير الكاملة وتنظيفها، بينما يمتلك الإحصائيون عمومًا بيانات مرتبة.
الفرق رقم 2 (الأهداف النهائية) – يميل علماء البيانات إلى التركيز على إنشاء نماذج تتنبأ بالنتائج، بينما يميل الإحصائيون إلى التركيز على إنشاء نماذج تصف بدقة العلاقة بين المتغيرات.
الفرق رقم 3 (الإنتاج) – يميل علماء البيانات إلى بناء نماذج يتم وضعها في الإنتاج في الشركات، بينما يميل الإحصائيون إلى بناء نماذج يمكنها تقديم رؤى أو تفسيرات حول هذه الظاهرة.
استمر في القراءة للحصول على شرح مفصل لهذه الاختلافات.
الفرق رقم 1: أنواع البيانات
بشكل عام، غالبًا ما يعمل علماء البيانات مع بيانات أكثر تعقيدًا، وأصعب في استخلاصها، وأكبر بكثير من نوع البيانات التي يستخدمها الإحصائيون.
على سبيل المثال، قد يحتاج عالم البيانات الذي يعمل في شركة عقارية إلى استخراج مجموعات البيانات التي تحتوي على ملايين الصفوف من عدة خوادم خارجية مختلفة، وكلها بتنسيقات مختلفة.
ستحتاج إلى معرفة واسعة بـ SQL ولغة برمجة واحدة على الأقل (مثل R أو Python ) من أجل استخراج البيانات وتجميعها في تنسيق مناسب للنمذجة.
وفي المقابل، يميل الإحصائيون إلى العمل مع مجموعات بيانات أصغر، مقدمة بالفعل في شكل أنيق.
على سبيل المثال، قد يتلقى الإحصائي الذي يعمل في شركة طبية حيوية ملف Excel مكون من 50 سطرًا يحتوي على معلومات حول ضغط الدم ومعدل ضربات القلب ومستويات الكوليسترول في الدم لـ 50 مريضًا مختلفًا.
وبدلاً من قضاء وقتهم في استخراج البيانات وتنظيفها، فمن المرجح أن يقضوا المزيد من الوقت في اتخاذ قرار بشأناختبار أو نموذج فرضية مناسب ليتناسب مع البيانات والتحقق من احترام افتراضات الاختبار أو النموذج الإحصائي المختار.
الفرق رقم 2: الأهداف النهائية
في كثير من الحالات، يكون الهدف النهائي لعالم البيانات هو إنشاء نوع من النماذج التي يمكنها التنبؤ بدقة بنتائج معينة.
على سبيل المثال، قد يحاول عالم البيانات الذي يعمل في شركة مالية إنشاء نموذج انحدار لوجستي يمكنه التنبؤ بدقة بما إذا كان بعض الأشخاص سيتخلفون عن سداد القرض.
سوف يناسبون مجموعة متنوعة من النماذج باستخدام مجموعات مختلفة من متغيرات التوقع ويحاولون العثور على النموذج الذي ينتج التنبؤات الأكثر دقة.
هدفهم النهائي هو إنشاء نموذج دقيق بدلاً من التحديد الكمي الدقيق لكيفية ارتباط كل متغير متنبئ بمتغير الاستجابة .
في المقابل، يميل الإحصائيون إلى التركيز أكثر على إنشاء نماذج يمكنها أن تصف بدقة العلاقة بين متغيرات التوقع ومتغير الاستجابة.
على سبيل المثال، قد يقوم إحصائي يعمل في إحدى الجامعات بتجنيد 30 طالبًا للمشاركة في دراسة تحدد بدقة مدى تأثير عادات الدراسة المختلفة على درجات الامتحانات.
في هذا السيناريو، سيكون الإحصائي مهتمًا أكثر بتفسير معاملات نموذج الانحدار وتحليل القيم الاحتمالية المقابلة لها لفهم ما إذا كان لديهم علاقة ذات دلالة إحصائية مع متغير الاستجابة.
الفرق رقم 3: الإنتاج
بشكل عام، يميل علماء البيانات إلى إنشاء نماذج إحصائية يتم وضعها في الإنتاج في الشركات في كثير من الأحيان أكثر من الإحصائيين.
على سبيل المثال، يمكن لعالم البيانات الذي يعمل في سلسلة بقالة كبيرة إنشاء نموذج يمكنه التنبؤ بدقة بمبيعات المنتجات المختلفة.
سيكون هدفه النهائي هو العمل مع المطورين في الشركة الذين يمكنهم مساعدته في وضع نموذجه في خادم يعمل كل ليلة ويمكنه التنبؤ بمبيعات المنتجات لكل يوم جديد.
ومن ناحية أخرى، نادرا ما يقوم الإحصائيون بإنشاء نماذج مدمجة في نوع من الإنتاج.
على سبيل المثال، قد يقوم إحصائي يعمل في إحدى شركات الرعاية الصحية ببناء نموذج يصف العلاقة بين عوامل نمط الحياة المختلفة (التدخين، ممارسة الرياضة، النظام الغذائي، وما إلى ذلك)، ولكن هدفهم النهائي هو ببساطة تحديد العلاقة بين هذه العوامل ومتغير الاستجابة . مثل عمر.
هدفهم النهائي هو إنشاء نموذج يزودهم بالمعلومات بدلاً من نموذج يتم وضعه في بيئة الإنتاج.
خاتمة
يعمل كل من الإحصائيين وعلماء البيانات مع البيانات في أدوارهم اليومية، لكنهم يفعلون ذلك بطرق مختلفة.
يميل علماء البيانات إلى العمل مع مجموعة واسعة من البيانات التي غالبًا ما تكون فوضوية وتحتاج إلى معالجة، بينما يعمل الإحصائيون غالبًا مع مجموعات بيانات أصغر وأكثر ترتيبًا.
يميل علماء البيانات أيضًا إلى التركيز بشكل أكبر على بناء النماذج التي يمكنها التنبؤ بالنتائج بدقة، بينما يميل الإحصائيون إلى بناء نماذج يمكنها شرح العلاقة بين المتغيرات بدقة.
وأخيرا، يميل علماء البيانات إلى وضع النماذج في الإنتاج في الشركات، في حين أن الإحصائيين غالبا ما يلخصون نتائجهم ويبلغون عنها لتوفير نظرة ثاقبة لظواهر العالم الحقيقي.
مصادر إضافية
وتوضح المقالات التالية أهمية الإحصاء في مختلف المجالات:
لماذا تعتبر الإحصائيات مهمة؟ (10 أسباب تجعل الإحصائيات مهمة!)
أهمية الإحصاء في الأعمال
أهمية الإحصاء في التعليم
أهمية الإحصاء في الرعاية الصحية
أهمية الإحصاء في مجال التمويل