البيانات الطويلة أو الواسعة: ما الفرق؟


يمكن كتابة مجموعة البيانات بتنسيقين مختلفين: واسع وطويل .

يحتوي التنسيق الواسع على قيم غير مكررة في العمود الأول.

يحتوي التنسيق الطويل على قيم تتكرر في العمود الأول.

على سبيل المثال، ضع في اعتبارك مجموعتي البيانات التاليتين اللتين تحتويان على نفس البيانات تمامًا معبرًا عنها بتنسيقات مختلفة:

تنسيق بيانات واسع أو طويل

لاحظ أنه في مجموعة البيانات الموسعة ، تكون كل قيمة في العمود الأول فريدة من نوعها.

في المقابل، في مجموعة البيانات الطويلة ، تتكرر القيم الموجودة في العمود الأول.

تحتوي كلتا مجموعتي البيانات على نفس معلومات الفريق، ولكن يتم التعبير عنها ببساطة بتنسيقات مختلفة.

متى تستخدم البيانات الواسعة أو الطويلة

اعتمادًا على ما تريد فعله ببياناتك، قد يكون من المنطقي تقديمها بتنسيق واسع أو طويل.

متى تستخدم التنسيق الكبير

كقاعدة عامة، إذا كنت تقوم بتحليل البيانات، فسوف تستخدم عادة تنسيق بيانات واسع .

على سبيل المثال، إذا كنت تريد معرفة متوسط النقاط والتمريرات الحاسمة والمرتدات التي سجلها الفريق، فغالبًا ما يكون من الأسهل الحصول على البيانات بتنسيق كبير:

سيتم أيضًا حفظ معظم مجموعات البيانات التي تواجهها في العالم الحقيقي بتنسيق واسع لأنه يسهل على أدمغتنا تفسيرها.

على سبيل المثال، في الشكل أعلاه، من السهل قراءة قيم النقاط والتمريرات الحاسمة والمرتدات لكل فريق على نفس الخط.

متى تستخدم التنسيق الطويل

عادةً، إذا كنت تعرض متغيرات متعددة في مخطط باستخدام برنامج إحصائي مثل R ، فستحتاج عادةً إلى تحويل بياناتك إلى تنسيق طويل حتى يتمكن البرنامج من إنشاء المخطط.

للحصول على أمثلة من العالم الحقيقي، راجع دروس R التعليمية هذه حيث يجب أن تكون البيانات بتنسيق طويل لإنشاء أنواع معينة من المخططات:

في بعض الأحيان قد تحتاج إلى إعادة تشكيل بياناتك بتنسيق مختلف إذا كنت تستخدم Python أيضًا.

تشرح البرامج التعليمية التالية كيفية إعادة تشكيل إطارات البيانات في بايثون:

مصادر إضافية

توفر البرامج التعليمية التالية معلومات حول المصطلحات الإحصائية الأخرى شائعة الاستخدام:

ما هي الملاحظة في الإحصاء؟
ما هو المتغير في الإحصاء؟
ما هي البقايا في الإحصاء؟

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *