ข้อมูลที่จัดกลุ่ม
บทความนี้จะอธิบายว่าข้อมูลที่จัดกลุ่มคืออะไรและจัดกลุ่มข้อมูลอย่างไร นอกจากนี้ คุณจะพบกับแบบฝึกหัดที่แก้ไขได้ซึ่งข้อมูลจะถูกจัดกลุ่มตามช่วงเวลา
ข้อมูลที่จัดกลุ่มคืออะไร?
ในสถิติ ข้อมูลที่จัดกลุ่ม คือข้อมูลที่จัดกลุ่มตามช่วงเวลา กล่าวอีกนัยหนึ่ง ข้อมูลที่จัดกลุ่ม คือ ข้อมูลที่รวบรวมในช่วงเวลาสม่ำเสมอเพื่อให้สามารถศึกษาร่วมกันได้
ดังนั้น เมื่อจัดกลุ่มชุดข้อมูลทางสถิติ จะมีการแยกออกเป็นช่วงต่างๆ เพื่อให้ข้อมูลแต่ละชิ้นสามารถอยู่ในช่วงเดียวเท่านั้น
กล่าวโดยสรุป ในทางสถิติ การจัดกลุ่มข้อมูลช่วยให้สามารถวิเคราะห์ข้อมูลหลายรายการร่วมกันได้ ดังนั้นข้อมูลที่จัดกลุ่มภายในช่วงเวลาจะถือเป็นข้อมูลชิ้นเดียว นอกจากนี้ การรวมข้อมูลยังมีประโยชน์มากเมื่อตัวอย่างมีขนาดใหญ่มาก
ตัวอย่างข้อมูลที่จัดกลุ่ม
เมื่อดูคำจำกัดความของข้อมูลที่จัดกลุ่ม ด้านล่างนี้คือตัวอย่างที่ชัดเจนของวิธีการจัดกลุ่มชุดข้อมูลตามช่วงเวลาที่ต่างกัน
- วัดขนาดของกลุ่มตัวอย่าง 50 คน และค่าทั้งหมดถูกบันทึกไว้ในตารางข้อมูลต่อไปนี้ จัดกลุ่มชุดข้อมูลออกเป็นช่วงๆ แล้วสร้างกราฟข้อมูล

ขั้นแรก เราต้องแยกข้อมูลออกเป็นระยะๆ มีหลายวิธีในการทำเช่นนี้ แต่กฎของ Sturges เป็นวิธีที่ใช้กันมากที่สุด เนื่องจากจะช่วยให้คุณสามารถคำนวณจำนวนช่วงเวลาในอุดมคติได้:
ดังนั้นเราจึงต้องแยกข้อมูลออกเป็นเจ็ดช่วงที่แตกต่างกัน ตอนนี้เราจำเป็นต้องรู้ความกว้างที่แต่ละช่วงต้องมี เมื่อต้องการทำเช่นนี้ เพียงหารค่าสูงสุดลบค่าต่ำสุดด้วยจำนวนช่วงเวลาทั้งหมด:
กล่าวโดยสรุป จะต้องมี 7 ช่วงของแอมพลิจูด 9 ดังนั้นช่วงเวลาที่คำนวณตามกฎของ Sturges จะเป็นดังนี้:
และเมื่อเราคำนวณช่วงเวลาแล้ว เราจะนับจำนวนครั้งที่ข้อมูลหนึ่งปรากฏในแต่ละช่วงเวลา และสร้างตารางด้วยข้อมูลที่จัดกลุ่ม:

โปรดทราบว่าสามารถคำนวณประเภทความถี่ได้มากขึ้นจากข้อมูลที่จัดกลุ่ม (ความถี่สัมพัทธ์ ความถี่สะสม ฯลฯ) หากต้องการดูวิธีสร้างตารางความถี่ที่สมบูรณ์ด้วยข้อมูลที่จัดกลุ่ม คลิกที่นี่:
สุดท้าย จากตารางที่มีความถี่ของแต่ละช่วงเวลา เราสามารถสร้างกราฟข้อมูลที่จัดกลุ่มเป็นฮิสโตแกรมได้

ข้อมูลที่จัดกลุ่มและไม่ได้จัดกลุ่ม
ข้อมูลที่ไม่ได้จัดกลุ่ม คือข้อมูลที่ไม่ได้แยกออกเป็นช่วงๆ แต่แต่ละค่าจะได้รับการศึกษาแยกกัน
ตามตัวอย่างข้างต้น หากเราไม่ได้จัดกลุ่มข้อมูล เราจะต้องค้นหาความถี่ของแต่ละค่า นั่นคือเราควรคำนวณว่ามีค่า 158, 165, 174 กี่ครั้ง เป็นต้น ซ้ำแล้วซ้ำเล่า อย่างไรก็ตาม ในกรณีนี้ ควรจัดกลุ่มข้อมูลตามช่วงเวลาจะดีกว่าเนื่องจากเรามีข้อมูลจำนวนมาก และยิ่งไปกว่านั้น ค่าหลายค่าก็คล้ายกัน
ดังนั้น ในระหว่างการศึกษาทางสถิติ ก่อนที่จะดำเนินการคำนวณ สิ่งสำคัญคือต้องตัดสินใจว่าควรจัดกลุ่มข้อมูลตามช่วงเวลาหรือไม่ เนื่องจากจะเป็นเงื่อนไขส่วนที่เหลือของการสอบสวน
เมื่อใดจึงควรรวบรวมข้อมูล?
โดยทั่วไป ข้อมูลควรถูกจัดกลุ่มเป็นช่วงๆ เมื่อตัวแปรมีความต่อเนื่อง หากตัวแปรมีความต่อเนื่อง โดยปกติแล้วเราจะมีค่าหลายค่าและมีค่าอยู่ใกล้กันมากจึงสามารถจัดกลุ่มเป็นช่วงเพื่อให้การศึกษาง่ายขึ้น
ตามหลักตรรกะแล้ว แม้ว่าตัวแปรจะไม่ต่อเนื่องกัน แต่หากเรามีข้อมูลจำนวนมาก ก็สามารถจัดกลุ่มเป็นช่วงๆ ได้ ทำให้การวิเคราะห์ทางสถิติง่ายขึ้น แต่โดยทั่วไปเกณฑ์ในการจัดกลุ่มข้อมูลจะเป็นประเภทของตัวแปร หากตัวแปรมีความต่อเนื่อง โดยทั่วไปข้อมูลจะถูกแยกออกเป็นช่วงๆ