ข้อมูลที่จัดกลุ่ม

บทความนี้จะอธิบายว่าข้อมูลที่จัดกลุ่มคืออะไรและจัดกลุ่มข้อมูลอย่างไร นอกจากนี้ คุณจะพบกับแบบฝึกหัดที่แก้ไขได้ซึ่งข้อมูลจะถูกจัดกลุ่มตามช่วงเวลา

ข้อมูลที่จัดกลุ่มคืออะไร?

ในสถิติ ข้อมูลที่จัดกลุ่ม คือข้อมูลที่จัดกลุ่มตามช่วงเวลา กล่าวอีกนัยหนึ่ง ข้อมูลที่จัดกลุ่ม คือ ข้อมูลที่รวบรวมในช่วงเวลาสม่ำเสมอเพื่อให้สามารถศึกษาร่วมกันได้

ดังนั้น เมื่อจัดกลุ่มชุดข้อมูลทางสถิติ จะมีการแยกออกเป็นช่วงต่างๆ เพื่อให้ข้อมูลแต่ละชิ้นสามารถอยู่ในช่วงเดียวเท่านั้น

กล่าวโดยสรุป ในทางสถิติ การจัดกลุ่มข้อมูลช่วยให้สามารถวิเคราะห์ข้อมูลหลายรายการร่วมกันได้ ดังนั้นข้อมูลที่จัดกลุ่มภายในช่วงเวลาจะถือเป็นข้อมูลชิ้นเดียว นอกจากนี้ การรวมข้อมูลยังมีประโยชน์มากเมื่อตัวอย่างมีขนาดใหญ่มาก

ตัวอย่างข้อมูลที่จัดกลุ่ม

เมื่อดูคำจำกัดความของข้อมูลที่จัดกลุ่ม ด้านล่างนี้คือตัวอย่างที่ชัดเจนของวิธีการจัดกลุ่มชุดข้อมูลตามช่วงเวลาที่ต่างกัน

  • วัดขนาดของกลุ่มตัวอย่าง 50 คน และค่าทั้งหมดถูกบันทึกไว้ในตารางข้อมูลต่อไปนี้ จัดกลุ่มชุดข้อมูลออกเป็นช่วงๆ แล้วสร้างกราฟข้อมูล

ขั้นแรก เราต้องแยกข้อมูลออกเป็นระยะๆ มีหลายวิธีในการทำเช่นนี้ แต่กฎของ Sturges เป็นวิธีที่ใช้กันมากที่สุด เนื่องจากจะช่วยให้คุณสามารถคำนวณจำนวนช่วงเวลาในอุดมคติได้:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(50)\\[2ex]c=1+5,64\\[2ex]c=6,64\\[2ex]c\approx 7\end{array}

ดังนั้นเราจึงต้องแยกข้อมูลออกเป็นเจ็ดช่วงที่แตกต่างกัน ตอนนี้เราจำเป็นต้องรู้ความกว้างที่แต่ละช่วงต้องมี เมื่อต้องการทำเช่นนี้ เพียงหารค่าสูงสุดลบค่าต่ำสุดด้วยจำนวนช่วงเวลาทั้งหมด:

a=\cfrac{\text{valor m\'aximo}-\text{valor m\'inimo}}{c}=\cfrac{205-145}{7}=8,57\approx 9

กล่าวโดยสรุป จะต้องมี 7 ช่วงของแอมพลิจูด 9 ดังนั้นช่วงเวลาที่คำนวณตามกฎของ Sturges จะเป็นดังนี้:

[145,154)

[154,163)

[163,172)

[172,181)

[181,190)

[190,199)

[199,208)

และเมื่อเราคำนวณช่วงเวลาแล้ว เราจะนับจำนวนครั้งที่ข้อมูลหนึ่งปรากฏในแต่ละช่วงเวลา และสร้างตารางด้วยข้อมูลที่จัดกลุ่ม:

โปรดทราบว่าสามารถคำนวณประเภทความถี่ได้มากขึ้นจากข้อมูลที่จัดกลุ่ม (ความถี่สัมพัทธ์ ความถี่สะสม ฯลฯ) หากต้องการดูวิธีสร้างตารางความถี่ที่สมบูรณ์ด้วยข้อมูลที่จัดกลุ่ม คลิกที่นี่:

สุดท้าย จากตารางที่มีความถี่ของแต่ละช่วงเวลา เราสามารถสร้างกราฟข้อมูลที่จัดกลุ่มเป็นฮิสโตแกรมได้

ฮิสโตแกรมกฎของสเตอร์จส์ สถิติ

ข้อมูลที่จัดกลุ่มและไม่ได้จัดกลุ่ม

ข้อมูลที่ไม่ได้จัดกลุ่ม คือข้อมูลที่ไม่ได้แยกออกเป็นช่วงๆ แต่แต่ละค่าจะได้รับการศึกษาแยกกัน

ตามตัวอย่างข้างต้น หากเราไม่ได้จัดกลุ่มข้อมูล เราจะต้องค้นหาความถี่ของแต่ละค่า นั่นคือเราควรคำนวณว่ามีค่า 158, 165, 174 กี่ครั้ง เป็นต้น ซ้ำแล้วซ้ำเล่า อย่างไรก็ตาม ในกรณีนี้ ควรจัดกลุ่มข้อมูลตามช่วงเวลาจะดีกว่าเนื่องจากเรามีข้อมูลจำนวนมาก และยิ่งไปกว่านั้น ค่าหลายค่าก็คล้ายกัน

ดังนั้น ในระหว่างการศึกษาทางสถิติ ก่อนที่จะดำเนินการคำนวณ สิ่งสำคัญคือต้องตัดสินใจว่าควรจัดกลุ่มข้อมูลตามช่วงเวลาหรือไม่ เนื่องจากจะเป็นเงื่อนไขส่วนที่เหลือของการสอบสวน

เมื่อใดจึงควรรวบรวมข้อมูล?

โดยทั่วไป ข้อมูลควรถูกจัดกลุ่มเป็นช่วงๆ เมื่อตัวแปรมีความต่อเนื่อง หากตัวแปรมีความต่อเนื่อง โดยปกติแล้วเราจะมีค่าหลายค่าและมีค่าอยู่ใกล้กันมากจึงสามารถจัดกลุ่มเป็นช่วงเพื่อให้การศึกษาง่ายขึ้น

ตามหลักตรรกะแล้ว แม้ว่าตัวแปรจะไม่ต่อเนื่องกัน แต่หากเรามีข้อมูลจำนวนมาก ก็สามารถจัดกลุ่มเป็นช่วงๆ ได้ ทำให้การวิเคราะห์ทางสถิติง่ายขึ้น แต่โดยทั่วไปเกณฑ์ในการจัดกลุ่มข้อมูลจะเป็นประเภทของตัวแปร หากตัวแปรมีความต่อเนื่อง โดยทั่วไปข้อมูลจะถูกแยกออกเป็นช่วงๆ

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *