ข้อมูลยาวหรือกว้าง: อะไรคือความแตกต่าง?
ชุดข้อมูลสามารถเขียนได้สองรูปแบบ: กว้าง และ ยาว
รูปแบบ กว้าง ประกอบด้วยค่าที่ ไม่ ซ้ำในคอลัมน์แรก
รูปแบบ ยาว ประกอบด้วยค่าที่ ซ้ำกัน ในคอลัมน์แรก
ตัวอย่างเช่น พิจารณาชุดข้อมูลสองชุดต่อไปนี้ซึ่งมีข้อมูลเดียวกันทุกประการซึ่งแสดงในรูปแบบที่แตกต่างกัน:

โปรดทราบว่าในชุดข้อมูล ที่ขยาย แต่ละค่าในคอลัมน์แรกจะไม่ซ้ำกัน

ในทางตรงกันข้าม ในชุดข้อมูล แบบยาว ค่าในคอลัมน์แรกจะเกิดซ้ำ

ชุดข้อมูลทั้งสองชุดมีข้อมูลทีมเหมือนกันทุกประการ แต่จะแสดงในรูปแบบที่ต่างกัน
เมื่อใดควรใช้ข้อมูลที่กว้างหรือยาว
ขึ้นอยู่กับสิ่งที่คุณต้องการดำเนินการกับข้อมูลของคุณ การนำเสนอในรูปแบบกว้างหรือยาวอาจเหมาะสมกว่า
เมื่อใดควรใช้รูปแบบขนาดใหญ่
ตามกฎทั่วไป หากคุณกำลังวิเคราะห์ข้อมูล คุณจะใช้รูปแบบข้อมูล แบบกว้าง
ตัวอย่างเช่น หากคุณต้องการทราบคะแนนเฉลี่ย แอสซิสต์ และรีบาวด์ที่ทีมทำได้ มักจะง่ายกว่าที่จะมีข้อมูลในรูปแบบขนาดใหญ่:

ชุดข้อมูลส่วนใหญ่ที่คุณพบในโลกแห่งความเป็นจริงจะถูกบันทึกในรูปแบบกว้างด้วยเนื่องจากสมองของเราจะตีความได้ง่ายกว่า
เช่นในรูปแบบด้านบนจะอ่านค่าแต้ม แอสซิสต์ และรีบาวด์ของแต่ละทีมในบรรทัดเดียวกันได้ง่าย
เมื่อใดควรใช้รูปแบบยาว
โดยทั่วไป หากคุณกำลังดูตัวแปรหลายตัวในพล็อตโดยใช้ซอฟต์แวร์ทางสถิติ เช่น R คุณมักจะต้องแปลงข้อมูลของคุณเป็นรูป แบบยาว เพื่อให้ซอฟต์แวร์สามารถสร้างพล็อตได้
สำหรับตัวอย่างในโลกแห่งความเป็นจริง โปรดดูบทช่วยสอน R เหล่านี้ ซึ่งข้อมูลจะต้องอยู่ในรูปแบบ ยาว เพื่อสร้างพล็อตบางประเภท:
บางครั้งคุณอาจต้องปรับรูปร่างข้อมูลของคุณเป็นรูปแบบอื่นหากคุณใช้ Python เช่นกัน
บทช่วยสอนต่อไปนี้จะอธิบายวิธีเปลี่ยนรูปร่างกรอบข้อมูลใน Python:
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเกี่ยวกับคำศัพท์ทางสถิติอื่นๆ ที่ใช้กันทั่วไป:
การสังเกตในสถิติคืออะไร?
โควาเรียตในสถิติคืออะไร?
สารตกค้างในสถิติคืออะไร?