ข้อมูลยาวหรือกว้าง: อะไรคือความแตกต่าง?


ชุดข้อมูลสามารถเขียนได้สองรูปแบบ: กว้าง และ ยาว

รูปแบบ กว้าง ประกอบด้วยค่าที่ ไม่ ซ้ำในคอลัมน์แรก

รูปแบบ ยาว ประกอบด้วยค่าที่ ซ้ำกัน ในคอลัมน์แรก

ตัวอย่างเช่น พิจารณาชุดข้อมูลสองชุดต่อไปนี้ซึ่งมีข้อมูลเดียวกันทุกประการซึ่งแสดงในรูปแบบที่แตกต่างกัน:

รูปแบบข้อมูลกว้างหรือยาว

โปรดทราบว่าในชุดข้อมูล ที่ขยาย แต่ละค่าในคอลัมน์แรกจะไม่ซ้ำกัน

ในทางตรงกันข้าม ในชุดข้อมูล แบบยาว ค่าในคอลัมน์แรกจะเกิดซ้ำ

ชุดข้อมูลทั้งสองชุดมีข้อมูลทีมเหมือนกันทุกประการ แต่จะแสดงในรูปแบบที่ต่างกัน

เมื่อใดควรใช้ข้อมูลที่กว้างหรือยาว

ขึ้นอยู่กับสิ่งที่คุณต้องการดำเนินการกับข้อมูลของคุณ การนำเสนอในรูปแบบกว้างหรือยาวอาจเหมาะสมกว่า

เมื่อใดควรใช้รูปแบบขนาดใหญ่

ตามกฎทั่วไป หากคุณกำลังวิเคราะห์ข้อมูล คุณจะใช้รูปแบบข้อมูล แบบกว้าง

ตัวอย่างเช่น หากคุณต้องการทราบคะแนนเฉลี่ย แอสซิสต์ และรีบาวด์ที่ทีมทำได้ มักจะง่ายกว่าที่จะมีข้อมูลในรูปแบบขนาดใหญ่:

ชุดข้อมูลส่วนใหญ่ที่คุณพบในโลกแห่งความเป็นจริงจะถูกบันทึกในรูปแบบกว้างด้วยเนื่องจากสมองของเราจะตีความได้ง่ายกว่า

เช่นในรูปแบบด้านบนจะอ่านค่าแต้ม แอสซิสต์ และรีบาวด์ของแต่ละทีมในบรรทัดเดียวกันได้ง่าย

เมื่อใดควรใช้รูปแบบยาว

โดยทั่วไป หากคุณกำลังดูตัวแปรหลายตัวในพล็อตโดยใช้ซอฟต์แวร์ทางสถิติ เช่น R คุณมักจะต้องแปลงข้อมูลของคุณเป็นรูป แบบยาว เพื่อให้ซอฟต์แวร์สามารถสร้างพล็อตได้

สำหรับตัวอย่างในโลกแห่งความเป็นจริง โปรดดูบทช่วยสอน R เหล่านี้ ซึ่งข้อมูลจะต้องอยู่ในรูปแบบ ยาว เพื่อสร้างพล็อตบางประเภท:

บางครั้งคุณอาจต้องปรับรูปร่างข้อมูลของคุณเป็นรูปแบบอื่นหากคุณใช้ Python เช่นกัน

บทช่วยสอนต่อไปนี้จะอธิบายวิธีเปลี่ยนรูปร่างกรอบข้อมูลใน Python:

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเกี่ยวกับคำศัพท์ทางสถิติอื่นๆ ที่ใช้กันทั่วไป:

การสังเกตในสถิติคืออะไร?
โควาเรียตในสถิติคืออะไร?
สารตกค้างในสถิติคืออะไร?

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *