การสุ่มตัวอย่างแบบมีการเปลี่ยนหรือไม่มีการเปลี่ยน
บ่อยครั้งในสถิติเราต้องการรวบรวมข้อมูลเพื่อที่เราจะได้ตอบคำถามการวิจัยบางข้อได้
ตัวอย่างเช่น เราอาจต้องการตอบคำถามต่อไปนี้:
1. รายได้เฉลี่ยของครัวเรือนในเมืองซินซินนาติ รัฐโอไฮโอคือเท่าไร
2. น้ำหนักเฉลี่ยของเต่าบางกลุ่มคือเท่าใด?
3. เปอร์เซ็นต์ของผู้อยู่อาศัยในบางเคาน์ตีสนับสนุนกฎหมายบางอย่าง?
ในแต่ละสถานการณ์ เราต้องการตอบคำถามเกี่ยวกับ ประชากร ซึ่งแสดงถึงองค์ประกอบแต่ละรายการที่เป็นไปได้ทั้งหมดที่เราต้องการวัด
อย่างไรก็ตาม แทนที่จะรวบรวมข้อมูลของบุคคลทุกคนในกลุ่มประชากร โดยทั่วไปเราจะเก็บรวบรวมเฉพาะข้อมูลในกลุ่มตัวอย่างประชากรซึ่งแสดงถึงส่วนหนึ่งของประชากรเท่านั้น
การเก็บตัวอย่างมีสองวิธีที่แตกต่างกัน: การสุ่มตัวอย่างโดยมีการเปลี่ยน และ การสุ่มตัวอย่างโดยไม่ต้องเปลี่ยน
บทช่วยสอนนี้จะอธิบายความแตกต่างระหว่างสองวิธีพร้อมตัวอย่างวิธีใช้งานแต่ละวิธีในทางปฏิบัติ
การสุ่มตัวอย่างด้วยการเปลี่ยน
สมมติว่าเรามีชื่อนักเรียน 5 คนในหมวก:
- แอนดี้
- คาร์ล
- ไทเลอร์
- เบคก้า
- เจสสิก้า
สมมติว่าเราต้องการสุ่มตัวอย่างนักเรียน 2 คนมาทดแทน
ในภาพวาดแรก เราอาจเลือกชื่อไทเลอร์ จากนั้นเราจะใส่ชื่อของเขากลับเข้าไปในหมวกแล้ววาดอีกครั้ง ในรูปที่สอง เราอาจเลือกชื่อไทเลอร์อีกครั้ง ตัวอย่างของเราก็คือ: {Tyler, Tyler}
นี่คือตัวอย่างการรับตัวอย่างพร้อมการเปลี่ยนเนื่องจากเราจะเปลี่ยนชื่อที่เราเลือกหลังจากแต่ละรูปวาด
เมื่อเราสุ่มตัวอย่างด้วยการแทนที่ องค์ประกอบตัวอย่างจะเป็น อิสระ เนื่องจากผลลัพธ์ของการโยนเหรียญหนึ่งครั้งไม่ได้รับผลกระทบจากการโยนเหรียญครั้งก่อน
ตัวอย่างเช่น ความน่าจะเป็นในการเลือกชื่อไทเลอร์คือ 1/5 ในการวาดครั้งแรก และอีก 1/5 ในการวาดครั้งที่สอง ผลลัพธ์ของการจับรางวัลครั้งแรกไม่ส่งผลต่อความน่าจะเป็นของผลลัพธ์ของการจับรางวัลครั้งที่สอง
การสุ่มตัวอย่างที่มีการแทนที่จะใช้ในสถานการณ์ต่างๆ มากมายในด้านสถิติและการเรียนรู้ของเครื่อง รวมถึง:
- การรองพื้น
- การบรรจุถุง
- ข้อมูลเบื้องต้นง่ายๆ ในการส่งเสริมการเรียนรู้ของเครื่อง
- บทนำง่ายๆ เกี่ยวกับป่าสุ่ม
ในแต่ละวิธีการเหล่านี้ มีการใช้การสุ่มตัวอย่างพร้อมการทดแทน เนื่องจากช่วยให้เราสามารถใช้ชุดข้อมูลเดียวกันได้หลายครั้งเพื่อสร้างแบบจำลอง แทนที่จะรวบรวมข้อมูลใหม่ ซึ่งอาจใช้เวลานานและมีราคาแพง
การสุ่มตัวอย่างโดยไม่มีการเปลี่ยน
อีกครั้ง สมมติว่าเรามีชื่อนักเรียน 5 คนอยู่ในหมวก:
- แอนดี้
- คาร์ล
- ไทเลอร์
- เบคก้า
- เจสสิก้า
สมมติว่าเราต้องการเก็บตัวอย่างนักเรียน 2 คนโดยไม่มีการเปลี่ยน
ในภาพวาดแรก เราอาจเลือกชื่อไทเลอร์ เราก็จะทิ้งชื่อของเขาไว้ ในรูปที่สอง เราสามารถเลือกชื่อแอนดี้ได้ ตัวอย่างของเราคือ: {Tyler, Andy}
นี่คือตัวอย่างการรับตัวอย่างโดยไม่ต้องเปลี่ยนเนื่องจากเราไม่ได้เปลี่ยนชื่อที่เราเลือกหลังจากแต่ละรูปวาด
เมื่อเราสุ่มตัวอย่างโดยไม่มีการเปลี่ยน องค์ประกอบตัวอย่างจะ ขึ้นอยู่ กับผลลัพธ์ของการโยนเหรียญหนึ่งครั้งจะได้รับผลกระทบจากการโยนเหรียญครั้งก่อน
เช่น ความน่าจะเป็นในการเลือกชื่อไทเลอร์คือ 1/5 ในรูปแรก และความน่าจะเป็นในการเลือกชื่อแอนดี้คือ 1/4 ในรูปที่สอง ผลลัพธ์ของการจับรางวัลครั้งแรกส่งผลต่อความน่าจะเป็นของผลลัพธ์ของการจับรางวัลครั้งที่สอง
การสุ่มตัวอย่างโดยไม่มีการทดแทนเป็นวิธีที่เราใช้เมื่อเราต้องการเลือก ตัวอย่างแบบสุ่ม จากประชากร
ตัวอย่างเช่น หากเราต้องการประมาณรายได้เฉลี่ยของครัวเรือนในเมืองซินซินแนติ รัฐโอไฮโอ อาจมีครัวเรือนที่แตกต่างกันทั้งหมด 500,000 ครัวเรือน
ดังนั้น เราอาจต้องการสุ่มตัวอย่างจำนวน 2,000 ครัวเรือน แต่เราไม่ต้องการให้ข้อมูลของครัวเรือนใดๆ ปรากฏซ้ำสองครั้งในกลุ่มตัวอย่าง ดังนั้น เราจะสุ่มตัวอย่างโดยไม่มีการทดแทน
กล่าวอีกนัยหนึ่ง เมื่อเราเลือกครัวเรือนใดครัวเรือนหนึ่งที่จะรวมไว้ในกลุ่มตัวอย่างแล้ว เราไม่ต้องการมีโอกาสเลือกครัวเรือนนั้นเพื่อรวมไว้ในกลุ่มตัวอย่างอีก