การสุ่มตัวอย่างแบบมีการเปลี่ยนหรือไม่มีการเปลี่ยน


บ่อยครั้งในสถิติเราต้องการรวบรวมข้อมูลเพื่อที่เราจะได้ตอบคำถามการวิจัยบางข้อได้

ตัวอย่างเช่น เราอาจต้องการตอบคำถามต่อไปนี้:

1. รายได้เฉลี่ยของครัวเรือนในเมืองซินซินนาติ รัฐโอไฮโอคือเท่าไร

2. น้ำหนักเฉลี่ยของเต่าบางกลุ่มคือเท่าใด?

3. เปอร์เซ็นต์ของผู้อยู่อาศัยในบางเคาน์ตีสนับสนุนกฎหมายบางอย่าง?

ในแต่ละสถานการณ์ เราต้องการตอบคำถามเกี่ยวกับ ประชากร ซึ่งแสดงถึงองค์ประกอบแต่ละรายการที่เป็นไปได้ทั้งหมดที่เราต้องการวัด

อย่างไรก็ตาม แทนที่จะรวบรวมข้อมูลของบุคคลทุกคนในกลุ่มประชากร โดยทั่วไปเราจะเก็บรวบรวมเฉพาะข้อมูลในกลุ่มตัวอย่างประชากรซึ่งแสดงถึงส่วนหนึ่งของประชากรเท่านั้น

การเก็บตัวอย่างมีสองวิธีที่แตกต่างกัน: การสุ่มตัวอย่างโดยมีการเปลี่ยน และ การสุ่มตัวอย่างโดยไม่ต้องเปลี่ยน

บทช่วยสอนนี้จะอธิบายความแตกต่างระหว่างสองวิธีพร้อมตัวอย่างวิธีใช้งานแต่ละวิธีในทางปฏิบัติ

การสุ่มตัวอย่างด้วยการเปลี่ยน

สมมติว่าเรามีชื่อนักเรียน 5 คนในหมวก:

  • แอนดี้
  • คาร์ล
  • ไทเลอร์
  • เบคก้า
  • เจสสิก้า

สมมติว่าเราต้องการสุ่มตัวอย่างนักเรียน 2 คนมาทดแทน

ในภาพวาดแรก เราอาจเลือกชื่อไทเลอร์ จากนั้นเราจะใส่ชื่อของเขากลับเข้าไปในหมวกแล้ววาดอีกครั้ง ในรูปที่สอง เราอาจเลือกชื่อไทเลอร์อีกครั้ง ตัวอย่างของเราก็คือ: {Tyler, Tyler}

นี่คือตัวอย่างการรับตัวอย่างพร้อมการเปลี่ยนเนื่องจากเราจะเปลี่ยนชื่อที่เราเลือกหลังจากแต่ละรูปวาด

เมื่อเราสุ่มตัวอย่างด้วยการแทนที่ องค์ประกอบตัวอย่างจะเป็น อิสระ เนื่องจากผลลัพธ์ของการโยนเหรียญหนึ่งครั้งไม่ได้รับผลกระทบจากการโยนเหรียญครั้งก่อน

ตัวอย่างเช่น ความน่าจะเป็นในการเลือกชื่อไทเลอร์คือ 1/5 ในการวาดครั้งแรก และอีก 1/5 ในการวาดครั้งที่สอง ผลลัพธ์ของการจับรางวัลครั้งแรกไม่ส่งผลต่อความน่าจะเป็นของผลลัพธ์ของการจับรางวัลครั้งที่สอง

การสุ่มตัวอย่างที่มีการแทนที่จะใช้ในสถานการณ์ต่างๆ มากมายในด้านสถิติและการเรียนรู้ของเครื่อง รวมถึง:

ในแต่ละวิธีการเหล่านี้ มีการใช้การสุ่มตัวอย่างพร้อมการทดแทน เนื่องจากช่วยให้เราสามารถใช้ชุดข้อมูลเดียวกันได้หลายครั้งเพื่อสร้างแบบจำลอง แทนที่จะรวบรวมข้อมูลใหม่ ซึ่งอาจใช้เวลานานและมีราคาแพง

การสุ่มตัวอย่างโดยไม่มีการเปลี่ยน

อีกครั้ง สมมติว่าเรามีชื่อนักเรียน 5 คนอยู่ในหมวก:

  • แอนดี้
  • คาร์ล
  • ไทเลอร์
  • เบคก้า
  • เจสสิก้า

สมมติว่าเราต้องการเก็บตัวอย่างนักเรียน 2 คนโดยไม่มีการเปลี่ยน

ในภาพวาดแรก เราอาจเลือกชื่อไทเลอร์ เราก็จะทิ้งชื่อของเขาไว้ ในรูปที่สอง เราสามารถเลือกชื่อแอนดี้ได้ ตัวอย่างของเราคือ: {Tyler, Andy}

นี่คือตัวอย่างการรับตัวอย่างโดยไม่ต้องเปลี่ยนเนื่องจากเราไม่ได้เปลี่ยนชื่อที่เราเลือกหลังจากแต่ละรูปวาด

เมื่อเราสุ่มตัวอย่างโดยไม่มีการเปลี่ยน องค์ประกอบตัวอย่างจะ ขึ้นอยู่ กับผลลัพธ์ของการโยนเหรียญหนึ่งครั้งจะได้รับผลกระทบจากการโยนเหรียญครั้งก่อน

เช่น ความน่าจะเป็นในการเลือกชื่อไทเลอร์คือ 1/5 ในรูปแรก และความน่าจะเป็นในการเลือกชื่อแอนดี้คือ 1/4 ในรูปที่สอง ผลลัพธ์ของการจับรางวัลครั้งแรกส่งผลต่อความน่าจะเป็นของผลลัพธ์ของการจับรางวัลครั้งที่สอง

การสุ่มตัวอย่างโดยไม่มีการทดแทนเป็นวิธีที่เราใช้เมื่อเราต้องการเลือก ตัวอย่างแบบสุ่ม จากประชากร

ตัวอย่างเช่น หากเราต้องการประมาณรายได้เฉลี่ยของครัวเรือนในเมืองซินซินแนติ รัฐโอไฮโอ อาจมีครัวเรือนที่แตกต่างกันทั้งหมด 500,000 ครัวเรือน

ดังนั้น เราอาจต้องการสุ่มตัวอย่างจำนวน 2,000 ครัวเรือน แต่เราไม่ต้องการให้ข้อมูลของครัวเรือนใดๆ ปรากฏซ้ำสองครั้งในกลุ่มตัวอย่าง ดังนั้น เราจะสุ่มตัวอย่างโดยไม่มีการทดแทน

กล่าวอีกนัยหนึ่ง เมื่อเราเลือกครัวเรือนใดครัวเรือนหนึ่งที่จะรวมไว้ในกลุ่มตัวอย่างแล้ว เราไม่ต้องการมีโอกาสเลือกครัวเรือนนั้นเพื่อรวมไว้ในกลุ่มตัวอย่างอีก

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *