ค่า p เทียบกับ อัลฟ่า: อะไรคือความแตกต่าง?
คำสองคำที่นักเรียนมักสับสนในสถิติคือ p-value และ alpha
ทั้งสองคำใช้ใน การทดสอบสมมติฐาน ซึ่งเป็นการทดสอบทางสถิติอย่างเป็นทางการที่เราใช้เพื่อปฏิเสธหรือไม่ปฏิเสธสมมติฐาน
ตัวอย่างเช่น สมมติว่าเราตั้งสมมติฐานว่ายาเม็ดใหม่จะช่วยลดความดันโลหิตของผู้ป่วยได้มากกว่ายามาตรฐานในปัจจุบัน
เพื่อทดสอบสิ่งนี้ เราสามารถทำการทดสอบสมมติฐานโดยกำหนดสมมติฐานว่างและสมมติฐานทางเลือกต่อไปนี้:
สมมติฐานว่าง: ไม่มีความแตกต่างระหว่างยาเม็ดใหม่และยามาตรฐาน
สมมติฐานทางเลือก: มี ความแตกต่างระหว่างยาเม็ดใหม่กับยามาตรฐาน
หากเราถือว่าสมมติฐานว่างเป็นจริง ค่า p-value ของการทดสอบจะบอกเราถึงความน่าจะเป็นที่จะได้รับผลกระทบอย่างน้อยที่สุดเท่ากับค่าที่เราสังเกตได้จริงในข้อมูลตัวอย่าง
ตัวอย่างเช่น สมมติว่าเราพบว่าค่า p สำหรับการทดสอบสมมติฐานคือ 0.02
วิธีตีความค่า p นี้: หากไม่มีความแตกต่างอย่างแท้จริงระหว่างยาเม็ดใหม่และยามาตรฐาน 2% ของเวลาที่เราทำการทดสอบสมมติฐานนี้ เราจะได้รับผลกระทบที่สังเกตได้ในตัวอย่างข้อมูล หรือมากกว่านั้น เพียงเพราะข้อผิดพลาดในการสุ่มตัวอย่าง
สิ่งนี้บอกเราว่าการได้รับตัวอย่างข้อมูลที่เราทำจริงนั้นค่อนข้างจะหายาก หากไม่มีความแตกต่างระหว่างยาเม็ดใหม่และยามาตรฐาน
ดังนั้น เรามีแนวโน้มที่จะปฏิเสธสมมติฐานว่างและสรุปว่า มี ความแตกต่างระหว่างยาเม็ดใหม่กับยามาตรฐาน
แต่เราควรใช้เกณฑ์ใดกำหนดว่าค่า p ของเราต่ำพอที่จะปฏิเสธสมมติฐานว่างหรือไม่?
นี่คือจุดที่อัลฟ่าเข้ามา!
ระดับอัลฟ่า
ระดับอัลฟ่า ของการทดสอบสมมติฐานคือเกณฑ์ที่เราใช้ในการพิจารณาว่าค่า p ของเราต่ำพอที่จะปฏิเสธสมมติฐานว่างหรือไม่ มักจะตั้งไว้ที่ 0.05 แต่บางครั้งก็ตั้งไว้ที่ 0.01 หรือ 0.10
ตัวอย่างเช่น ถ้าเราตั้งค่าระดับอัลฟาของการทดสอบสมมติฐานเป็น 0.05 และได้รับค่า p-value 0.02 เราจะปฏิเสธสมมติฐานว่างเนื่องจากค่า p-value น้อยกว่าระดับอัลฟา ดังนั้น เราจะสรุปได้ว่าเรามีหลักฐานเพียงพอที่จะบอกว่าสมมติฐานทางเลือกนั้นเป็นจริง
สิ่งสำคัญคือต้องทราบว่าระดับอัลฟายังกำหนดความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างที่แท้จริงอย่างไม่ถูกต้อง
ตัวอย่างเช่น สมมติว่าเราต้องการทดสอบว่าค่าเฉลี่ยความดันโลหิตที่ลดลงระหว่างยาเม็ดใหม่กับยาเม็ดปัจจุบันมีความแตกต่างกันหรือไม่ และสมมติว่า ไม่มี ความแตกต่างระหว่างยาทั้งสองนี้
หากเราตั้งค่าระดับอัลฟาของการทดสอบสมมติฐานไว้ที่ 0.05 หมายความว่าหากเราทำซ้ำขั้นตอนการทดสอบสมมติฐานหลายครั้ง เราคาดว่าจะปฏิเสธสมมติฐานว่างอย่างผิดพลาดในประมาณ 5% ของกรณีทั้งหมด การทดสอบ
วิธีเลือกระดับอัลฟ่า
ตามที่กล่าวไว้ข้างต้น ตัวเลือกที่พบบ่อยที่สุดสำหรับระดับอัลฟาของการทดสอบสมมติฐานคือ 0.05 อย่างไรก็ตาม ในบางสถานการณ์ที่ข้อสรุปที่ผิดพลาดนำไปสู่ผลลัพธ์ที่ร้ายแรง เราสามารถตั้งค่าระดับอัลฟ่าให้ต่ำลงได้ หรืออาจเป็น 0.01
ตัวอย่างเช่น ในวงการแพทย์ เป็นเรื่องปกติที่นักวิจัยจะตั้งค่าระดับอัลฟ่าไว้ที่ 0.01 เพราะพวกเขาต้องการให้แน่ใจว่าผลลัพธ์ของการทดสอบสมมติฐานมีความน่าเชื่อถือ
ในทางกลับกัน ในด้านการตลาด การตั้งค่าระดับอัลฟ่าให้สูงขึ้น เช่น 0.10 อาจเป็นเรื่องปกติมากกว่า เนื่องจากผลที่ตามมาของการทำผิดพลาดไม่ใช่ทั้งชีวิตและความตาย
ควรสังเกตว่าการเพิ่มระดับอัลฟ่าของการทดสอบจะเพิ่มโอกาสในการค้นหาผลการทดสอบที่มีนัยสำคัญ แต่ก็จะเพิ่มโอกาสที่เราจะปฏิเสธสมมติฐานว่างที่แท้จริงอย่างผิดพลาดด้วย
สรุป:
นี่คือสิ่งที่เราเรียนรู้ในบทความนี้:
1. ค่า p บอกเราถึงความน่าจะเป็นที่จะได้รับผลกระทบอย่างน้อยที่สุดเท่ากับค่าที่เราสังเกตได้จริงในข้อมูลตัวอย่าง
2. ระดับอัลฟ่า คือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างที่แท้จริงอย่างผิดพลาด
3. หากค่า p ของการทดสอบสมมติฐานน้อยกว่าระดับอัลฟ่า เราก็สามารถปฏิเสธสมมติฐานว่างได้
4. การเพิ่มระดับอัลฟ่าของการทดสอบจะเพิ่มโอกาสที่เราจะพบผลการทดสอบที่มีนัยสำคัญ แต่ยังเพิ่มโอกาสที่เราจะปฏิเสธสมมติฐานว่างที่แท้จริงอย่างผิดพลาดด้วย
แหล่งข้อมูลเพิ่มเติม
ความรู้เบื้องต้นเกี่ยวกับการทดสอบสมมติฐาน
วิธีการเขียนสมมติฐานว่าง (5 ตัวอย่าง)
วิธีการระบุฝ่ายซ้ายกับฝ่ายซ้าย การทดสอบที่ถูกต้อง