คำอธิบายค่า p และนัยสำคัญทางสถิติ


ในสถิติ ค่า p มักใช้ในการทดสอบสมมติฐานสำหรับการทดสอบที การทดสอบไคสแควร์ การวิเคราะห์การถดถอย ANOVA และวิธีการทางสถิติอื่นๆ

แม้ว่าจะเป็นเรื่องธรรมดามาก แต่ผู้คนมักตีความค่า p ไม่ถูกต้องซึ่งอาจนำไปสู่ข้อผิดพลาดเมื่อตีความผลลัพธ์ของการวิเคราะห์หรือการศึกษา

บทความนี้จะอธิบายวิธีทำความเข้าใจและตีความค่า p อย่างชัดเจนและใช้งานได้จริง

การทดสอบสมมติฐาน

เพื่อให้เข้าใจค่า p เราต้องเข้าใจแนวคิดของ การทดสอบสมมติฐาน ก่อน

สมมติฐานการทดสอบ คือการทดสอบทางสถิติอย่างเป็นทางการที่เราใช้เพื่อปฏิเสธหรือไม่ปฏิเสธสมมติฐาน ตัวอย่างเช่น เราอาจตั้งสมมติฐานว่ายา วิธีการ หรือหัตถการใหม่มีข้อได้เปรียบเหนือยา วิธีการ หรือหัตถการในปัจจุบัน

เพื่อทดสอบสิ่งนี้ เราสามารถทำการทดสอบสมมติฐานโดยที่เราใช้สมมติฐานว่างและทางเลือก:

สมมติฐานว่าง – ไม่มีผลหรือความแตกต่างระหว่างวิธีใหม่กับวิธีเก่า

สมมติฐานทางเลือก – มีผลกระทบหรือความแตกต่างระหว่างวิธีใหม่กับวิธีเก่า

ค่า p บ่งชี้ว่าสมมติฐานว่างมีความน่าเชื่อถือเพียงใด เมื่อพิจารณาจากข้อมูลตัวอย่าง โดยเฉพาะอย่างยิ่ง สมมติว่าสมมติฐานว่างเป็นจริง ค่า p-value บอกเราถึงความน่าจะเป็นที่จะได้รับผลกระทบอย่างน้อยที่สุดเท่ากับผลที่เราสังเกตเห็นจริงในข้อมูลตัวอย่าง

หากค่า p ของการทดสอบสมมติฐานต่ำเพียงพอ เราสามารถปฏิเสธสมมติฐานว่างได้ โดยเฉพาะอย่างยิ่ง เมื่อเราทำการทดสอบสมมติฐาน เราต้องเลือกระดับนัยสำคัญตั้งแต่เริ่มต้น ตัวเลือกทั่วไปสำหรับระดับนัยสำคัญคือ 0.01, 0.05 และ 0.10

หากค่า p ต่ำกว่า ระดับนัยสำคัญของเรา เราก็สามารถปฏิเสธสมมติฐานว่างได้

มิฉะนั้น หากค่า p เท่ากับหรือมากกว่า ระดับนัยสำคัญของเรา เราจะปฏิเสธสมมติฐานว่างไม่ได้

วิธีการตีความค่า P

คำจำกัดความคลาสสิกของค่า p คือ:

ค่า p คือความน่าจะเป็นในการสังเกตสถิติตัวอย่างที่อย่างน้อยที่สุดเท่ากับสถิติตัวอย่างของคุณ โดยพิจารณาว่าสมมติฐานว่างนั้นเป็นจริง

ตัวอย่างเช่น สมมติว่าโรงงานอ้างว่าผลิตยางที่มีน้ำหนักเฉลี่ย 200 ปอนด์ ผู้ตรวจสอบตั้งสมมติฐานว่าน้ำหนักเฉลี่ยจริงของยางที่ผลิตในโรงงานแห่งนี้แตกต่างกัน 200 ปอนด์ เขาจึงทำการทดสอบสมมติฐานและพบว่าค่า p ของการทดสอบคือ 0.04 วิธีตีความค่า p นี้:

หากโรงงานผลิตยางที่มีน้ำหนักเฉลี่ย 200 ปอนด์จริง ๆ แล้ว 4% ของการตรวจสอบทั้งหมดจะบรรลุผลตามที่สังเกตได้ในตัวอย่างหรือมากกว่านั้น เนื่องจากข้อผิดพลาดในการสุ่มตัวอย่าง ข้อมูลนี้บอกเราว่าการได้รับข้อมูลตัวอย่างจากผู้ตรวจสอบบัญชีจะค่อนข้างหายากหากโรงงานผลิตยางที่มีน้ำหนักเฉลี่ย 200 ปอนด์จริงๆ

ขึ้นอยู่กับระดับนัยสำคัญที่ใช้ในการทดสอบสมมติฐานนี้ ผู้ตรวจสอบอาจปฏิเสธสมมติฐานว่างที่ว่าน้ำหนักเฉลี่ยจริงของยางที่ผลิตในโรงงานแห่งนี้คือ 200 ปอนด์จริงๆ ตัวอย่างข้อมูลที่เขาได้รับระหว่างการตรวจสอบไม่สอดคล้องกับสมมติฐานว่างมากนัก

จะ ไม่ ตีความค่า P ได้อย่างไร

ความเข้าใจผิดที่ใหญ่ที่สุดเกี่ยวกับค่า p คือความน่าจะเป็นที่จะเกิดข้อผิดพลาดโดยการปฏิเสธสมมติฐานว่างที่แท้จริง (เรียกว่าข้อผิดพลาดประเภทที่ 1)

มีสองสาเหตุหลักที่ทำให้ค่า p ไม่สามารถตรงกับอัตราข้อผิดพลาดได้:

1. ค่า P คำนวณบนสมมติฐานที่ว่าสมมติฐานว่างเป็นจริง และความแตกต่างระหว่างข้อมูลตัวอย่างกับสมมติฐานว่างนั้นเกิดจากโอกาส ดังนั้นค่า p ไม่สามารถบอกคุณถึงความน่าจะเป็นที่ค่าศูนย์จะเป็นจริงหรือเท็จเนื่องจากเป็นความจริง 100% จากมุมมองของการคำนวณ

2. แม้ว่าค่า p-value ที่ต่ำจะบ่งบอกว่าข้อมูลตัวอย่างของคุณไม่น่าเป็นไปได้โดยถือว่าศูนย์เป็นจริง แต่ค่า p ยังไม่สามารถบอกคุณได้ว่ากรณีใดต่อไปนี้มีแนวโน้มมากกว่า:

  • ค่าว่างเป็นเท็จ
  • ค่าศูนย์เป็นจริงแต่คุณมีตัวอย่างแปลกๆ

เมื่อเปรียบเทียบกับตัวอย่างก่อนหน้านี้ นี่เป็นวิธีที่ถูกต้องและไม่ถูกต้องในการตีความค่า p:

  • การตีความที่ถูกต้อง: สมมติว่าโรงงานผลิตยางที่มีน้ำหนักเฉลี่ย 200 ปอนด์ คุณจะได้รับความแตกต่างที่สังเกต ได้ จากตัวอย่างของคุณ หรือความแตกต่างที่รุนแรงมากขึ้นใน 4% ของการตรวจสอบเนื่องจากการสุ่มตัวอย่าง
  • การตีความไม่ถูกต้อง: หากคุณปฏิเสธสมมติฐานว่าง มีโอกาส 4% ที่คุณกำลังทำผิดพลาด

ตัวอย่างการตีความค่า P

ตัวอย่างต่อไปนี้แสดงวิธีที่ถูกต้องในการตีความค่า p ในบริบทของการทดสอบสมมติฐาน

ตัวอย่างที่ 1

บริษัทโทรศัพท์แห่งหนึ่งอ้างว่า 90% ของลูกค้าพอใจกับบริการของตน เพื่อทดสอบคำกล่าวอ้างนี้ นักวิจัยอิสระได้รวบรวม ตัวอย่างง่ายๆ จากลูกค้า 200 ราย และถามพวกเขาว่าพวกเขาพอใจกับบริการของตนหรือไม่ ซึ่ง 85% ตอบว่าใช่ ค่า p ที่เกี่ยวข้องกับตัวอย่างข้อมูลนี้พบว่าเป็น 0.018

การตีความค่า p ที่ถูกต้อง: สมมติว่าลูกค้า 90% พอใจกับบริการของตนจริง ๆ ผู้วิจัยจะได้รับความแตกต่างที่สังเกตได้จากตัวอย่างของ เขา หรือความแตกต่างที่รุนแรงมากขึ้นใน 1.8% ของการตรวจสอบเนื่องจากการสุ่มตัวอย่าง ข้อผิดพลาด. .

ตัวอย่างที่ 2

บริษัทแห่งหนึ่งคิดค้นแบตเตอรี่ใหม่สำหรับโทรศัพท์ บริษัทอ้างว่าแบตเตอรี่ใหม่นี้จะใช้งานได้นานกว่าแบตเตอรี่เก่าอย่างน้อย 10 นาที เพื่อทดสอบข้อกล่าวอ้างนี้ นักวิจัยสุ่มตัวอย่างแบตเตอรี่ใหม่ 80 ก้อนและแบตเตอรี่เก่า 80 ก้อนโดยการสุ่มตัวอย่าง แบตเตอรี่ใหม่ใช้งานได้เฉลี่ย 120 นาที โดยมีค่าเบี่ยงเบนมาตรฐาน 12 นาที และแบตเตอรี่เก่าใช้งานได้เฉลี่ย 115 นาที โดยมีค่าเบี่ยงเบนมาตรฐาน 15 นาที ค่า p ที่ได้จากการทดสอบความแตกต่างในค่าเฉลี่ยประชากรคือ 0.011

การตีความค่า p ที่ถูกต้อง: สมมติว่าแบตเตอรี่ใหม่ใช้งานได้ในระยะเวลาเท่ากันหรือน้อยกว่าแบตเตอรี่เก่า ผู้วิจัยจะได้รับความแตกต่างที่สังเกตได้หรือความแตกต่างที่รุนแรงมากขึ้นในการศึกษา 1.1% เนื่องจากการสุ่มตัวอย่างที่มีข้อผิดพลาด

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *