ระดับความสำคัญ
บทความนี้จะอธิบายว่าสถิติมีความสำคัญระดับใด ดังนั้นคุณจะพบความหมายของระดับนัยสำคัญ ตารางที่มีระดับนัยสำคัญบ่อยที่สุด และความสัมพันธ์ของระดับนัยสำคัญกับแนวคิดทางสถิติอื่นๆ
มีความสำคัญระดับใด?
ระดับนัยสำคัญ คือความน่าจะเป็นที่การประมาณค่าพารามิเตอร์ทางสถิติในประชากรอยู่นอกช่วงความเชื่อมั่น กล่าวอีกนัยหนึ่ง ระดับนัยสำคัญคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานที่เป็นจริง
ในสถิติ ระดับนัยสำคัญแสดงด้วยสัญลักษณ์กรีก α (อัลฟา) นี่คือสาเหตุที่เรียกว่า ระดับอัลฟ่า
ตัวอย่างเช่น หากระดับนัยสำคัญคือ α=0.05 หมายความว่าความน่าจะเป็นที่จะปฏิเสธสมมติฐานเมื่อเป็นจริงคือ 5% กล่าวอีกนัยหนึ่ง ความน่าจะเป็นในการประมาณค่าพารามิเตอร์ทางสถิติและผิดพลาดโดยมีข้อผิดพลาดมากกว่าส่วนต่างของข้อผิดพลาดคือ 5%
ดังนั้น ระดับนัยสำคัญจึงเป็นขอบเขตในการพิจารณาว่าผลลัพธ์มีนัยสำคัญทางสถิติหรือไม่ โดยหากค่า p น้อยกว่าระดับนัยสำคัญ ผลลัพธ์จะถือว่ามีนัยสำคัญทางสถิติ ด้านล่างนี้เราจะเห็นความสัมพันธ์ระหว่างระดับนัยสำคัญและค่า p
ตารางระดับนัยสำคัญ
เมื่อเราได้เห็นคำจำกัดความของระดับนัยสำคัญแล้ว ตารางที่มีค่าของระดับนัยสำคัญที่พบบ่อยที่สุดจะแสดงอยู่ด้านล่าง
ระดับความเชื่อมั่น (1-α) | ระดับนัยสำคัญ (α) | ค่าวิกฤต (Z α/2 ) |
---|---|---|
0.80 | 0.20 | 1,282 |
0.85 | 0.15 | 1,440 |
0.90 | 0.10 | 1,645 |
0.95 | 0.05 | 1960 |
0.99 | 0.01 | 2,576 |
0.995 | 0.005 | 2,807 |
0.999 | 0.001 | 3,291 |
ตารางนี้จะมีประโยชน์มากในการคำนวณขีดจำกัดของช่วงความเชื่อมั่น
ดังที่คุณเห็นในตาราง การเพิ่มระดับความเชื่อมั่นจะลดระดับนัยสำคัญ ซึ่งนำไปสู่ความเสี่ยงในการทำผิดพลาดน้อยลงเมื่อยอมรับสมมติฐาน และในทางกลับกัน ความแม่นยำลดลงในการประมาณค่าพารามิเตอร์ทางสถิติ . โดยทั่วไปมักใช้ระดับนัยสำคัญ 5% (α=0.05)
ระดับความสำคัญ 0% และ 100%
ค่าระดับนัยสำคัญสามารถอยู่ในช่วงตั้งแต่ 0% (α=0.00) ถึง 100% (α=1) อย่างไรก็ตาม ค่าสุดขั้วสองค่านี้ไม่ควรปรากฏในสถิติเนื่องจากเป็นค่าที่ไม่เป็นจริงสองค่า เราจะมาดูสาเหตุด้านล่าง
ระดับนัยสำคัญ 0% หมายความว่าไม่มีข้อสงสัยเกี่ยวกับความจริงของสมมติฐานที่ยอมรับ อย่างไรก็ตาม สถิติไม่มีระดับนัยสำคัญ 0% เว้นแต่จะมีการวิเคราะห์ประชากรทั้งหมด และถึงอย่างนั้นก็ไม่สามารถแน่ใจได้ทั้งหมดว่าไม่มีข้อผิดพลาดหรืออคติเกิดขึ้น เกิดขึ้นระหว่างการสอบสวน
ในทางตรงกันข้าม ระดับนัยสำคัญ 100% หมายความว่าสมมติฐานที่ถูกปฏิเสธเป็นจริงอย่างไม่ต้องสงสัย แต่ตามตรรกะแล้ว หากได้รับผลลัพธ์บางส่วนที่มีระดับนัยสำคัญ 100% ก็จะไม่มีการเผยแพร่ผลลัพธ์เหล่านั้นเลย เนื่องจากจะไม่มีความแน่นอนเกี่ยวกับความถูกต้องของผลลัพธ์ก่อนที่จะทำการศึกษาทางสถิติซ้ำ
ระดับนัยสำคัญและระดับความเชื่อมั่น
แนวคิดสองประการที่เกี่ยวข้องอย่างใกล้ชิดในสถิติที่ต้องชัดเจนคือระดับนัยสำคัญและระดับความเชื่อมั่น นี่คือเหตุผลว่าทำไมในส่วนนี้ เราจะมาดูว่าอะไรคือความแตกต่างระหว่างระดับนัยสำคัญและระดับความเชื่อมั่น
ความแตกต่างระหว่างระดับนัยสำคัญและระดับความเชื่อมั่น คือความน่าจะเป็นที่พวกเขากำหนด ระดับความเชื่อมั่นคือความน่าจะเป็นที่จะยอมรับสมมติฐานและเป็นจริง ในขณะที่ระดับนัยสำคัญคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานแต่ว่าเป็นจริงจริงๆ
นอกจากนี้ ระดับนัยสำคัญบวกกับระดับความเชื่อมั่นจะส่งผลให้เกิดความสามัคคีเสมอ ดังนั้น หากระดับความเชื่อมั่นของช่วงความเชื่อมั่นคือ 1-α ระดับนัยสำคัญของช่วงความเชื่อมั่นเดียวกันนี้คือ α
ตัวอย่างเช่น หากระดับความเชื่อมั่นของช่วงความเชื่อมั่นคือ 95% ระดับนัยสำคัญคือ 5% หมายความว่าถ้าเราศึกษาทางสถิติซ้ำ 100 ครั้ง 95 ครั้ง เราก็จะได้ผลลัพธ์ที่สอดคล้องกับจำนวนประชากรที่แท้จริง ในขณะที่ 5 ครั้ง เราก็จะได้ผลลัพธ์ที่ผิดพลาด
ระดับนัยสำคัญและค่า p
สุดท้ายนี้ เราจะดูว่าความสัมพันธ์ระหว่างระดับนัยสำคัญกับค่า p คืออะไร เนื่องจากเป็นสองแนวคิดที่ใช้กันอย่างแพร่หลายในการต่อต้านสมมติฐาน
ค่า p หรือที่เรียกว่า ค่า p คือค่าระหว่าง 0 ถึง 1 ที่บ่งบอกถึงความน่าจะเป็นที่ความแตกต่างที่สังเกตได้นั้นเกิดจากโอกาส ดังนั้น ค่า p บ่งบอกถึงความสำคัญของผลลัพธ์ และใช้เพื่อพิจารณาว่าสมมติฐานเป็นจริงหรือเท็จ
ดังนั้น ในการทดสอบสมมติฐาน หากค่า p มากกว่าระดับนัยสำคัญ สมมติฐานว่างจะถือเป็นจริง ในทางกลับกัน ถ้าค่า p ต่ำกว่าระดับนัยสำคัญ สมมติฐานว่างจะถูกปฏิเสธ และสมมติฐานทางเลือกจะถือว่าเป็นจริง