เหตุใดสถิติจึงมีความสำคัญ (10 เหตุผลที่สถิติมีความสำคัญ!)
สาขา สถิติ เกี่ยวข้องกับการรวบรวม การวิเคราะห์ การตีความ และการนำเสนอข้อมูล
เมื่อเทคโนโลยีเข้ามาในชีวิตประจำวันของเรามากขึ้นเรื่อยๆ ข้อมูลก็ถูกสร้างขึ้นและรวบรวมมากขึ้นกว่าที่เคยมีมาในประวัติศาสตร์ของมนุษย์
สถิติเป็นพื้นที่ที่สามารถช่วยให้เราเข้าใจวิธีใช้ข้อมูลนี้เพื่อดำเนินงานต่อไปนี้:
- เข้าใจโลกรอบตัวเรามากขึ้น
- ตัดสินใจโดยใช้ข้อมูล
- ทำนายอนาคตโดยใช้ข้อมูล
ในบทความนี้ เราแบ่งปัน 10 เหตุผลว่าทำไมสาขาสถิติจึงมีความสำคัญในชีวิตสมัยใหม่
เหตุผลที่ 1: ใช้สถิติเชิงพรรณนาเพื่อทำความเข้าใจโลก
สถิติเชิงพรรณนา ใช้เพื่ออธิบายข้อมูลดิบชิ้นหนึ่ง สถิติเชิงพรรณนามีสามประเภทหลัก:
- สถิติสรุป
- กราฟิก
- โต๊ะ
องค์ประกอบแต่ละอย่างสามารถช่วยให้เราเข้าใจข้อมูลที่มีอยู่ได้ดีขึ้น
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลดิบที่แสดงคะแนนสอบของนักเรียน 10,000 คนในเมืองหนึ่งๆ เราอาจใช้สถิติเชิงพรรณนาเพื่อ:
- คำนวณคะแนนสอบเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของผลการทดสอบ
- สร้างฮิสโตแกรมหรือบ็อกซ์พล็อตเพื่อแสดงภาพการกระจายตัวของผลการทดสอบ
- สร้างตารางความถี่เพื่อทำความเข้าใจการกระจายตัวของผลการทดสอบ
การใช้สถิติเชิงพรรณนาช่วยให้เราเข้าใจคะแนนสอบของนักเรียนได้ง่ายกว่าการดูข้อมูลดิบเพียงอย่างเดียว
เหตุผลที่ 2: ระวังกราฟิกที่ทำให้เข้าใจผิด
มีการสร้างกราฟิกมากขึ้นเรื่อยๆ ในวารสาร สื่อ บทความออนไลน์ และนิตยสาร น่าเสียดายที่แผนภูมิมักจะทำให้เข้าใจผิดหากคุณไม่เข้าใจข้อมูลที่เกี่ยวข้อง
ตัวอย่างเช่น สมมติว่าวารสารตีพิมพ์งานวิจัยที่ค้นหาความสัมพันธ์เชิงลบระหว่างคะแนน GPA และ ACT ของนักศึกษาในมหาวิทยาลัยบางแห่ง
อย่างไรก็ตาม ความสัมพันธ์เชิงลบนี้เกิดขึ้นเพียงเพราะนักเรียนที่มี ทั้ง คะแนน GPA และ ACT สูงสามารถเข้าเรียนในมหาวิทยาลัยชั้นนำได้ ในขณะที่นักศึกษาที่มี ทั้ง คะแนน GPA และ ACT ต่ำจะไม่ได้รับการยอมรับเลย

แม้ว่าความสัมพันธ์ระหว่าง ACT และ GPA จะเป็นเชิงบวกในประชากร แต่ความสัมพันธ์ดังกล่าวจะปรากฏเป็นลบในกลุ่มตัวอย่าง
อคติเฉพาะนี้เรียกว่า อคติของเบิร์กสัน เมื่อทราบถึงอคตินี้ คุณจะหลีกเลี่ยงการถูกเข้าใจผิดโดยบางกราฟได้
เหตุผลที่ 3: ระวังตัวแปรที่ทำให้เกิดความสับสน
แนวคิดสำคัญที่คุณจะได้เรียนรู้ในสถิติคือแนวคิดเรื่อง ตัวแปรที่ทำให้สับสน
ตัวแปรเหล่านี้เป็นตัวแปรที่ไม่ได้นำมาพิจารณา และอาจ ทำให้ ผลลัพธ์ของการทดสอบสับสนและนำไปสู่ข้อสรุปที่ไม่น่าเชื่อถือ
ตัวอย่างเช่น สมมติว่านักวิจัยรวบรวมข้อมูลเกี่ยวกับการขายไอศกรีมและการโจมตีของฉลาม และค้นพบว่าตัวแปรทั้งสองมีความสัมพันธ์กันสูง นี่หมายความว่ายอดขายไอศกรีมที่เพิ่มขึ้นทำให้ปลาฉลามโจมตีมากขึ้นใช่หรือไม่
มันไม่น่าเป็นไปได้ สาเหตุที่เป็นไปได้มากที่สุดคือ อุณหภูมิ ที่เปลี่ยนแปลงอย่างน่าสับสน เมื่ออากาศข้างนอกอุ่นขึ้น ผู้คนจะซื้อไอศกรีมมากขึ้น และผู้คนก็ไปทะเลมากขึ้น

เหตุผลที่ 4: เพื่อการตัดสินใจที่ดีขึ้นโดยใช้ความน่าจะเป็น
ฟิลด์ย่อยที่สำคัญที่สุดประการหนึ่งของสถิติคือ ความน่าจะเป็น เป็นสาขาที่ศึกษาความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้น
การมีความเข้าใจพื้นฐานเกี่ยวกับความน่าจะเป็นจะทำให้คุณสามารถตัดสินใจได้อย่างมีข้อมูลมากขึ้นในโลกแห่งความเป็นจริง
ตัวอย่างเช่น สมมติว่านักเรียนมัธยมปลายรู้ว่าเขามีโอกาส 10% ที่จะได้รับการยอมรับเข้ามหาวิทยาลัยที่กำหนด การใช้สูตร ความน่าจะเป็นที่จะผ่าน “อย่างน้อยหนึ่ง” นักเรียนคนนี้สามารถหาความน่าจะเป็นที่เขาจะได้รับการยอมรับจากมหาวิทยาลัยอย่างน้อยหนึ่งแห่งที่เขาสมัคร และสามารถปรับจำนวนมหาวิทยาลัยที่เขาสมัครตามผลการแข่งขันได้
เหตุผลที่ 5: ทำความเข้าใจกับค่า P ในการวิจัย
แนวคิดสำคัญอีกประการหนึ่งที่คุณจะได้เรียนรู้ในสถิติคือ ค่า p
คำจำกัดความคลาสสิกของค่า p คือ:
ค่า p คือความน่าจะเป็นในการสังเกตสถิติตัวอย่างที่อย่างน้อยที่สุดเท่ากับสถิติตัวอย่างของคุณ โดยพิจารณาว่าสมมติฐานว่างนั้นเป็นจริง
ตัวอย่างเช่น สมมติว่าโรงงานอ้างว่าผลิตยางที่มีน้ำหนักเฉลี่ย 200 ปอนด์ ผู้ตรวจสอบตั้งสมมติฐานว่าน้ำหนักเฉลี่ยจริงของยางที่ผลิตในโรงงานแห่งนี้แตกต่างกัน 200 ปอนด์ เขาจึงทำการทดสอบสมมติฐานและพบว่าค่า p ของการทดสอบคือ 0.04
วิธีตีความค่า p นี้:
หากโรงงานผลิตยางที่มีน้ำหนักเฉลี่ย 200 ปอนด์จริง ๆ แล้ว 4% ของการตรวจสอบทั้งหมดจะบรรลุผลตามที่สังเกตได้ในตัวอย่างหรือมากกว่านั้น เนื่องจากข้อผิดพลาดในการสุ่มตัวอย่าง ข้อมูลนี้บอกเราว่าการได้รับข้อมูลตัวอย่างจากผู้ตรวจสอบบัญชีจะค่อนข้างหายากหากโรงงานผลิตยางที่มีน้ำหนักเฉลี่ย 200 ปอนด์จริงๆ
ดังนั้น ผู้ตรวจสอบบัญชีจึงมีแนวโน้มที่จะปฏิเสธสมมติฐานว่างที่ว่าน้ำหนักเฉลี่ยที่แท้จริงของยางที่ผลิตในโรงงานแห่งนี้คือ 200 ปอนด์จริงๆ
เหตุผลที่ 6: ทำความเข้าใจความสัมพันธ์
แนวคิดที่สำคัญอีกประการหนึ่งที่คุณจะได้เรียนรู้ในสถิติคือ ความสัมพันธ์ ซึ่งบอกเราถึงความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
ค่าของสัมประสิทธิ์สหสัมพันธ์จะอยู่ระหว่าง -1 ถึง 1 เสมอ โดยที่:
- -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
- 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
- 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
เมื่อเข้าใจค่าเหล่านี้ คุณจะเข้าใจความสัมพันธ์ระหว่างตัวแปรในโลกแห่งความเป็นจริงได้
ตัวอย่างเช่น หากความสัมพันธ์ระหว่างค่าใช้จ่ายในการโฆษณากับรายได้คือ 0.87 คุณจะเข้าใจได้ว่าตัวแปรทั้งสองมีความสัมพันธ์เชิงบวกอย่างมาก เมื่อคุณใช้จ่ายเงินไปกับการโฆษณามากขึ้น คุณสามารถคาดหวังรายได้ที่เพิ่มขึ้นอย่างคาดการณ์ได้
เหตุผลที่ 7: ทำนายอนาคต
เหตุผลสำคัญอีกประการหนึ่งในการเรียนรู้สถิติคือการทำความเข้าใจแบบจำลองการถดถอยพื้นฐาน เช่น:
แต่ละโมเดลเหล่านี้ช่วยให้คุณสามารถคาดการณ์เกี่ยวกับค่าในอนาคตของ ตัวแปรตอบสนอง โดยอิงตามค่าของตัวแปรทำนายบางตัวในโมเดล
ตัวอย่างเช่น บริษัทต่างๆ ใช้แบบจำลองการถดถอยเชิงเส้นหลายตัวในโลกแห่งความเป็นจริงตลอดเวลา เมื่อใช้ตัวแปรทำนาย เช่น อายุ รายได้ ชาติพันธุ์ ฯลฯ เพื่อคาดการณ์จำนวนลูกค้าที่จะใช้จ่ายในร้านค้าของตน
ในทำนองเดียวกัน บริษัทโลจิสติกส์ใช้ตัวแปรคาดการณ์ เช่น ความต้องการทั้งหมด ขนาดประชากร เป็นต้น เพื่อคาดการณ์ยอดขายในอนาคต
ไม่ว่าคุณจะทำงานในสาขาใดก็ตาม มีโอกาสที่ดีที่แบบจำลองการถดถอยจะถูกนำมาใช้ในการทำนายปรากฏการณ์ในอนาคต
เหตุผลที่ 8: เข้าใจอคติที่อาจเกิดขึ้นในการศึกษา
อีกเหตุผลหนึ่งในการศึกษาสถิติก็คือการตระหนักถึงอคติประเภทต่างๆ ทั้งหมดที่อาจเกิดขึ้นในการศึกษาในโลกแห่งความเป็นจริง
นี่คือตัวอย่างบางส่วน:
- สังเกตอคติ
- อคติในการเลือกตนเอง
- อคติอ้างอิง
- ละเว้นอคติของตัวแปร
- อคติน้อยเกินไป
- อคติไม่ตอบสนอง
เมื่อมีความเข้าใจพื้นฐานเกี่ยวกับอคติประเภทนี้ คุณสามารถหลีกเลี่ยงการกระทำเหล่านี้เมื่อทำการวิจัยหรือระวังเมื่ออ่านงานวิจัยหรือการศึกษาอื่นๆ
เหตุผลที่ 9: ทำความเข้าใจสมมติฐานที่ทำโดยการทดสอบทางสถิติ
การทดสอบทางสถิติจำนวนมากตั้งสมมติฐานเกี่ยวกับข้อมูลพื้นฐานที่กำลังศึกษา
เมื่ออ่านผลการศึกษาหรือแม้กระทั่งดำเนินการศึกษาของคุณเอง สิ่งสำคัญคือต้องเข้าใจว่าต้องตั้งสมมติฐานอะไรบ้างเพื่อให้ผลลัพธ์เชื่อถือได้
บทความต่อไปนี้แบ่งปันสมมติฐานที่ทำขึ้นในการทดสอบและขั้นตอนทางสถิติที่ใช้กันทั่วไปหลายประการ:
- ข้อสันนิษฐานความแปรปรวนที่เท่ากันในสถิติคืออะไร?
- ข้อสันนิษฐานปกติในสถิติคืออะไร?
- ข้อสันนิษฐานความเป็นอิสระในสถิติคืออะไร?
เหตุผลที่ 10: เพื่อหลีกเลี่ยงการทำให้เป็นเรื่องทั่วไปมากเกินไป
อีกเหตุผลหนึ่งในการศึกษาสถิติคือการเข้าใจแนวคิดเรื่อง การสรุปทั่วไปมากเกินไป
สิ่งนี้เกิดขึ้นเมื่อบุคคลที่เข้าร่วมในการศึกษาไม่ได้เป็น ตัวแทน ของบุคคลในประชากรโดยรวม ดังนั้นจึงไม่เหมาะสมที่จะสรุปข้อค้นพบของการศึกษากับประชากรทั้งหมด
ตัวอย่างเช่น สมมติว่าเราต้องการทราบว่านักเรียนในโรงเรียนบางแห่งชอบ “ดราม่า” เป็นแนวภาพยนตร์ที่พวกเขาชื่นชอบกี่เปอร์เซ็นต์ หากประชากรนักเรียนทั้งหมดเป็นเด็กผู้ชาย 50% และเด็กผู้หญิง 50% กลุ่มตัวอย่างที่ประกอบด้วยเด็กผู้ชาย 90% และเด็กผู้หญิง 10% อาจนำไปสู่ผลลัพธ์ที่เอนเอียงได้หากเด็กผู้ชายจำนวนน้อยลงมากที่ชอบการแสดงละครเป็นแนวเพลงโปรด
ตามหลักการแล้ว เราต้องการให้ตัวอย่างของเรามีลักษณะคล้ายกับ “เวอร์ชันจิ๋ว” ของประชากรของเรา ดังนั้น หากประชากรนักเรียนโดยรวมประกอบด้วยเด็กผู้หญิง 50% และเด็กผู้ชาย 50% กลุ่มตัวอย่างของเราจะไม่เป็นตัวแทนหากประกอบด้วยเด็กผู้ชาย 90% และเด็กผู้หญิงเพียง 10% เท่านั้น

ดังนั้น ไม่ว่าคุณจะทำการสำรวจของคุณเองหรืออ่านผลการสำรวจ สิ่งสำคัญคือต้องเข้าใจว่าข้อมูลตัวอย่างเป็นตัวแทนของประชากรทั้งหมดหรือไม่ และผลการสำรวจสามารถสรุปให้กับประชากรได้อย่างมั่นใจหรือไม่
แหล่งข้อมูลเพิ่มเติม
อ่านบทความต่อไปนี้เพื่อทำความเข้าใจพื้นฐานเกี่ยวกับแนวคิดที่สำคัญที่สุดในสถิติเบื้องต้น:
สถิติเชิงพรรณนาหรือเชิงอนุมาน
ประชากรเทียบกับ ตัวอย่าง
สถิติเทียบกับพารามิเตอร์
ตัวแปรเชิงคุณภาพและเชิงปริมาณ
ระดับการวัด: ระบุ ลำดับ ช่วงเวลา และอัตราส่วน