การวิเคราะห์แบบตัวแปรเดียวคืออะไร? (คำจำกัดความ & #038; ตัวอย่าง)
คำว่า การวิเคราะห์ตัวแปรเดียว หมายถึงการวิเคราะห์ตัวแปรหนึ่งตัว คุณสามารถจำสิ่งนี้ได้เพราะคำนำหน้า “uni” แปลว่า “หนึ่ง”
เป้าหมายของการวิเคราะห์ตัวแปรเดียวคือการเข้าใจการกระจายของค่าสำหรับตัวแปรเดี่ยว คุณสามารถเปรียบเทียบการวิเคราะห์ประเภทนี้กับสิ่งต่อไปนี้:
- การวิเคราะห์ไบวาเรียต : การวิเคราะห์สองตัวแปร
- การวิเคราะห์หลายตัวแปร: การวิเคราะห์ตัวแปรตั้งแต่สองตัวขึ้นไป
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

เราอาจเลือกที่จะทำการวิเคราะห์แบบตัวแปรเดียวกับตัวแปรแต่ละตัวในชุดข้อมูลเพื่อให้เข้าใจการกระจายตัวของค่าได้ดีขึ้น
ตัวอย่างเช่น เราสามารถเลือกที่จะทำการวิเคราะห์แบบ univariate กับตัวแปร Household size :

มีสามวิธีทั่วไปในการวิเคราะห์แบบไม่แปรผัน:
1. สถิติสรุป
วิธีทั่วไปที่สุดในการวิเคราะห์ตัวแปรเดียวคือการอธิบายตัวแปรโดยใช้ สถิติสรุป
สถิติสรุปทั่วไปมี 2 ประเภท:
- การวัดแนวโน้มจากศูนย์กลาง : ตัวเลขเหล่านี้อธิบายว่าศูนย์กลางของชุดข้อมูลอยู่ที่ใด ตัวอย่างได้แก่ ค่าเฉลี่ย และ ค่ามัธยฐาน
- มาตรการการกระจาย : ตัวเลขเหล่านี้อธิบายการกระจายของค่าในชุดข้อมูล ตัวอย่าง ได้แก่ ช่วง ช่วงระหว่างควอไทล์ ค่าเบี่ยงเบนมาตรฐาน และ ความแปรปรวน
2. การแจกแจงความถี่
อีกวิธีหนึ่งในการวิเคราะห์แบบไม่แปรผันคือการสร้าง การแจกแจงความถี่ ซึ่งอธิบายว่าค่าต่างๆ ปรากฏในชุดข้อมูลบ่อยแค่ไหน
3. กราฟิก
อีกวิธีหนึ่งในการวิเคราะห์ตัวแปรเดียวคือการสร้างกราฟเพื่อแสดงภาพการกระจายค่าของตัวแปรบางตัว
ตัวอย่างทั่วไป ได้แก่:
- บ็อกซ์พล็อต
- ฮิสโตแกรม
- เส้นโค้งความหนาแน่น
- กาเมมเบอร์ต
ตัวอย่างต่อไปนี้แสดงวิธีการวิเคราะห์ตัวแปรเดียวแต่ละประเภทโดยใช้ตัวแปร ขนาดครัวเรือน จากชุดข้อมูลที่กล่าวถึงก่อนหน้านี้:

สถิติสรุป
เราสามารถคำนวณการวัดแนวโน้มส่วนกลางของขนาดครัวเรือนได้ดังต่อไปนี้:
- เฉลี่ย(ค่าเฉลี่ย): 3.8
- มัธยฐาน (ค่าเฉลี่ย): 4
ค่านิยมเหล่านี้ทำให้เราทราบว่าค่า “ศูนย์กลาง” อยู่ที่ใด
นอกจากนี้เรายังสามารถคำนวณมาตรการการกระจายต่อไปนี้:
- ช่วง (ความแตกต่างระหว่างสูงสุดและต่ำสุด): 6
- สเกลระหว่างควอไทล์ (การกระจายค่าตรงกลาง 50%): 2.5
- ส่วนเบี่ยงเบนมาตรฐาน (การวัดสเปรดโดยเฉลี่ย): 1.87
ค่าเหล่านี้ทำให้เรามีแนวคิดในการแจกแจงค่าของตัวแปรนี้
การกระจายความถี่
นอกจากนี้เรายังสามารถสร้างตารางการแจกแจงความถี่ต่อไปนี้เพื่อสรุปว่าค่าต่างๆ เกิดขึ้นบ่อยแค่ไหน:

สิ่งนี้ช่วยให้เราเห็นได้อย่างรวดเร็วว่าขนาดครัวเรือนที่พบบ่อยที่สุดคือ 4 คน
แหล่งข้อมูล: คุณสามารถใช้ เครื่องคำนวณความถี่ นี้เพื่อสร้างการแจกแจงความถี่สำหรับตัวแปรใดๆ โดยอัตโนมัติ
กราฟิก
เราสามารถสร้างกราฟต่อไปนี้เพื่อช่วยให้เราเห็นภาพการกระจายค่าตามขนาดครัวเรือน:
1. บ็อกซ์พล็อต
Boxplot คือกราฟที่แสดงข้อมูลสรุปห้าหลักของชุดข้อมูล
สรุปตัวเลขห้าตัวประกอบด้วย:
- ค่าต่ำสุด
- ควอไทล์แรก
- ค่ามัธยฐาน
- ควอร์ไทล์ที่สาม
- ค่าสูงสุด
Boxplot สำหรับตัวแปรขนาดครัวเรือนจะมีลักษณะดังนี้:

แหล่งข้อมูล: คุณสามารถใช้ ตัวสร้าง boxplot นี้เพื่อสร้าง boxplot สำหรับตัวแปรใดก็ได้โดยอัตโนมัติ
2. ฮิสโตแกรม
ฮิสโตแกรมเป็นแผนภูมิประเภทหนึ่งที่ใช้แถบแนวตั้งเพื่อแสดงความถี่ แผนภูมิประเภทนี้เป็นวิธีที่มีประโยชน์ในการแสดงภาพการกระจายค่าในชุดข้อมูล
ฮิสโตแกรมจะมีลักษณะเช่นนี้สำหรับตัวแปรขนาดครัวเรือน:

3. เส้นโค้งความหนาแน่น
เส้นโค้งความหนาแน่น คือเส้นโค้งบนกราฟที่แสดงการกระจายของค่าในชุดข้อมูล
มีประโยชน์อย่างยิ่งสำหรับการแสดงภาพ “รูปร่าง” ของการแจกแจง รวมถึงการแจกแจงว่ามี “ยอด” ของค่าที่พบบ่อยตั้งแต่หนึ่งค่าขึ้นไปหรือ ไม่ และ การกระจายนั้นเอียงไปทางซ้ายหรือขวาหรือไม่
เส้นโค้งความหนาแน่นสำหรับตัวแปรขนาดครัวเรือนจะมีลักษณะดังนี้:

4. แผนภูมิวงกลม
แผนภูมิวงกลมเป็นแผนภูมิรูปวงกลมประเภทหนึ่งและใช้ส่วนต่างๆ เพื่อแสดงสัดส่วนของทั้งหมด
แผนภูมิวงกลมสำหรับตัวแปรขนาดครัวเรือนจะมีลักษณะดังนี้:

ขึ้นอยู่กับชนิดของข้อมูล แผนภูมิใดแผนภูมิหนึ่งอาจมีประโยชน์มากกว่าแผนภูมิอื่นๆ ในการแสดงภาพการกระจายของค่า