การวิเคราะห์แบบตัวแปรเดียวคืออะไร? (คำจำกัดความ & #038; ตัวอย่าง)


คำว่า การวิเคราะห์ตัวแปรเดียว หมายถึงการวิเคราะห์ตัวแปรหนึ่งตัว คุณสามารถจำสิ่งนี้ได้เพราะคำนำหน้า “uni” แปลว่า “หนึ่ง”

เป้าหมายของการวิเคราะห์ตัวแปรเดียวคือการเข้าใจการกระจายของค่าสำหรับตัวแปรเดี่ยว คุณสามารถเปรียบเทียบการวิเคราะห์ประเภทนี้กับสิ่งต่อไปนี้:

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

เราอาจเลือกที่จะทำการวิเคราะห์แบบตัวแปรเดียวกับตัวแปรแต่ละตัวในชุดข้อมูลเพื่อให้เข้าใจการกระจายตัวของค่าได้ดีขึ้น

ตัวอย่างเช่น เราสามารถเลือกที่จะทำการวิเคราะห์แบบ univariate กับตัวแปร Household size :

ตัวอย่างการวิเคราะห์แบบไม่แปรผัน

มีสามวิธีทั่วไปในการวิเคราะห์แบบไม่แปรผัน:

1. สถิติสรุป

วิธีทั่วไปที่สุดในการวิเคราะห์ตัวแปรเดียวคือการอธิบายตัวแปรโดยใช้ สถิติสรุป

สถิติสรุปทั่วไปมี 2 ประเภท:

  • การวัดแนวโน้มจากศูนย์กลาง : ตัวเลขเหล่านี้อธิบายว่าศูนย์กลางของชุดข้อมูลอยู่ที่ใด ตัวอย่างได้แก่ ค่าเฉลี่ย และ ค่ามัธยฐาน
  • มาตรการการกระจาย : ตัวเลขเหล่านี้อธิบายการกระจายของค่าในชุดข้อมูล ตัวอย่าง ได้แก่ ช่วง ช่วงระหว่างควอไทล์ ค่าเบี่ยงเบนมาตรฐาน และ ความแปรปรวน

2. การแจกแจงความถี่

อีกวิธีหนึ่งในการวิเคราะห์แบบไม่แปรผันคือการสร้าง การแจกแจงความถี่ ซึ่งอธิบายว่าค่าต่างๆ ปรากฏในชุดข้อมูลบ่อยแค่ไหน

3. กราฟิก

อีกวิธีหนึ่งในการวิเคราะห์ตัวแปรเดียวคือการสร้างกราฟเพื่อแสดงภาพการกระจายค่าของตัวแปรบางตัว

ตัวอย่างทั่วไป ได้แก่:

  • บ็อกซ์พล็อต
  • ฮิสโตแกรม
  • เส้นโค้งความหนาแน่น
  • กาเมมเบอร์ต

ตัวอย่างต่อไปนี้แสดงวิธีการวิเคราะห์ตัวแปรเดียวแต่ละประเภทโดยใช้ตัวแปร ขนาดครัวเรือน จากชุดข้อมูลที่กล่าวถึงก่อนหน้านี้:

ตัวอย่างการวิเคราะห์แบบไม่แปรผัน

สถิติสรุป

เราสามารถคำนวณการวัดแนวโน้มส่วนกลางของขนาดครัวเรือนได้ดังต่อไปนี้:

  • เฉลี่ย(ค่าเฉลี่ย): 3.8
  • มัธยฐาน (ค่าเฉลี่ย): 4

ค่านิยมเหล่านี้ทำให้เราทราบว่าค่า “ศูนย์กลาง” อยู่ที่ใด

นอกจากนี้เรายังสามารถคำนวณมาตรการการกระจายต่อไปนี้:

  • ช่วง (ความแตกต่างระหว่างสูงสุดและต่ำสุด): 6
  • สเกลระหว่างควอไทล์ (การกระจายค่าตรงกลาง 50%): 2.5
  • ส่วนเบี่ยงเบนมาตรฐาน (การวัดสเปรดโดยเฉลี่ย): 1.87

ค่าเหล่านี้ทำให้เรามีแนวคิดในการแจกแจงค่าของตัวแปรนี้

การกระจายความถี่

นอกจากนี้เรายังสามารถสร้างตารางการแจกแจงความถี่ต่อไปนี้เพื่อสรุปว่าค่าต่างๆ เกิดขึ้นบ่อยแค่ไหน:

สิ่งนี้ช่วยให้เราเห็นได้อย่างรวดเร็วว่าขนาดครัวเรือนที่พบบ่อยที่สุดคือ 4 คน

แหล่งข้อมูล: คุณสามารถใช้ เครื่องคำนวณความถี่ นี้เพื่อสร้างการแจกแจงความถี่สำหรับตัวแปรใดๆ โดยอัตโนมัติ

กราฟิก

เราสามารถสร้างกราฟต่อไปนี้เพื่อช่วยให้เราเห็นภาพการกระจายค่าตามขนาดครัวเรือน:

1. บ็อกซ์พล็อต

Boxplot คือกราฟที่แสดงข้อมูลสรุปห้าหลักของชุดข้อมูล

สรุปตัวเลขห้าตัวประกอบด้วย:

  • ค่าต่ำสุด
  • ควอไทล์แรก
  • ค่ามัธยฐาน
  • ควอร์ไทล์ที่สาม
  • ค่าสูงสุด

Boxplot สำหรับตัวแปรขนาดครัวเรือนจะมีลักษณะดังนี้:

แหล่งข้อมูล: คุณสามารถใช้ ตัวสร้าง boxplot นี้เพื่อสร้าง boxplot สำหรับตัวแปรใดก็ได้โดยอัตโนมัติ

2. ฮิสโตแกรม

ฮิสโตแกรมเป็นแผนภูมิประเภทหนึ่งที่ใช้แถบแนวตั้งเพื่อแสดงความถี่ แผนภูมิประเภทนี้เป็นวิธีที่มีประโยชน์ในการแสดงภาพการกระจายค่าในชุดข้อมูล

ฮิสโตแกรมจะมีลักษณะเช่นนี้สำหรับตัวแปรขนาดครัวเรือน:

3. เส้นโค้งความหนาแน่น

เส้นโค้งความหนาแน่น คือเส้นโค้งบนกราฟที่แสดงการกระจายของค่าในชุดข้อมูล

มีประโยชน์อย่างยิ่งสำหรับการแสดงภาพ “รูปร่าง” ของการแจกแจง รวมถึงการแจกแจงว่ามี “ยอด” ของค่าที่พบบ่อยตั้งแต่หนึ่งค่าขึ้นไปหรือ ไม่ และ การกระจายนั้นเอียงไปทางซ้ายหรือขวาหรือไม่

เส้นโค้งความหนาแน่นสำหรับตัวแปรขนาดครัวเรือนจะมีลักษณะดังนี้:

4. แผนภูมิวงกลม

แผนภูมิวงกลมเป็นแผนภูมิรูปวงกลมประเภทหนึ่งและใช้ส่วนต่างๆ เพื่อแสดงสัดส่วนของทั้งหมด

แผนภูมิวงกลมสำหรับตัวแปรขนาดครัวเรือนจะมีลักษณะดังนี้:

ขึ้นอยู่กับชนิดของข้อมูล แผนภูมิใดแผนภูมิหนึ่งอาจมีประโยชน์มากกว่าแผนภูมิอื่นๆ ในการแสดงภาพการกระจายของค่า

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *