วิธีการคำนวณตัวอย่างและความแปรปรวนของประชากรใน r

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 27, 2023 แนะนำ 0 ความคิดเห็น

ความแปรปรวน เป็นวิธีการวัดว่าค่าข้อมูลมีการกระจายรอบค่าเฉลี่ยได้ดีเพียงใด

สูตรการหาความแปรปรวนของ ประชากร คือ:

σ ² = Σ (x _i – μ) ² / N

โดยที่ μ คือค่าเฉลี่ยประชากร x _i คือองค์ประกอบ ^{ที่ i} ของประชากร N คือขนาดประชากร และ Σ เป็นเพียงสัญลักษณ์แฟนซีที่หมายถึง “ผลรวม”

สูตรการหาความแปรปรวนของ กลุ่มตัวอย่าง คือ:

s ² = Σ (x _i – x ) ² / (n-1)

โดยที่ x คือค่าเฉลี่ยตัวอย่าง x _i คือองค์ประกอบ ^{ตัวอย่าง} ที่ i และ n คือขนาดตัวอย่าง

ตัวอย่าง: คำนวณตัวอย่างและความแปรปรวนของประชากรในหน่วย R

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน R:

 #define dataset
data <- c(2, 4, 4, 7, 8, 12, 14, 15, 19, 22)

เราสามารถคำนวณ ความแปรปรวนตัวอย่าง ได้โดยใช้ฟังก์ชัน var() ใน R:

 #calculate sample variance
var(data)

[1] 46.01111

และเราสามารถคำนวณ ความแปรปรวนของประชากร ได้โดยการคูณความแปรปรวนตัวอย่างด้วย (n-1)/n ดังนี้

 #determine length of data
n <- length (data)

#calculate population variance
var(data) * (n-1)/n

[1] 41.41

โปรดทราบว่าความแปรปรวนของประชากรจะน้อยกว่าความแปรปรวนตัวอย่างเสมอ

ในทางปฏิบัติ เรามักจะคำนวณความแปรปรวนตัวอย่างสำหรับชุดข้อมูล เนื่องจากเป็นเรื่องผิดปกติที่จะรวบรวมข้อมูลสำหรับประชากรทั้งหมด

ตัวอย่าง: คำนวณความแปรปรวนของตัวอย่างจากหลายคอลัมน์

สมมติว่าเรามี data frame ต่อไปนี้ใน R:

 #create data frame
data <- data.frame(a=c(1, 3, 4, 4, 6, 7, 8, 12),
                   b=c(2, 4, 4, 5, 5, 6, 7, 16),
                   c=c(6, 6, 7, 8, 8, 9, 9, 12))

#view data frame
data

   ABC
1 1 2 6
2 3 4 6
3 4 4 7
4 4 5 8
5 6 5 8
6 7 6 9
7 8 7 9
8 12 16 12

เราสามารถใช้ฟังก์ชัน sapply() เพื่อคำนวณความแปรปรวนตัวอย่างของแต่ละคอลัมน์ในกรอบข้อมูล:

 #find sample variance of each column
sapply(data, var)

        ABC
11.696429 18.125000 3.839286

และเราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐานตัวอย่างของแต่ละคอลัมน์ ซึ่งก็คือรากที่สองของความแปรปรวนตัวอย่าง:

 #find sample standard deviation of each column
sapply(data, sd)

       ABC
3.420004 4.257347 1.959410

คุณสามารถค้นหาบทช่วยสอน R เพิ่มเติมได้ ที่นี่

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม

ตัวอย่าง: คำนวณตัวอย่างและความแปรปรวนของประชากรในหน่วย R

ตัวอย่าง: คำนวณความแปรปรวนของตัวอย่างจากหลายคอลัมน์

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

เพิ่มความคิดเห็น