Jak obliczyć wariancję próby i populacji w r


Wariancja to sposób pomiaru rozkładu wartości danych wokół średniej.

Wzór na znalezienie wariancjipopulacji jest następujący:

σ 2 = Σ (x i – μ) 2 / N

gdzie μ to średnia populacji, x i to i- ty element populacji, N to wielkość populacji, a Σ to po prostu fantazyjny symbol oznaczający „sumę”.

Wzór na znalezienie wariancji próbki jest następujący:

s 2 = Σ (x jax ) 2 / (n-1)

gdzie x to średnia próbki, x i to i- ty element próbki, a n to wielkość próby.

Przykład: Oblicz wariancję próbki i populacji w R

Załóżmy, że mamy następujący zbiór danych w R:

 #define dataset
data <- c(2, 4, 4, 7, 8, 12, 14, 15, 19, 22)

Możemy obliczyć wariancję próbki za pomocą funkcji var() w R:

 #calculate sample variance
var(data)

[1] 46.01111

Możemy obliczyć wariancję populacji , po prostu mnożąc wariancję próbki przez (n-1)/n w następujący sposób:

 #determine length of data
n <- length (data)

#calculate population variance
var(data) * (n-1)/n

[1] 41.41

Należy pamiętać, że wariancja populacji będzie zawsze mniejsza niż wariancja próbki.

W praktyce zwykle obliczamy wariancje próbek dla zestawów danych, ponieważ zbieranie danych dla całej populacji jest nietypowe.

Przykład: Oblicz wariancję próbki kilku kolumn

Załóżmy, że mamy następującą ramkę danych w R:

 #create data frame
data <- data.frame(a=c(1, 3, 4, 4, 6, 7, 8, 12),
                   b=c(2, 4, 4, 5, 5, 6, 7, 16),
                   c=c(6, 6, 7, 8, 8, 9, 9, 12))

#view data frame
data

   ABC
1 1 2 6
2 3 4 6
3 4 4 7
4 4 5 8
5 6 5 8
6 7 6 9
7 8 7 9
8 12 16 12

Możemy użyć funkcji sapply() do obliczenia wariancji próbki dla każdej kolumny w ramce danych:

 #find sample variance of each column
sapply(data, var)

        ABC
11.696429 18.125000 3.839286

Możemy użyć poniższego kodu do obliczenia odchylenia standardowego próbki w każdej kolumnie, będącego po prostu pierwiastkiem kwadratowym wariancji próbki:

 #find sample standard deviation of each column
sapply(data, sd)

       ABC
3.420004 4.257347 1.959410

Więcej samouczków dotyczących języka R można znaleźć tutaj .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *