R에서 평균의 표준 오차를 계산하는 방법
평균의 표준 오차는 데이터 세트의 값 분포를 측정하는 방법입니다. 다음과 같이 계산됩니다.
표준 오차 = s / √n
금:
- s : 표본 표준편차
- n : 표본 크기
이 튜토리얼에서는 R에서 데이터 세트의 표준 오류를 계산하는 데 사용할 수 있는 두 가지 방법을 설명합니다.
방법 1: Plotrix 라이브러리 사용
평균의 표준 오차를 계산하는 첫 번째 방법은 Plotrix 라이브러리에 내장된 std.error() 함수를 사용하는 것입니다.
다음 코드는 이 함수를 사용하는 방법을 보여줍니다.
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
평균의 표준오차는 2.001447 로 나타난다.
방법 2: 자신만의 함수 정의
데이터 세트 평균의 표준 오차를 계산하는 또 다른 방법은 단순히 자신만의 함수를 정의하는 것입니다.
다음 코드는 이를 수행하는 방법을 보여줍니다.
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
이번에도 평균의 표준오차는 2.0014 입니다.
평균의 표준오차를 해석하는 방법
평균의 표준 오차는 단순히 평균 주위의 값 분포를 측정한 것입니다.
평균의 표준오차를 해석할 때 염두에 두어야 할 두 가지 사항이 있습니다.
1. 평균의 표준 오차가 클수록 데이터 세트의 평균 주위에 값이 더 많이 흩어져 있습니다.
이를 설명하기 위해 이전 데이터세트의 마지막 값을 훨씬 더 큰 숫자로 변경하는 경우를 고려해보세요.
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
표준 오류가 2.001447 에서 6.978265 로 어떻게 증가하는지 확인하세요.
이는 이 데이터세트의 값이 이전 데이터세트에 비해 평균을 중심으로 더 많이 분포되어 있음을 나타냅니다.
2. 표본크기가 커질수록 평균의 표준오차는 감소하는 경향을 보인다.
이를 설명하기 위해 다음 두 데이터 세트에 대한 평균의 표준 오차를 고려하십시오.
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
두 번째 데이터 세트는 단순히 두 번 반복된 첫 번째 데이터 세트입니다.
따라서 두 데이터 세트 모두 평균은 동일하지만 두 번째 데이터 세트의 표본 크기가 더 크므로 표준 오차가 더 작습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 표본 및 모집단 분산을 계산하는 방법
R에서 합동 분산을 계산하는 방법
R의 변동 계수를 계산하는 방법