R에서 부트스트랩 표준 오류를 계산하는 방법
부트스트래핑은 평균의 표준 오차를 추정하는 데 사용할 수 있는 방법입니다.
부트스트랩 표준 오류를 계산하는 기본 프로세스는 다음과 같습니다.
- 주어진 데이터 세트에서 k개의 반복 샘플을 복원하여 추출합니다.
- 각 표본에 대해 표준 오차를 계산합니다. s/ √n
- 이로 인해 표준 오차에 대한 k 개의 서로 다른 추정치가 생성됩니다. 부트스트랩 표준 오류를 찾으려면 k 표준 오류의 평균을 구하십시오.
다음 예에서는 R에서 부트스트랩 표준 오류를 계산하는 데 사용할 수 있는 두 가지 방법을 설명합니다.
방법 1: 스타터 패키지 사용
R에서 부팅 표준 오류를 계산하는 한 가지 방법은 부팅 라이브러리의 boot() 함수를 사용하는 것입니다.
다음 코드는 R에서 주어진 데이터 세트에 대한 부트스트랩 표준 오류를 계산하는 방법을 보여줍니다.
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) #define function to calculate mean meanFunc <- function (x,i){mean(x[i])} #calculate standard error using 100 bootstrapped samples boot(x, meanFunc, 100) Bootstrap Statistics: original bias std. error t1* 21.5 0.254 2.379263
21.5 의 “원래” 값은 원래 데이터세트의 평균을 나타냅니다. “표준. 2.379263 값은 평균의 부트스트랩 표준 오차를 나타냅니다.
이 예에서는 평균의 표준 오차를 추정하기 위해 100개의 부트스트랩 샘플을 사용했지만 1,000, 10,000개 또는 원하는 만큼의 부트스트랩 샘플을 사용할 수도 있었습니다.
방법 2: 나만의 공식 작성
부트스트랩 표준 오류를 계산하는 또 다른 방법은 자체 함수를 작성하는 것입니다.
다음 코드는 이를 수행하는 방법을 보여줍니다.
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x)))) [1] 2.497414
부트스트랩된 표준 오류는 2.497414 입니다.
이 표준 오차는 이전 예에서 계산된 것과 매우 유사합니다.