R에서 부트스트랩 표준 오류를 계산하는 방법


부트스트래핑은 평균의 표준 오차를 추정하는 데 사용할 수 있는 방법입니다.

부트스트랩 표준 오류를 계산하는 기본 프로세스는 다음과 같습니다.

  • 주어진 데이터 세트에서 k개의 반복 샘플을 복원하여 추출합니다.
  • 각 표본에 대해 표준 오차를 계산합니다. s/ √n
  • 이로 인해 표준 오차에 대한 k 개의 서로 다른 추정치가 생성됩니다. 부트스트랩 표준 오류를 찾으려면 k 표준 오류의 평균을 구하십시오.

다음 예에서는 R에서 부트스트랩 표준 오류를 계산하는 데 사용할 수 있는 두 가지 방법을 설명합니다.

방법 1: 스타터 패키지 사용

R에서 부팅 표준 오류를 계산하는 한 가지 방법은 부팅 라이브러리의 boot() 함수를 사용하는 것입니다.

다음 코드는 R에서 주어진 데이터 세트에 대한 부트스트랩 표준 오류를 계산하는 방법을 보여줍니다.

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function (x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics:
    original bias std. error
t1* 21.5 0.254 2.379263

21.5 의 “원래” 값은 원래 데이터세트의 평균을 나타냅니다. “표준. 2.379263 값은 평균의 부트스트랩 표준 오차를 나타냅니다.

이 예에서는 평균의 표준 오차를 추정하기 위해 100개의 부트스트랩 샘플을 사용했지만 1,000, 10,000개 또는 원하는 만큼의 부트스트랩 샘플을 사용할 수도 있었습니다.

방법 2: 나만의 공식 작성

부트스트랩 표준 오류를 계산하는 또 다른 방법은 자체 함수를 작성하는 것입니다.

다음 코드는 이를 수행하는 방법을 보여줍니다.

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x))))

[1] 2.497414

부트스트랩된 표준 오류는 2.497414 입니다.

이 표준 오차는 이전 예에서 계산된 것과 매우 유사합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다